Lemma (morfologie) - Lemma (morphology)

V morfologii a lexikografie , je lemma (množný lemmata nebo lemmata ) je kanonická forma , forma slovníku , nebo citace forma sady slov ( hlavního slova ). V angličtině , například, zlomu , přestávky , porušil , člení a lámání jsou formy stejného lexeme , s přestávkou jako lemma, kterým jsou indexovány. Lexém v tomto kontextu odkazuje na množinu všech forem, které mají stejný význam, a lemma na konkrétní formu, která je konvencí zvolena, aby reprezentovala lexém. Lemmy mají zvláštní význam ve vysoce skloňovaných jazycích, jako je arabština , turečtina a ruština . Proces určování lemmatu pro dané slovo se nazývá lemmatizace . Lemma lze považovat za hlavní z hlavních částí , i když lemmatizace je alespoň částečně libovolná.

Morfologie

Forma slova, které je zvoleno tak, aby sloužilo jako lemma, je obvykle nejméně označenou formou, ale existuje několik výjimek, jako například pro několik jazyků použití infinitivu pro slovesa.

V angličtině je citační forma podstatného jména v jednotném čísle : myš spíše než myši . U víceslovných lexémů, která obsahují přivlastňovací adjektiva nebo zvratná zájmena , používá citační forma formu neurčitého zájmena jedna : udělejte to nejlepší , křivopřísež . V evropských jazycích s gramatickým rodem je citační forma pravidelných přídavných jmen a podstatných jmen obvykle mužský singulární. Pokud má jazyk také případy , citační forma je často mužský singulární nominativ.

Pro mnoho jazyků, citace forma slovesa je infinitiv : French aller , německý gehen , hindustánská जाना / جانا , španělský ir . V angličtině se to obvykle shoduje s nezkloněným, nejméně označeným tvarem slovesa (tj. „Zlom“, nikoli „zlom“ nebo „lámání“), ale u některých vadných sloves se používá přítomný čas ( musí , může a musí mít pouze jeden formulář). Pro latinu , starověkou řečtinu , moderní řečtinu a bulharštinu se však tradičně používá první osoba v jednotném čísle přítomného času , ale některé moderní slovníky místo toho používají infinitiv. (V bulharštině chyběly infinitivy. U smluvených sloves ve starověké řečtině se k odhalení smluvní samohlásky používá nezmluvená první osoba v singulárním přítomném čase: φιλέω philéō pro φιλῶ philō „I love“ [implikující náklonnost]; ἀγαπάω agapáō pro ἀγαπῶ agapō „miluji“ [což znamená]). Finské slovníky uvádějí slovesa nikoli pod kořenem, ale pod prvním infinitivem označeným -(t) a , -(t) ä .

U Japonců se používá čas minulý (současný a budoucí). Pro arabštinu , která nemá žádné infinitivy, je třetí osoba singulárního maskulina minulého času nejméně označenou formou a používá se pro záznamy v moderních slovnících. Ve starších slovnících, které se stále běžně používají, se používá triliterál slova, buď sloveso nebo podstatné jméno. Je to podobné jako v hebrejštině , která také používá třetí osobu v singulárním mužském mužském minulém (dokonalém) tvaru, např. ברא bara ' create, כפר kaphar deny. Gruzínština používá slovesné podstatné jméno . U korejštiny je -da připojena ke stonku.

V tamilštině , aglutinačním jazyce , se často uvádí slovesný kmen, např. இரு

V irštině jsou slova velmi skloňována podle velikosti písmen (genitiv, nominativ, dativ a vokativ) a podle místa ve větě kvůli počátečním mutacím . Podstatné jméno cainteoir , lemma pro podstatné jméno znamenající „mluvčí“, má různé podoby: chainteoir , gcainteoir , cainteora , chainteora , cainteoirí , chainteoirí a gcainteoirí .

Některé fráze jsou citovány v jakémsi lemmatu: Carthago delenda est (doslovně „Kartágo musí být zničeno“) je běžný způsob, jak citovat Cata , ale to, co řekl, bylo blíže censeo Carthaginem esse delendam („ Držím Kartágo být v potřeba zničení “).

Lexikografie

Ve slovníku lemma „jít“ představuje skloňované tvary „jít“, „jde“, „jde“, „šel“ a „odešel“. Vztah mezi skloňovanou formou a jejím lemmatem je obvykle označen úhlovou závorkou, např. „Šel“ <„jde“. Nevýhodou těchto zjednodušení je samozřejmě neschopnost vyhledat odmítnutou nebo konjugovanou podobu slova, ale některé slovníky, jako Websterův slovník , seznam „šly“. Vícejazyčné slovníky se liší v tom, jak se s tímto problémem vypořádávají: německý slovník Langenscheidt neuvádí ging (< gehen ), ale Cassell ano.

Lemmy nebo slovní kmeny se často používají v korpusové lingvistice k určování četnosti slov. V tomto použití je konkrétní definice „lemma“ flexibilní v závislosti na úkolu, pro který se používá.

Výslovnost

Slovo může mít různé výslovnosti v závislosti na jeho fonetickém prostředí (sousední zvuky) nebo na stupni stresu ve větě. Příkladem toho druhého jsou slabé a silné formy určitých anglických funkčních slov jako některá a ale (vyslovováno / sʌm / , / bʌt / při stresu, ale / s (ə) m / , / bət / při nepřízvuku). Slovníky obvykle uvádějí výslovnost používanou, když je slovo vyslovováno samostatně (jeho izolovaná forma ) a se stresem, ale mohou si také všimnout běžných slabých forem výslovnosti.

Rozdíl mezi kmenem a lemmatem

Stopka je část slova, která se nikdy nemění, i když morfologicky ohýbána; lemma je základní forma slova. Například z „vyrobeného“ je lemma „produkovat“, ale stonek je „produc-“. Důvodem je, že existují slova, jako je produkce . a produkující V lingvistické analýze je kmen obecněji definován jako analyzovaná základní forma, ze které lze vytvořit všechny skloňované formy. Při fonologie se bere v úvahu, že definice neměnnou část slova není užitečné, jak je možné vidět v fonologických forem slov v předchozím příkladu: „vyrobených“ / p r ə dj U s t / vs. . "výrobu" / p r ə d ʌ k ʃ ən / .

Některé lexémy mají několik stonků, ale jedno lemma. Například sloveso „ jít “ má stonky „jít“ a „šel“ kvůli doplnění : minulý čas byl kooptován z jiného slovesa „ kouzlit “.

Viz také

Reference

externí odkazy