Lemma (lingvistika)
Lemma je slovo, které stojí na začátku definice ve slovníku. Všechna slova v záhlaví slovníku jsou lemmata. Technicky vzato je to "základní slovo a jeho skloňování".
Lemma je slovo, které najdete ve slovníku. Lexém
je významová jednotka a může jít o více slov. Lexém je množina všech forem, které mají stejný význam, zatímco lemma označuje konkrétní formu, která je podle konvence vybrána pro reprezentaci lexému.
Například v angličtině jsou run, runs a running tvary téhož lexému, ale run je lemma.
Morfologie
V angličtině je lemma podstatného jména v jednotném čísle: např. mouse místo mice. V jazycích s rodem je hlavním slovem pravidelných přídavných jmen a podstatných jmen obvykle mužský rod jednotný. Pokud má jazyk také pády, je lemma často nominativ mužského rodu jednotného čísla.
V mnoha jazycích je citoslovcem slovesa infinitiv: Francouzština aller, němčina gehen, španělština ir. V angličtině se obvykle jedná o plný infinitiv (to go), i když v abecedě je bez "to" (go).
Rozdíl mezi kmenem a lemmatem
V počítačové lingvistice se kmenem rozumí část slova, která se nikdy nemění, i když se používají různé tvary slova. Lemma je základní tvar slovesa. Například od slova "produkovat" je lemma "produkovat", ale kmen je "produ-". Je to proto, že existují slova jako vyrábět. Když se vezme v úvahu zvuk (fonologie), není definice neměnné části slova tak užitečná. Všimněte si zvukové podoby slov v příkladu: "produkoval" /prəˈdjuːst/ versus "produkce" /prəˈdʌkʃən/.
Některé lexémy mají několik kmenů, ale jen jedno lemma. Například "jít" (lemma) má kmeny "go" a "went". Zde je základem minulého času jiné sloveso, "to wend". Přípona "-t" je ekvivalentní příponě "-ed".