Lemma ( englanniksi lemma ) on sanan [1] alkumuotoinen sanakirjamuoto . Venäjällä substantiivien ja adjektiivien osalta tämä on yksikön nominatiivimuoto, verbeille ja verbimuodoille se on infinitiivimuoto. Korpuslingvistiikan peruskäsite ja automaattinen luonnollisen kielen käsittely . Tekstisanojen automaattista pelkistämistä lemmiksi kutsutaan lemmatisaatioksi .
Esimerkiksi lause " Varhain aamulla Milan äiti pesi kehyksen saippualla " lemmatoinnin jälkeen näyttää tältä: aamu, aikaisin, äiti, Mila, pesu, kehys, saippua .
Korpuslingvistiikassa lemmahaku antaa konteksteja, joissa mainitaan tietyn lekseemin kaikki sanamuodot . Esimerkiksi haku lemma cat palauttaa konteksteja, jotka sisältävät kissa, kissa, kissa, kissat, kissat jne. Tämäntyyppinen haku on toisin kuin sanamuotohaku : tässä tapauksessa haku sanamuodolla cat palauttaa konteksteja, jotka sisältävät täsmälleen tämä datiivitapauksen yksikköluvun kielioppimuoto [2] .