Lemma (kielitiede)

Lemma ( englanniksi  lemma ) on sanan [1] alkumuotoinen sanakirjamuoto . Venäjällä substantiivien ja adjektiivien osalta tämä on yksikön nominatiivimuoto, verbeille ja verbimuodoille se on infinitiivimuoto. Korpuslingvistiikan peruskäsite ja automaattinen luonnollisen kielen käsittely . Tekstisanojen automaattista pelkistämistä lemmiksi kutsutaan lemmatisaatioksi .

Esimerkiksi lause " Varhain aamulla Milan äiti pesi kehyksen saippualla " lemmatoinnin jälkeen näyttää tältä: aamu, aikaisin, äiti, Mila, pesu, kehys, saippua .

Lemma korpuslingvistiikassa

Korpuslingvistiikassa lemmahaku antaa konteksteja, joissa mainitaan tietyn lekseemin kaikki sanamuodot . Esimerkiksi haku lemma cat palauttaa konteksteja, jotka sisältävät kissa, kissa, kissa, kissat, kissat jne. Tämäntyyppinen haku on toisin kuin sanamuotohaku : tässä tapauksessa haku sanamuodolla cat palauttaa konteksteja, jotka sisältävät täsmälleen tämä datiivitapauksen yksikköluvun kielioppimuoto [2] .

Lemma tiedonhaussa ja hakukoneoptimoinnissa

Muistiinpanot

  1. Bolshakova E. I., Vorontsov K. V., Efremova N. E., Klyshinsky E. S., Lukashevich N. V., Sapin A. S. Automaattinen luonnollisen kielen tekstinkäsittely ja tietojen analysointi: oppikirja. korvaus . - M. : NRU HSE, 2017. Arkistoitu kopio 21. tammikuuta 2022 Wayback Machinessa
  2. Lemma hakukuvaus  (englanniksi)  ? . luonnosmoottori . Haettu 31. maaliskuuta 2021. Arkistoitu alkuperäisestä 3. maaliskuuta 2021.
  3. Lemmatisaatio SEO:ssa  (venäjäksi)  ? .

Kirjallisuus