Puheosan merkintä (automaattinen morfologinen merkintä, POS-merkintä, puheosan merkintä) on automaattisen tekstinkäsittelyn vaihe , jonka tehtävänä on määrittää puheen osa ja sanojen kieliopilliset ominaisuudet tekstissä (korpus). ) ja niille on määritetty asianmukaiset tunnisteet. POS-koodaus on yksi tietokonetekstianalyysin ensimmäisistä vaiheista.
POS-koodausalgoritmit jaetaan kahteen ryhmään: sääntöpohjaisiin ja probabilistisiin.
Piilotettuja Markovin malleja voidaan käyttää .
luonnollisen kielen käsittely | |
---|---|
Yleiset määritelmät | |
Tekstianalyysi |
|
Viittaus |
|
Konekäännös |
|
Tunnistaminen ja tiedonkeruu | |
Temaattinen malli | |
Vertaisarviointi |
|
Luonnollisen kielen käyttöliittymä |