Puhekorpus ( äänikorpus ) on tietokanta äänitiedostoista ja tekstien transkriptioista, eräänlainen tekstikorpus . Puhetekniikoissa puhekorpuksia käytetään muun muassa akustisten mallien luomiseen (joita voidaan sitten käyttää puheentunnistuskoneissa ). Kielitieteessä puhekorpuksia käytetään fonetiikan , dialektologian , keskusteluanalyysin ja muiden alojen tutkimukseen.
Puhekorpuja on kahdenlaisia:
1. Hyvin luettujen tekstien perusteet, mukaan lukien:
2. Spontaanien puheen äänitallenteiden pohjat - mukaan lukien:
Erityinen puhekorpora on tietokanta muiden kuin äidinkielenään puhuvien ihmisten puhumista teksteistä, jotka puhetta vieraalla aksentilla .
luonnollisen kielen käsittely | |
---|---|
Yleiset määritelmät | |
Tekstianalyysi |
|
Viittaus |
|
Konekäännös |
|
Tunnistaminen ja tiedonkeruu | |
Temaattinen malli | |
Vertaisarviointi |
|
Luonnollisen kielen käyttöliittymä |