Kielen tunnistaminen

Kielen tunnistaminen (eng. language identifikaatio ), luonnollisen kielen käsittelymenetelmässä  - kielen määrittely . Kielentunnistusongelma on tekstin luokittelun erikoistapaus ja se ratkaistaan ​​tilastollisilla menetelmillä .

Yleiskatsaus

Kielen tunnistamista varten PPRLM-arkkitehtuuri (parallel foneemien tunnistus + kielimalli) on toteutettu useilla kielillä koulutettujen foneettisten tunnistajien rinnakkaiskytkennällä. Foneettinen tunnistus perustuu piilotettuihin Markov-malleihin (HMM) Viterbi-algoritmia käyttäen .

Päätöksen tekemiseksi puheviestin kuulumisesta tiettyyn kohdekieleen toteutetaan lähestymistapa tukivektorikoneisiin (SVM - support vector machines) perustuvalla luokittimella.

Klassisen PPRLM:n pohjalta rakennetun järjestelmän toimintaperiaate on seuraava:

  1. järjestelmässä on useita foneettisia tunnistimia;
  2. Foneettiset tunnistimet tunnistavat jokaisen tuloäänitiedoston;
  3. kunkin foneettisen tunnistimen tuloksena olevan foneemisekvenssin mukaisesti lasketaan tietyn kohdekielen n-gramm-mallin läheisyysmitat;
  4. kieli, jolla on n-grammin mallin suurin läheisyysmitta, katsotaan voittajaksi .

Edistyneissä PPRLM-järjestelmissä kielentunnistus toteutetaan avoimena tehtävänä: kohdekielelle suoritetaan käsitellyn tiedoston "kuuluu" / "ei kuulu" -tarkistus, jonka jälkeen päätös tehdään automaattisesti ottaen huomioon ohjelman asettama kynnys. käyttäjä.

Seuraavat vaiheet lisätään perusalgoritmiin:

  1. tuloksena saatu kunkin foneettisen tunnistimen foneemisekvenssi asetetaan päällekkäin yhden tai toisen "viitekielen" n-grammin mallin kanssa ja otetaan huomioon n-grammin mallin läheisyyden mittaa foneemisekvenssiin ;
  2. n-gramm- mallien ja foneemisekvenssien läheisyyden mittausten täysi joukko on SVM- luokittimen syöttövektori ;
  3. Luokittelutuloksen perusteella SVM-luokittaja tekee päätöksen kohdekieleen kuulumisesta vertaamalla kullekin kohdekielelle asetettuun kynnykseen erikseen.

Äänitiedosto puhutaan kohdekielellä, jos SVM-luokittajan antama pistemäärä on suurempi kuin kynnys. Tässä tapauksessa äänitiedosto voidaan määrittää yhdelle tai useammalle kielelle samanaikaisesti tai sitä ei ole kohdistettu millekään niistä.

Katso myös

Kirjallisuus

Linkit

Kirjastot

Verkkopalvelut