Microsoft Speech API

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 3. joulukuuta 2014 tarkistetusta versiosta . tarkastukset vaativat 6 muokkausta .

Speech Application Programming Interface (SAPI) on COM - pohjainen sovellusohjelmointirajapinta puheentunnistukseen ja -synteesiin.

Puheentunnistus

Puheentunnistus on prosessi, jossa puhutut sanat muunnetaan painetuksi tekstiksi. Puheentunnistus sisältää:

Tunnistaja (tekstintunnistusmoottori) vertaa tunnistettua tekstiä iteratiivisesti sovelluksen kielioppisääntöihin ja, jos teksti vastaa sääntösarjaa, luo XML - tulostevirran käyttämällä Semantic Markup Language (SML) -kieltä .  Tulosvirta sisältää tunnistetun tekstin, oikeat tunnistustodennäköisyydet ja voi sisältää semanttisia arvoja, jotka on määritetty semantiikan tulkintamerkinnällä . Tunnistettua tekstiä käytetään yleisesti tietojen syöttämiseen sanelulla ja sovellusten ohjaamiseen puhekomennoilla.

Kielioppisääntöjen koko rajoittaa tekstintunnistusta. Useimmat sanelua tukevat ohjelmat on viritetty tietyn käyttäjän puhemalleihin tarkimman tunnistuksen varmistamiseksi. Puhekomentoohjaustila on helpompi toteuttaa, koska kielioppisääntöjen sisältö on rajoitettu käytettävissä oleviin komentoihin [1] .

Puhesynteesi

Puhesynteesi on prosessi, jossa teksti muunnetaan puhutuiksi sanoiksi. Puhesynteesi sisältää:

Tekstistä puheeksi -koneet voivat käyttää yhtä kahdesta puhesynteesimenetelmästä:

Muistiinpanot

  1. Tomashenko N. A., Khokhlov Yu. Yu.// TUTKIMUS AUTOMAATTISTEN PUHETUNNISTUSJÄRJESTELMIEN AKUSTISTEN MALLIEN RAKENNUKSEN TIETATASAPÄÄTÖN ONGELMASTA . Arkistokopio päivätty 19. syyskuuta 2015 Wayback Machinessa . - Artikkeli. - Instrumentointi. - UDC 004.934

Linkit

Esittelyssä Computer Speech Technology  (englanniksi)  (linkki ei saatavilla) . MSDN-kirjasto . Microsoft (2012). Haettu 24. heinäkuuta 2012. Arkistoitu alkuperäisestä 29. syyskuuta 2012.