Baum-Welsh-algoritmi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 17. lokakuuta 2019 tarkistetusta versiosta . tarkastukset vaativat 2 muokkausta .

Baum-Welsh-algoritmia käytetään tietojenkäsittelytieteessä ja tilastoissa piilotetun Markov-mallin (HMM) tuntemattomien parametrien löytämiseen . Se käyttää eteenpäin-taakse-algoritmia ja on yleisen EM-algoritmin erikoistapaus .

Baum-Welsh-algoritmi piilotetun Markov-mallin arvioimiseksi

Piilotettu Markovin malli  on satunnaismuuttujien joukon todennäköisyysmalli . Muuttujat  ovat tunnettuja diskreettejä havaintoja, ja  ne ovat "piilotettuja" diskreettejä suureita. Piilotetun Markov-mallin puitteissa on kaksi riippumatonta lausetta, jotka varmistavat tämän algoritmin konvergenssin:

  1. -th piilomuuttuja tunnetulla muuttujalla -th on riippumaton kaikista aikaisemmista muuttujista, eli ;
  2. Tunnettu havainto riippuu vain tilasta, eli ei riipu ajasta, .

Seuraavaksi ehdotetaan "oletusten ja maksimointien" algoritmia piilotetun Markov-mallin parametrien suurimman todennäköisyyden arvioimiseksi tietylle havaintojoukolle. Tämä algoritmi tunnetaan myös nimellä Baum-Welsh-algoritmi.

 on diskreetti satunnaismuuttuja, joka ottaa yhden arvoista . Oletetaan, että tämä Markovin malli, joka määritellään muodossa , on homogeeninen ajassa, eli riippumaton . Sitten se voidaan määritellä ajasta riippumattomana stokastisena siirtymämatriisina . Alkujakauma määrittää tilojen todennäköisyydet tietyllä hetkellä .

Oletetaan, että olemme tilassa tällä hetkellä, jos . Tilasarja ilmaistaan ​​muodossa , missä on tila tällä hetkellä .

Ajankohtaisella havainnolla voi olla yksi mahdollisista arvoista, . Tietyn havaintovektorin todennäköisyys tietyllä hetkellä tilalle määritellään seuraavasti: (  on matriisi päällä ). Havaintojen sarja ilmaistaan ​​muodossa .

Siksi voimme kuvata piilotettua Markov-mallia käyttämällä . Tietylle havaintovektorille Baum-Welsh-algoritmi löytää . maksimoi havaintojen todennäköisyyden .

Algoritmi

Alkutiedot: satunnaisilla alkuehdoilla.

Algoritmi päivittää parametria iteratiivisesti, kunnes se konvergoi yhdessä kohdassa.

Suora menettely

Merkitään tietyn sekvenssin esiintymistodennäköisyydellä tilalle hetkellä .

voidaan laskea rekursiivisesti:

Käänteinen menettely

Tämän menettelyn avulla voimme laskea äärellisen tietyn sekvenssin todennäköisyyden edellyttäen, että aloitimme alkutilasta ajankohtana .

Voidaan laskea :

Käyttämällä ja voit laskea seuraavat arvot:

Kun ja , voimme laskea mallin parametrien uudet arvot:

missä

suuntaa-antava funktio ja havaittavan arvojen odotettu määrä, joka on yhtä suuri kuin tilojen kokonaismäärä .

Käyttämällä uusia arvoja , ja iteraatiot jatkuvat konvergenssiin asti.

Katso myös

Lähteet