Baum-Welsh-algoritmia käytetään tietojenkäsittelytieteessä ja tilastoissa piilotetun Markov-mallin (HMM) tuntemattomien parametrien löytämiseen . Se käyttää eteenpäin-taakse-algoritmia ja on yleisen EM-algoritmin erikoistapaus .
Piilotettu Markovin malli on satunnaismuuttujien joukon todennäköisyysmalli . Muuttujat ovat tunnettuja diskreettejä havaintoja, ja ne ovat "piilotettuja" diskreettejä suureita. Piilotetun Markov-mallin puitteissa on kaksi riippumatonta lausetta, jotka varmistavat tämän algoritmin konvergenssin:
Seuraavaksi ehdotetaan "oletusten ja maksimointien" algoritmia piilotetun Markov-mallin parametrien suurimman todennäköisyyden arvioimiseksi tietylle havaintojoukolle. Tämä algoritmi tunnetaan myös nimellä Baum-Welsh-algoritmi.
on diskreetti satunnaismuuttuja, joka ottaa yhden arvoista . Oletetaan, että tämä Markovin malli, joka määritellään muodossa , on homogeeninen ajassa, eli riippumaton . Sitten se voidaan määritellä ajasta riippumattomana stokastisena siirtymämatriisina . Alkujakauma määrittää tilojen todennäköisyydet tietyllä hetkellä .
Oletetaan, että olemme tilassa tällä hetkellä, jos . Tilasarja ilmaistaan muodossa , missä on tila tällä hetkellä .
Ajankohtaisella havainnolla voi olla yksi mahdollisista arvoista, . Tietyn havaintovektorin todennäköisyys tietyllä hetkellä tilalle määritellään seuraavasti: ( on matriisi päällä ). Havaintojen sarja ilmaistaan muodossa .
Siksi voimme kuvata piilotettua Markov-mallia käyttämällä . Tietylle havaintovektorille Baum-Welsh-algoritmi löytää . maksimoi havaintojen todennäköisyyden .
Alkutiedot: satunnaisilla alkuehdoilla.
Algoritmi päivittää parametria iteratiivisesti, kunnes se konvergoi yhdessä kohdassa.
Merkitään tietyn sekvenssin esiintymistodennäköisyydellä tilalle hetkellä .
voidaan laskea rekursiivisesti:
Tämän menettelyn avulla voimme laskea äärellisen tietyn sekvenssin todennäköisyyden edellyttäen, että aloitimme alkutilasta ajankohtana .
Voidaan laskea :
Käyttämällä ja voit laskea seuraavat arvot:
Kun ja , voimme laskea mallin parametrien uudet arvot:
missä
suuntaa-antava funktio ja havaittavan arvojen odotettu määrä, joka on yhtä suuri kuin tilojen kokonaismäärä .
Käyttämällä uusia arvoja , ja iteraatiot jatkuvat konvergenssiin asti.