Bayesin tilasto on tilastotieteen teoria, joka perustuu todennäköisyyden Bayesin tulkintaan , jossa todennäköisyys heijastaa tapahtuman luotettavuuden astetta , joka voi muuttua uutta tietoa kerättäessä, toisin kuin taajuuslähestymistapaan perustuva kiinteä arvo. [1] . Luottamusaste voi perustua ennakkotietoon tapahtumasta, kuten aikaisempien kokeiden tuloksiin tai henkilökohtaiseen luottamukseen tapahtumaa kohtaan. Tämä eroaa useista muista todennäköisyystulkinnoista , kuten frekvenssitulkinnasta , joka pitää todennäköisyyttä rajana useiden kokeiden jälkeen tapahtuvan tapahtuman suhteelliselle esiintymistiheydelle [2] .
Bayesin tilastolliset menetelmät käyttävät Bayesin lausetta todennäköisyyksien laskemiseen ja päivittämiseen, kun uutta dataa saadaan. Bayesin lause kuvaa tapahtuman ehdollista todennäköisyyttä , joka perustuu sekä dataan että ennakkotietoon, tai luottamusta tapahtumaan tai tapahtumaan liittyviin olosuhteisiin. Esimerkiksi Bayesin päättelyssä Bayesin lausetta voidaan käyttää todennäköisyysjakauman tai tilastollisen mallin parametrin estimoimiseen . Koska Bayesin tilastot käsittelevät todennäköisyyttä luottamusasteena, Bayesin lause voi määrittää suoraan todennäköisyysjakauman, joka kvantifioi parametrin tai parametrijoukon [2] .
Bayesin tilastot on nimetty Thomas Bayesin mukaan, joka muotoili erikoistapauksen Bayesin lauseesta vuonna 1763 julkaistussa artikkelissaan . Pierre-Simon Laplace kehitti useissa 1700-luvun lopulta 1800-luvun alkuun julkaistuissa julkaisuissa Bayesin todennäköisyyden tulkinnan. . Laplace käytti nykyään Bayesilaiseksi katsottuja menetelmiä useiden tilastollisten ongelmien ratkaisemiseen. Myöhemmät kirjoittajat kehittivät monia Bayesin menetelmiä, mutta termiä käytettiin kuvaamaan tällaisia menetelmiä vasta 1950-luvulla. Suurimman osan 1900-luvusta Bayesin menetelmät eivät olleet toivottuja useimmille tilastotieteilijöille filosofisista ja käytännön syistä. Monet Bayesin menetelmät ovat laskennallisesti intensiivisiä ja useimmat yli vuosisadan ajan käytetyt menetelmät ovat perustuneet taajuustulkintaan. Kuitenkin tehokkaiden tietokoneiden ja uusien algoritmien , kuten Monte Carlo -menetelmän Markovin ketjuille tulon myötä, Bayesin menetelmiä aletaan käyttää yhä voimakkaammin 2000-luvun tultua [2] [3] .
Bayesin lause on peruslause Bayesin tilastoissa, koska Bayesin menetelmät käyttävät sitä päivittämään todennäköisyyksiä, jotka ovat luottamusasteita, kun uutta dataa vastaanotetaan. Kun on annettu kaksi tapahtumaa ja , ehdollinen todennäköisyys , mikäli se on tosi, ilmaistaan kaavalla [4] :
missä . Vaikka Bayesin lause on todennäköisyysteorian perustavanlaatuinen tulos , sillä on erityinen tulkinta Bayesin tilastoissa. Yllä olevassa yhtälössä se edustaa yleensä lausuntoa (kuten lausuntoa, että kolikko nousee esiin 50 prosenttia ajasta) ja edustaa perustetta tai uutta tietoa, joka on otettava huomioon (kuten tulos sarjasta kolikonheitot). on tapahtuman ennakkotodennäköisyys , joka ilmaisee luottamusta tapahtumaan ennen kuin perustelut otetaan huomioon. Aikaisempi todennäköisyys voi myös kvantifioida tietoa tai tietoa tapahtumasta . on todennäköisyysfunktio , joka voidaan tulkita todisteen todennäköisyydeksi , kun otetaan huomioon , että tapahtuma on tapahtunut . Todennäköisyys ilmaisee sen, missä määrin todisteet tukevat väitettä . on posteriori todennäköisyys , väitteen todennäköisyys todisteiden tarkastelun jälkeen . Pohjimmiltaan Bayesin lause päivittää a priori varmuuden uusien todisteiden tarkastelun jälkeen [2] .
Todistuksen todennäköisyys voidaan laskea käyttämällä kokonaistodennäköisyyskaavaa . Jos on alkeistapahtumien tilan osio , joka on kokeen kaikkien tulosten joukko , niin [2] [4]
Jos tuloksia on ääretön määrä, on tarpeen integroida kaikki tulokset laskeaksesi kokonaistodennäköisyyskaavaa käyttäen. Laskeminen on usein vaikeaa, koska on tehtävä summaus tai integrointi, joka on aikaa vievää, joten usein huomioidaan vain priorin ja todennäköisyyden tulos. Posteriori todennäköisyys on verrannollinen tähän tuotteeseen [2] :
Maksimi posterioriestimaatti , joka on posterioriestimaatin muoto ja joka usein lasketaan Bayesin tilastoissa matemaattisia optimointimenetelmiä käyttäen , pysyy samana. Posteriori todennäköisyys voidaan approksimoida jopa ilman tarkkaa arvon laskemista menetelmillä, kuten Monte Carlo Markovin ketjuille tai variaatio Bayesin menetelmillä [2] .
Yleiset tilastotekniikat voidaan jakaa useisiin haaroihin, joista monilla on erityisiä Bayesin versioita.
Bayesin päättely viittaa tilastolliseen päättelyyn , jossa päätelmän epävarmuus kvantifioidaan todennäköisyydellä. Klassisessa taajuuspäätelmässä mallin ja hypoteesiparametrien oletetaan olevan kiinteitä, eikä taajuuspäätelmän parametreille tai hypoteeseille anneta todennäköisyyksiä. Esimerkiksi taajuuspäätelmässä ei ole järkevää ilmaista nimenomaisesti sellaisen tapahtuman todennäköisyyttä, joka voi tapahtua vain kerran, kuten symmetrisen kolikon seuraavan heiton tulos. Olisi kuitenkin järkevää sanoa, että nousevien päiden osuus konvergoi puoleen , kun kolikonheittojen määrä kasvaa [5] .
Tilastolliset mallit määrittelevät joukon tilastollisia oletuksia ja prosesseja, jotka edustavat otostietojen luomista. Tilastollisissa malleissa on joukko parametreja, joita voidaan muuttaa. Esimerkiksi kolikko voidaan esittää Bernoulli-jakauman kokeina , jotka simuloivat kahta mahdollista tulosta. Bernoullin jakaumassa on yksi parametri, joka on yhtä suuri kuin yhden tuloksen todennäköisyys, joka useimmissa tapauksissa on yhtä suuri kuin todennäköisyys saada päät [6] . Hyvän mallin rakentaminen datalle on keskeistä Bayesin päättelyssä. Useimmissa tapauksissa mallit vain arvioivat todellisia prosesseja eivätkä välttämättä ota huomioon joitain dataan vaikuttavia tekijöitä [2] . Bayesilaisessa päätelmässä mallin parametreille voidaan määrittää todennäköisyydet. Parametrit voidaan esittää satunnaismuuttujina . Bayesin johtopäätös käyttää Bayesin lausetta päivittämään todennäköisyydet saatuaan lisää dataa [2] [7] .
Tilastollisen mallintamisen muotoilulla Bayesin tilastoja käyttämällä on erottuva piirre, että mille tahansa tuntemattomalle parametrille vaaditaan ennakkotodennäköisyys . Lisäksi aikaisemmat todennäköisyysparametrit voivat itse omata aiemmat todennäköisyydet, mikä johtaa Bayesin hierarkkiseen mallinnukseen [8] , tai ne voivat olla toisistaan riippuvaisia, mikä johtaa Bayesin verkkoihin .
Bayesilainen kokeiden suunnittelu sisältää käsitteen nimeltä "ennakkoluottamusvaikutus". Tämä lähestymistapa käyttää tilastollisia analyysitekniikoita aiempien kokeiden tulosten sisällyttämiseksi seuraavan kokeen suunnitteluun. Tämä saavutetaan päivittämällä "luottamusta" käyttämällä aikaisempia ja jälkimmäisiä jakaumia . Näin voit käyttää kaikenlaisia resursseja kokeilujen suunnittelussa. Esimerkki on monikätinen rosvoongelma .
Tilastokaaviot sisältävät menetelmiä tietojen tutkimiseen, mallin riittävyyden validointiin jne. Joidenkin nykyaikaisten tietokonetekniikoiden käyttö Bayesin päättelyyn, erityisesti erilaisten Monte Carlo -tekniikoiden käyttö Markovin ketjuille , on johtanut tarpeeseen tarkistaa, usein graafisesti, tällaisten laskelmien riittävyys, mikä heijastaa vaadittua posterioria todennäköisyyttä.