Bayesin todennäköisyys

Bayesin todennäköisyys  on tulkinta Bayesin teoriassa käytetystä todennäköisyyden käsitteestä. Todennäköisyys määritellään luottamuksen asteena väitteen totuuteen . Bayesin teoria käyttää Bayesin lausetta määrittämään luottamuksen asteen tuomion totuuteen uutta tietoa vastaanotettaessa .

Historia

Bayesin teoria ja Bayesin todennäköisyys on nimetty Thomas Bayesin (1702–1761) mukaan, joka osoitti erityistapauksen lauseesta, jota nykyään kutsutaan Bayesin lauseeksi . Termi "bayesilainen" otettiin käyttöön noin vuonna 1950 , ja suurin osa siitä, mitä nykyään kutsutaan "bayesialaiseksi", ei liity suoraan Bayesiin. Laplace osoitti yleisemmän tapauksen Bayesin lauseesta ja käytti sitä ratkaisemaan ongelmia taivaanmekaniikan ja lääketieteen tilastoissa. Laplace ei kuitenkaan pitänyt tätä lausetta tärkeänä todennäköisyysteorian kehityksen kannalta. Hän noudatti klassista todennäköisyyden määritelmää .

Frank Ramsey kirjassaan The Foundations of Mathematics (1931) esitti ensimmäisenä ajatuksen subjektiivisen varmuuden käyttämisestä todennäköisyyden määrittämiseen. Ramsey ehdotti tätä määritelmää lisäyksenä tuolloin kehittyneempään taajuusmääritykseen . Tilastotieteilijä Bruno de Finetti sovelsi Ramseyn ideoita vuonna 1937 vaihtoehtona taajuuden määrittämiselle. Leonard Savage laajensi tätä ajatusta teoksessa The Foundations of Statistics (1954).

"Varmuuden asteen" intuitiivista käsitettä on yritetty määritellä muodollisesti. Yleisin määritelmä perustuu vedonlyöntiin : varmuuden aste heijastuu panoksen määrällä, jonka olet valmis lyömään vetoa siitä, että ehdotus on totta.

Vaihtoehdot

Todennäköisyyden Bayesin tulkinnan vaihtelut: subjektiivinen todennäköisyys ja looginen todennäköisyys .

Suhde taajuuden todennäköisyyteen

Bayesin todennäköisyys verrataan frekvenssitodennäköisyyteen , jossa todennäköisyys määräytyy satunnaisen tapahtuman suhteellisella esiintymistiheydellä riittävän pitkien havaintojen aikana.

Matemaattiset tilastot , jotka perustuvat frekvenssin todennäköisyyteen , kehittivät R. A. Fisher , E. Pearson ja E. Neumann 1900-luvun ensimmäisellä puoliskolla. A. Kolmogorov käytti myös taajuustulkintaa kuvaillessaan Lebesguen integraaliin perustuvaa aksiomatiikkaansa .

Ero Bayesin ja taajuustulkinnan välillä on tärkeä rooli käytännön tilastoissa. Esimerkiksi kun verrataan kahta hypoteesia samoilla tiedoilla, tilastollisen hypoteesitestauksen teoria , joka perustuu frekvenssitulkintaan, antaa mahdollisuuden hylätä tai olla hylkäämättä hypoteesimalleja. Samalla riittävä malli voidaan hylätä, koska toinen malli näyttää näillä tiedoilla sopivammalta. Bayesin menetelmät päinvastoin antavat lähtötiedoista riippuen posteriorisen todennäköisyyden olla riittävä kullekin hypoteesille.

Sovellus

1950-luvulta lähtien Bayesin teoriaa ja Bayesin todennäköisyyttä on sovellettu laajalti esimerkiksi Coxin lauseen ja maksimientropian periaatteen kautta . Useille[ mitä? ] -ongelmia, Bayesin menetelmät antavat parempia tuloksia kuin taajuustodennäköisyyteen perustuvat menetelmät .

Bayesin teoriaa käytetään menetelmänä mukauttaa olemassa olevia todennäköisyyksiä uusiin kokeellisiin tietoihin.

Bayesilaista teoriaa käytetään älykkäiden suodattimien rakentamiseen, joita käytetään esimerkiksi roskapostin suodattamiseen .

Todennäköisyyksien todennäköisyydet

Bayesin todennäköisyyden käyttöön liittyvä epämiellyttävä yksityiskohta on se, että todennäköisyyden määrittäminen ei riitä sen luonteen ymmärtämiseksi. Harkitse seuraavia tilanteita:

  1. Sinulla on laatikko mustia ja valkoisia palloja, eikä niiden lukumäärästä ole tietoa.
  2. Sinulla on laatikko mustavalkoisia palloja. Vedit satunnaisesti palloja, tasan puolet niistä osoittautui mustiksi.
  3. Sinulla on laatikko mustavalkoisia palloja ja tiedät, että tarkalleen puolet niistä on mustia.

Bayesin todennäköisyys "vetää seuraava musta pallo" kussakin näistä tapauksista on 0,5. Keynes kutsui tätä "varmuuden asteen" ongelmaksi. Tämä ongelma voidaan ratkaista ottamalla käyttöön todennäköisyyden todennäköisyys (kutsutaan metatodennäköisyydeksi ).

1. Oletetaan, että sinulla on laatikko mustavalkoisia palloja, eikä sinulla ole tietoa siitä, kuinka monta minkä väristä palloa siinä on. Olkoon  - tämä on väite, että todennäköisyys piirtää seuraavaksi musta pallo on , jolloin todennäköisyysjakauma on beta-jakauma : Olettaen, että pallon vedot ovat riippumattomia ja yhtä todennäköisiä, todennäköisyysjakauma m mustaa palloa ja n valkoista palloa piirtämisen jälkeen on myös beta-jakauma parametrein , . 2. Oletetaan, että olet piirtänyt palloja laatikosta , joista puolet osoittautui mustiksi ja loput valkoisiksi. Tässä tapauksessa todennäköisyysjakauma on beta-jakauma . Suurin jälkikäteen odotus on . 3. Tiedät, että tasan puolet palloista on mustia ja loput valkoisia. Tässä tapauksessa todennäköisyys on 0,5 todennäköisyydellä 1: .

Katso myös

Linkit