Bayesin lause (tai Bayesin kaava ) on yksi elementaarisen todennäköisyysteorian päälauseista , jonka avulla voit määrittää tapahtuman todennäköisyyden edellyttäen, että toinen tapahtuma, joka on tilastollisesti riippuvainen siitä, on tapahtunut. Toisin sanoen Bayesin kaavan mukaan todennäköisyys on mahdollista laskea tarkemmin uudelleen, kun otetaan huomioon sekä aiemmin tunnetut tiedot että uusien havaintojen tiedot. Bayesin kaava voidaan johtaa todennäköisyysteorian perusaksioomeista, erityisesti ehdollisesta todennäköisyydestä. Bayes-lauseen ominaisuus on, että sen käytännön soveltaminen vaatii suuren määrän laskelmia, laskelmia, joten Bayesin arvioita alettiin käyttää aktiivisesti vasta tietokone- ja verkkoteknologian vallankumouksen jälkeen.
Kun Bayesin lause syntyi, lauseessa käytetyt todennäköisyydet olivat useiden todennäköisyyksien tulkintojen alaisia. Yksi näistä tulkinnoista sanoi, että kaavan johtaminen liittyy suoraan tilastollisen analyysin erityislähestymistavan soveltamiseen. Jos käytämme todennäköisyyden Bayesin tulkintaa , niin lause osoittaa, kuinka henkilökohtainen luottamustaso voi muuttua dramaattisesti tapahtumien lukumäärän vuoksi. Tämä on Bayesin johtopäätös, josta tuli Bayesin tilastojen perusta. Lausetta ei kuitenkaan käytetä vain Bayesin analyysissä, vaan sitä käytetään aktiivisesti myös monissa muissa laskelmissa.
Psykologiset kokeet [1] ovat osoittaneet, että ihmiset usein arvioivat väärin tapahtuman todellisen (matemaattisesti oikean) todennäköisyyden jonkin saadun kokemuksen perusteella ( a posteriori todennäköisyys ), koska he jättävät huomiotta oletuksen todennäköisyyden ( a priori todennäköisyys ). Siksi oikea Bayesin kaavan mukainen tulos voi olla hyvinkin erilainen kuin intuitiivisesti odotettu tulos.
Bayesin lause on nimetty sen kirjoittajan Thomas Bayesin (1702–1761) mukaan. Hän oli englantilainen matemaatikko ja pappi, joka ehdotti ensimmäisen kerran lauseen käyttöä uskomusten korjaamiseen päivitettyjen tietojen perusteella. Hänen teoksensa " Essee kohti ongelman ratkaisemista mahdollisuuksien opissa " julkaistiin ensimmäisen kerran vuonna 1763 [2] , 2 vuotta kirjoittajan kuoleman jälkeen. Ennen kuin Bayesin postuumityö hyväksyttiin ja luettiin Royal Societyssa, Richard Price muokkasi ja päivitti sitä laajasti . Näitä ajatuksia ei kuitenkaan julkistettu ennen kuin Pierre-Simon Laplace löysi ne uudelleen ja kehitti ne , joka julkaisi ensimmäisenä lauseen nykyaikaisen muotoilun vuonna 1812 ilmestyneessä kirjassaan The Analytic Theory of Probability.
Sir Harold Jeffreys kirjoitti, että Bayesin lause on "todennäköisyysteorialle sama kuin Pythagoraan lause geometrialle " [3] .
Bayesin kaava : ,missä — hypoteesin A a priori todennäköisyys (katso jäljempänä tällaisen terminologian merkitys); on hypoteesin A todennäköisyys tapahtuman B tapahtuessa (a posteriori todennäköisyys); on tapahtuman B todennäköisyys, jos hypoteesi A on tosi ; on tapahtuman B kokonaistodennäköisyys . |
Bayesin kaava seuraa ehdollisen todennäköisyyden määritelmästä . Yhteisen tapahtuman todennäköisyys ilmaistaan kahdella tavalla ehdollisina todennäköisyyksinä
Näin ollen
Ongelmissa ja tilastosovelluksissa se lasketaan yleensä kaavalla tapahtuman kokonaistodennäköisyydestä riippuen useista ristiriitaisista hypoteeseista kokonaistodennäköisyydellä 1.
,jossa summamerkin alla olevat todennäköisyydet tunnetaan tai ne voidaan kokeellisesti arvioida.
Tässä tapauksessa Bayesin kaava kirjoitetaan seuraavasti:
Bayesin kaavan avulla voit "järjestää syyn ja seurauksen uudelleen": kun otetaan huomioon tapahtuman tunnettu tosiasia, laske todennäköisyys, että se johtui tietystä syystä. Samanaikaisesti on ymmärrettävä, että lauseen soveltamiseksi syy-yhteys ja välillä ei ole pakollista.
Tapahtumia, jotka heijastavat "syiden" toimintaa, kutsutaan tässä tapauksessa hypoteesiksi , koska ne ovat väitettyjä tapahtumia, jotka aiheuttivat annetun. Hypoteesin pätevyyden ehdotonta todennäköisyyttä kutsutaan a priori (kuinka todennäköinen syy on yleensä ), ja ehdollista todennäköisyyttä tapahtuman tosiasian huomioon ottaen kutsutaan posteriori (kuinka todennäköiseksi syy osoittautui , ottaen huomioon tapahtumaa koskevat tiedot ).
Anna tapahtuman - auto ei käynnisty, ja hypoteesi - säiliössä ei ole polttoainetta. Ilmeisesti todennäköisyys , että auto ei käynnisty, jos säiliössä ei ole polttoainetta, on yhtä suuri. Tämän seurauksena posteriori todennäköisyys, että säiliössä ei ole polttoainetta, jos auto ei käynnisty, eli , on yhtä suuri kuin , eli sen aiemman todennäköisyyden suhde, että säiliössä ei ole polttoainetta todennäköisyyteen, auto ei käynnisty. Esimerkiksi, jos todennäköisyys sille, että säiliössä ei ole polttoainetta, on 0,01 ja todennäköisyys, että auto ei käynnisty, on 0,02 ja satunnaisesti valittu auto ei käynnistynyt, niin todennäköisyys, että sen säiliössä ei ole polttoainetta on 0, 5.
Olkoon avioliiton todennäköisyys ensimmäiselle työntekijälle , toiselle työntekijälle - ja kolmannelle - . Ensimmäinen teki osat, toinen teki osat ja kolmas teki osat. Työnjohtaja ottaa satunnaisen osan, ja se osoittautuu vialliseksi. Kysymys kuuluu, mikä on todennäköisyys, että tämän osan on tehnyt kolmas työntekijä?
Tapahtuma on viallinen osa, tapahtuma on työntekijän tuottama osa . Sitten , missä , a .
Kokonaistodennäköisyyskaavan mukaan
Bayesin kaavan mukaan saamme:
Entomologi ehdottaa, että kovakuoriainen voi olla harvinainen kovakuoriaisen alalaji , koska sen rungossa on kuvio. Harvinaisissa alalajeissa 98 % kovakuoriaisista on kuviollisia tai P(kuvio | harvinainen) = 0,98. Tavallisista kovakuoriaisista vain 5 % on kuviollisia: P(kuvio | tavallinen) = 0,05. Harvinaisia kovakuoriaisia on vain 0,1 % koko populaatiosta: P(harvinainen) = 0,001. Millä todennäköisyydellä kuviollinen kovakuoriainen on harvinainen alalaji, eli mikä on P(harvinainen | kuvio) ?
Laajennetusta Bayes-lauseesta saamme (mikä tahansa kovakuoriainen voi olla joko harvinainen tai yleinen):
Olkoon sairaus, jonka esiintymistiheys on 0,001 väestön kesken ja diagnostinen tutkimusmenetelmä, joka todennäköisyydellä 0,9 tunnistaa potilaan, mutta samalla todennäköisyydellä 0,01 väärä positiivinen tulos - virheellinen sairauden havaitseminen terveellä henkilöllä ( lisää… ). Laske todennäköisyys, että henkilö on terve, jos hänet todettiin sairaaksi tarkastuksessa.
Merkitään se tapahtuma, jossa tutkimuksessa kävi ilmi, että henkilö on sairas, lainausmerkein "sairas", sairas - tapahtuma, että henkilö on todella sairas, terve - tapahtuma, että henkilö on todella terve. Sitten annetut ehdot kirjoitetaan uudelleen seuraavasti:
, while , tarkoittaa:
Todennäköisyys, että henkilö on terve, jos hänet todettiin sairaaksi, on yhtä suuri kuin ehdollinen todennäköisyys:
Sen löytämiseksi laskemme ensin kokonaistodennäköisyyden tulla tunnistetuksi potilaaksi:
Todennäköisyys, että henkilö on terve, jos tulos on "sairas":
Näin ollen 91,7 % ihmisistä, joiden tutkimus osoitti tuloksen "sairaana", on todella terveitä ihmisiä. Syynä tähän on se, että ongelman tilanteen mukaan todennäköisyys väärälle positiiviselle tulokselle, vaikkakin pieni, on suuruusluokkaa suurempi kuin potilaiden osuus tutkittavassa ryhmässä.
Jos kyselyn virheellisiä tuloksia voidaan pitää satunnaisina, saman henkilön toinen tutkimus antaa ensimmäisestä riippumattoman tuloksen. Tässä tapauksessa väärien positiivisten tulosten osuuden vähentämiseksi on järkevää tutkia uudelleen ihmiset, jotka saivat tuloksen "sairaana". Todennäköisyys, että henkilö on terve saatuaan toistuvan "sairaus" -tuloksen, voidaan myös laskea Bayesin kaavalla:
Matemaattisesti Bayesin lause näyttää yhteyden tapahtuman A todennäköisyyden ja tapahtuman B, P ( A ) ja P ( B ) todennäköisyyden välillä, ehdollisen todennäköisyyden tapahtuman A esiintymiselle olemassa olevan B:n kanssa ja tapahtuman B esiintymisen välillä. olemassa olevat A, P ( A | B ) ja P ( B | A ).
Yleisesti Bayesin kaava näyttää tältä:
Lausekkeen merkitys riippuu siitä, kuinka annetun kaavan todennäköisyydet tulkitaan.
Bayesilaisessa tulkinnassa todennäköisyys mittaa luottamuksen tasoa. Bayesin lause sitoo yhteen oletuksen uskottavuuden ennen ja jälkeen ilmeisten todisteiden huomioon ottamista. Esimerkiksi joku ehdotti, että kun kolikkoa heitetään, se laskeutuu 2 kertaa useammin hännät ylös ja päät alaspäin. Aluksi luottamus siihen, että tällainen tapahtuma tapahtuu, kolikko putoaa täsmälleen näin - 50%. Luottamustaso voi nousta 70 prosenttiin, jos olettamusta tuetaan todisteilla. [ tyhjentää ]
Olettamukselle (hypoteesille) A ja todistukselle B
Taajuustulkinnassa Bayesin lause laskee tapahtuman tiettyjen tulosten suhteet. Oletetaan, että kokeilu on suoritettu useita kertoja ja joissakin tapauksissa se on johtanut tuloksiin A ja/tai B. Sitten:
Bayesin lauseen rooli voidaan ymmärtää parhaiten oikealla olevista puukaavioista. Kaaviot osoittavat tapahtumien erilaisen jakautumisjärjestyksen tulosten A ja B olemassaolon tai puuttumisen perusteella. Bayesin lause toimii linkkinä näiden jakaumien välillä.
Tapahtumissa A ja B , jos P ( B ) ≠ 0,
Monet Bayesin lauseen lisäykset väittävät, että tapahtuma B tunnetaan, ja on ymmärrettävä, kuinka tieto tapahtumasta B vaikuttaa varmuuteen, että tapahtuma A tapahtuu. Tässä tapauksessa viimeisen lausekkeen nimittäjä - tapahtuman todennäköisyys tapahtuman B esiintyminen - tiedetään; haluamme muuttaa A. Bayesin lauseen osoittaa, että posterioritodennäköisyydet ovat verrannollisia osoittajaan:
( A :n suhteellisuus tietylle B :lle ). Lyhyesti sanottuna posteriori on verrannollinen aiempaan (ks. Lee, 2012, luku 1).Jos tapahtumat A 1 , A 2 , ... ovat toisensa poissulkevia ja tyhjentäviä, eli vain yksi tapahtumista on mahdollinen, kaksi tapahtumaa ei voi tapahtua samanaikaisesti, voimme määrittää suhteellisuuskertoimen keskittyen siihen, että niiden todennäköisyydet lisää yhteen. Esimerkiksi tietylle tapahtumalle A itse tapahtuma A ja sen vastakohta ¬ A ovat toisensa poissulkevia ja tyhjentäviä. Kun suhteellisuuskerroin merkitään C:ksi, meillä on:
ja .Yhdistämällä nämä kaksi kaavaa saamme seuraavan:
Laajennettu muotoUsein tapahtumien tila (kuten { A j }) määritellään P ( A j ) ja P ( B | A j ) termeillä. Tässä tapauksessa on hyödyllistä määrittää P ( B ) käyttämällä kokonaistodennäköisyyskaavaa :
Erityisesti
.Tarkastellaan kahden suuren X ja Y muodostamaa alkeistapahtumien avaruutta Ω . Periaatteessa Bayesin lause pätee tapahtumiin A = { X = x } ja B = { Y = y }. Lausekkeista tulee kuitenkin 0 pisteissä, joissa muuttujan todennäköisyystiheys on äärellinen . Jotta Bayesin lauseen käyttöä voidaan jatkaa hyödyllisesti, se voidaan ilmaista sopivina tiheyksinä (katso Kaavan derivointi ).
Yksinkertainen lomakeJos X on jatkuva ja Y on diskreetti, niin
Jos X on diskreetti ja Y on jatkuva,
Jos sekä X että Y ovat jatkuvia,
Laajennettu muotoJatkuva tapahtumaavaruus määritellään usein ehtojen A osoittajaksi. Jatkuva tapahtumaavaruus esitetään usein osoittajana. Jatkossa on hyödyllistä päästä eroon nimittäjästä kokonaistodennäköisyyden kaavan avulla . Jos 'f Y ( y ), tästä tulee integraali:
Bayesin sääntö on modifioitu Bayesin lause:
missä
Tätä kutsutaan Bayesin säännöksi tai todennäköisyyssuhteeksi. Kahden tapahtuman todennäköisyyksien ero on yksinkertaisesti näiden kahden tapahtuman todennäköisyyksien suhde. Tällä tavalla,
, ,Bayesin lause voidaan johtaa todennäköisyyden määritelmästä :
Kahdelle jatkuvalle satunnaismuuttujalle X ja Y Bayesin lause voidaan johtaa samalla tavalla ehdollisen jakauman määritelmästä :
Sanakirjat ja tietosanakirjat | |
---|---|
Bibliografisissa luetteloissa |