Matemaattisissa tilastoissa ja päätösteoriassa Bayesin päätösestimaatti on tilastollinen arvio , joka minimoi häviöfunktion posteriori - odotuksen (eli tappio -odotuksen jälkeisen odotuksen ). Toisin sanoen se maksimoi hyödyllisyysfunktion jälkiodotuksen . Bayesin teorian puitteissa tämä estimaatti voidaan määritellä a posteriori maksimin estimaatiksi .
Oletetaan, että tuntemattomalla parametrilla on aikaisempi jakauma . Antaa olla arvio parametrista , joka perustuu joihinkin mittauksiin , ja olla neliöllinen häviöfunktio , ja parametrin Bayesin riski on , jossa keskiarvo otetaan haltuun jakauman : tämä määrittelee riskifunktion funktiona . Tällöin Bayesin estimaatia kutsutaan sellaiseksi arvioksi , joka minimoi Bayesin riskin kaikkien muiden arvioiden joukossa. Samoin estimaattori, joka minimoi posteriorisen odotetun tappion jokaiselle x:lle , minimoi myös Bayesin riskin ja on siten Bayesin estimaattori. [yksi]
Virheellisen aiemman jakauman tapauksessa estimaattia, joka minimoi kunkin x: n posteriorisen häviöodotuksen , kutsutaan yleistetyksi Bayesin estimaatiksi . [2]
Yleisimmin käytetty riskifunktio Bayesin estimointiin on neliövirhefunktio (englanninkielisessä kirjallisuudessa MSE). Pienin keskineliövirhe MSE määritellään seuraavasti
jossa matemaattinen odotus otetaan yhteisjakaumasta ja .
Jos käytämme MSE:tä riskifunktiona, niin tuntemattoman parametrin Bayesin estimaatti on yksinkertaisesti posteriorijakauman keskiarvo : [3]
Tätä kutsutaan minimikeskineliövirhearvioksi. Bayesin riski on tässä tapauksessa posteriorinen varianssi.
Tapauksissa, joissa ei ole hyvää syytä suosia yhtä prioria toiseen verrattuna , konjugaattia prior käytetään yksinkertaisuuden vuoksi . Se määritellään johonkin parametriseen perheeseen kuuluvana aiemmana jakaumana, jonka tuloksena oleva posteriorijakauma kuuluu myös tähän perheeseen. Tämä on tärkeä ominaisuus, koska Bayesin estimaatti sekä sen tilastolliset ominaisuudet ( varianssi , luottamusväli jne.) voidaan johtaa posteriorijakaumasta.
Se soveltuu erityisesti sekventiaaliarvioinnissa, jossa virtamittausten jälkijakaumaa käytetään priorina seuraavassa mittauksessa. Jokaisella tällaisten mittausten uudella iteraatiolla posteriorijakauma yleensä monimutkaistuu, eikä Bayesin estimaattia voida usein laskea ilman numeeristen menetelmien käyttöä .
Joitakin esimerkkejä konjugaattiprioreista:
Riskifunktiot valitaan sen mukaan, kuinka estimaatin ja tuntemattoman parametrin välinen aika mitataan. MSE on yleisimmin käytetty riskifunktio ensisijaisesti yksinkertaisuutensa vuoksi. Joskus kuitenkin käytetään vaihtoehtoisia riskitoimintoja. Seuraavassa on esimerkkejä tällaisista vaihtoehdoista. Lisäksi posteriori yleistetty jakauman funktio on merkitty .
Posteriorimediaani ja muut kvantiilit( ):
Tähän mennessä on oletettu, että aiempi jakauma on todellinen todennäköisyysjakauma, koska
Joskus tämä voi kuitenkin olla liian tiukka vaatimus. Esimerkiksi ei ole olemassa sellaista jakaumaa (joka kattaa koko reaalilukujoukon R ), jolla jokainen reaaliluku olisi yhtä mahdollista. Kuitenkin tietyssä mielessä tällainen jakauma näyttää olevan luonnollinen valinta ei-informatiiviselle priorille , toisin sanoen priorille, joka ei suosi jotakin tuntemattoman parametrin kiinteää arvoa. Funktion määrittäminen on edelleen mahdollista , mutta tämä ei ole enää oikea todennäköisyysjakauma, koska sillä on ääretön massa.
Tällaiset joukkomitat ovat virheellisiä aikaisempia jakaumia .
Väärien priorien käyttö tarkoittaa, että Bayesin riskiä ei ole määritelty (koska annettu priori ei itse asiassa ole todennäköisyysjakauma, emmekä voi ottaa siitä Odotettua arvoa ). Siksi on väärin puhua Bayesin estimaattorista, joka minimoi Bayesin riskin. Oli miten oli, posteriorijakauma voidaan laskea seuraavasti
Muista, että Bayesin lause koskee vain hyvin muodostettuja jakaumia, joten sitä ei voi käyttää tässä. Usein on kuitenkin tapauksia, joissa tuloksena oleva posteriorijakauma sallii tällaiset todennäköisyysjakaumat. Tässä tapauksessa jälkikäteen odotettu tappio
hyvin määritelty ja rajallinen. Muista, että oikean jakauman saamiseksi Bayesin estimaatit minimoivat posteriorihäviön. Kun aiempi jakauma on virheellinen, estimaattoria, joka minimoi tappion jälkiodotuksen, kutsutaan yleistetyksi Bayesin estimaattoriksi .
Empiirisellä Bayesin menetelmällä tuotettuja Bayesin estimaattoreita kutsutaan empiirisiksi Bayesin estimaattoreiksi . Tämä menetelmä mahdollistaa tukitietojen käytön Bayesin estimaattorin kehittämisessä. Ne voidaan saada empiirisesti tarkkailemalla viereisiä parametreja. Tämä tehdään olettaen, että arvioidut parametrit on otettu samoista aikaisemmista tiedoista. Esimerkiksi jos eri parametreille tehdään riippumattomia havaintoja, on joskus mahdollista parantaa tietyn parametrin arvioinnin tehokkuutta käyttämällä muiden havaintojen tietoja.
Empiirisiä Bayesin arvioita varten on olemassa parametrisia ja ei-parametrisia tekniikoita. Parametriset ovat parempia, koska ne ovat soveltuvampia ja tarkempia pienille tietomäärille. [neljä]
Bayesin säännöt, joilla on rajallinen Bayesin riski, ovat yleensä voimassa. Seuraavassa on joitain esimerkkejä hyväksyttävyyslauseista.
Samaan aikaan yleistetty Bayesin sääntö ei useinkaan määrittele Bayesin riskiä virheellisen ennakkojakauman tapauksessa. Nämä säännöt ovat usein virheellisiä, ja niiden vahvistaminen voi olla vaikeaa. Esimerkiksi yleinen Bayesin estimaatti parametrin θ siirtymästä, joka perustuu normaalijakauman omaavaan otokseen, on virheellinen . Tämä paradoksi tunnetaan Steinin paradoksina. esimerkki
Internet Movie Database käyttää erityistä kaavaa käyttäjien elokuvien arvioiden laskemiseen ja vertailuun. Seuraavaa Bayesin kaavaa käytettiin alun perin 250 parhaan elokuvan painotetun keskiarvon laskemiseen, vaikka kaava on sittemmin muuttunut:
missä:
= painotettu luokitus = elokuvan keskimääräinen arvio, ilmaistuna numeroina 1-10 = (arvio) = elokuvan äänimäärä = (ääniä) = ennakkoarvioinnin antama paino (arvio perustuu keskiarvosanan jakautumiseen kaikkien elokuvien kesken) = kaikkien elokuvien keskimääräinen arvosana (tällä hetkellä 7,0)IMDB:n lähestymistapa varmistaa, että useita satoja kertoja yksinomaan arvosanalla 10 arvioitu elokuva ei voi nousta korkeammalle kuin esimerkiksi Kummisetä, jonka keskiarvosana on 9,2 yli 500 000 käyttäjältä.