Lindleyn paradoksi on ristiriitainen tilanne tilastoissa , jossa bayesilainen ja usein esiintyvä lähestymistapa hypoteesien testaamisen ongelmaan antaa erilaisia tuloksia tietyille aikaisemman jakauman valinnaille . Ongelmaa näiden kahden lähestymistavan välillä käsiteltiin Harold Jeffreysin vuonna 1939 julkaisemassa kirjassa [1] . Ongelma tuli tunnetuksi Lindleyn paradoksina sen jälkeen, kun Dennis Lindley oli eri mieltä paradoksista vuoden 1957 artikkelissa [2] .
Vaikka tilannetta kuvaillaan paradoksiksi , ero Bayesin ja usein esiintyvän lähestymistavan välillä voidaan selittää sillä, että niitä käytetään vastaamaan pohjimmiltaan erilaisiin kysymyksiin, eikä todellisena erimielisyytenä näiden kahden menetelmän välillä.
Oli miten oli, suurelle luokalle a priori erot taajuusmuuttajan ja bayesilaisen lähestymistavan välillä johtuvat merkitsevyystason säilymisestä. Kuten Lindley ymmärsi, "teoria ei voi oikeuttaa merkitsevyystason ylläpitämisen käytäntöä" ja jopa "jotkut professori Pearsonin tämän artikkelin käsittelyssä tekemät laskelmat korostavat, kuinka paljon merkitsevyystaso voi muuttua otoskoon mukaan, jos häviöt ja aiemmat todennäköisyydet pysyvät ennallaan". [2] . Itse asiassa, jos kriittinen arvo kasvaa riittävän nopeasti otoskoon kanssa, epäsuhta esiintyvän ja bayesilaisen lähestymistavan välillä tulee merkityksettömäksi [3] [4] .
Harkitse jonkin kokeen tulosta kahdella mahdollisella selityksellä, hypoteesilla ja , ja jollakin aikaisemmalla jakaumalla , jotka edustavat epävarmuutta siitä, kumpi hypoteesi on tarkempi, ennen kuin harkitset .
Lindleyn paradoksi löytyy tapauksesta:
Nämä tulokset voivat tapahtua samanaikaisesti, jos ne ovat hyvin tarkkoja, sumeampia, eikä aikaisempi jakauma suosi kumpaakaan, kuten alla on esitetty.
Voimme havainnollistaa Lindleyn paradoksia numeerisella esimerkillä. Kuvittele kaupunki, jossa 49 581 poikaa ja 48 870 tyttöä syntyi tietyn ajanjakson aikana. Poikien havaittu osuus on 49581/98451 ≈ 0,5036. Oletetaan, että poikien syntymien määrä on binomimuuttuja parametrilla . Haluamme tarkistaa, onko se yhtä suuri kuin 0,5 tai jokin muu arvo. Eli nollahypoteesimme on: , ja vaihtoehtoinen hypoteesi on .
Taajuustestauksen lähestymistapa on laskea p-arvo , poikien osuuden havaitsemisen todennäköisyys ainakin olettaen, että hypoteesi on totta. Koska syntyneiden määrä on suuri, voimme käyttää normaalia likiarvoa poikien syntymisosuudelle , ja laskettaessa
Yllätyisimme myös, jos otamme huomioon 48870 tytön syntymän eli , joten taajuustesti tekisi normaalisti kaksisuuntaisen testin, jonka p-arvo olisi . Molemmissa tapauksissa p-arvo on pienempi kuin 5 %:n merkitsevyystaso, joten toistuva lähestymistapa hylkää hypoteesin havaitun datan vastaisena.
Olettaen, ettei ole mitään syytä suosia yhtä hypoteesia toiselle, Bayesin lähestymistapa on määrittää hypoteesille aiemmat todennäköisyydet , tasainen jakauma, ja sitten laskea posteriori todennäköisyys Bayesin lauseen käytölle .
Kun olemme havainneet poikien syntymää vastasyntyneistä, voimme laskea kunkin hypoteesin posteriorisen todennäköisyyden käyttämällä binomiaalimuuttujan massajakaumafunktiota ,
missä on beetafunktio .
Näistä arvoista löydämme posteriorin todennäköisyyden , joka suosii voimakkaasti .
Kaksi lähestymistapaa, toistuva ja bayesilainen, ovat ristiriidassa, ja tämä on "paradoksi".
Kuitenkin, ainakin Lindleyn esimerkissä, jos otetaan merkitsevyystasojen sarja siten, että c , niin nollahypoteesin posteriori todennäköisyys on yleensä 0, mikä on yhdenmukainen nollahypoteesin hylkäämisen kanssa [3] . Numeerisessa esimerkissämme, jos otamme , tuloksena on merkitsevyystaso 0,00318, joten frekvenssilähestymistapa ei hylkää nollahypoteesia, joka on pitkälti yhdenmukainen Bayesin lähestymistavan kanssa.
Jos käytetään informatiivista ennakkojakaumaa ja testataan hypoteesia, joka muistuttaa enemmän taajuuslähestymistavan hypoteesia, paradoksi katoaa.
Jos esimerkiksi laskemme posteriorijakauman käyttämällä yhtenäistä prioria ja (eli ), saamme
Jos käytämme tätä testaamaan todennäköisyyttä, että vastasyntynyt on todennäköisemmin poika kuin tyttö, eli , saamme:
Toisin sanoen on hyvin todennäköistä, että poikien syntyvyys on yli 0,5.
Kumpikaan analyysi ei anna suoraa arviota vaikutuksen koosta , mutta molemmilla voidaan määrittää esimerkiksi, onko poikien syntyneiden osuus jonkin tietyn kynnyksen yläpuolella.
Näennäinen ero näiden kahden lähestymistavan välillä johtuu useiden tekijöiden yhdistelmästä. Ensinnäkin taajuuslähestymistapa tarkistaa yllä ottamatta huomioon . Bayesin lähestymistapa laskee vaihtoehtona k:lle ja havaitsee, että ensimmäinen hypoteesi on yhdenmukaisempi havaintojen kanssa. Tämä johtuu siitä, että jälkimmäinen hypoteesi on huomattavasti sumeampi, koska arvo voi olla mikä tahansa välissä , mikä johtaa erittäin pieneen posterioriin todennäköisyyteen. Ymmärtääksesi miksi, on hyödyllistä tarkastella kahta hypoteesia havaintojen luojina:
Suurin osa hypoteesin mahdollisista arvoista on havainnoilla erittäin huonosti tuettu. Sellaisenaan näennäinen erimielisyys menetelmien välillä ei ole lainkaan erimielisyyttä, vaan kaksi eri väitettä tiedoista:
Vastasyntyneiden (poikien/tyttöjen) sukupuolisuhde 50/50 taajuustestin mukaan on epäuskottava. Silti 50/50-suhde on parempi arvio kuin useimmat, mutta eivät kaikki, muut suhteet. Hypoteesi sopisi havaintoihin paljon paremmin kuin kaikki muut suhteet, mukaan lukien .
Esimerkiksi [5] tästä hypoteesin ja ennakkotodennäköisyyden valinnasta seuraa lause: "Jos > 0,49 ja < 0,51, niin ennakkotodennäköisyys olla täsmälleen 0,5 on 0,50/0,51 98 %". Kun otetaan huomioon niin vahva suosio , on helppo nähdä, että Bayesin lähestymistapa suosii , vaikka havaittu arvo olisi 0,5 :n sisällä . Poikkeama, joka on suurempi kuin poikkeama , katsotaan merkitseväksi frekventoivassa lähestymistavassa, mutta merkitys hylätään a priori bayesialaisessa lähestymistavassa.
Tarkasteltaessamme toisesta suunnasta voimme nähdä, että aiempi jakauma on olennaisesti tasainen delta-funktiolla . On selvää, että se on kyseenalaista. Itse asiassa, jos yrität piirtää reaalilukuja jatkuvina, olisi loogista olettaa, että se ei ole mahdollista tietylle parametrille .
Realistisempi jakauma vaihtoehtoiselle hypoteesille tuottaa vähemmän yllättäviä tuloksia hypoteesin posterioriselle todennäköisyydelle . Jos esimerkiksi korvaamme arvolla , eli maksimitodennäköisyysestimaatin arvolle , hypoteesin posteriori todennäköisyys on vain 0,07 verrattuna hypoteesin 0,93:een (maksimitodennäköisyysestimaattia ei tietenkään voi käyttää osana aiemman jakauman ).
Paradoksista keskustellaan edelleen aktiivisesti [3] [6] [7] .