Fisherin tarkka testi

Fisherin eksaktitesti  on tilastollinen merkitsevyystesti , jota käytetään pienten otoskokojen ristitaulukkojen analysoinnissa . Liittyy tarkkaan merkitsevyystesteihin, koska se ei käytä suuria otosapproksimaatioita (asymptotiikkaa, kun otoskoko pyrkii äärettömään).

Keksijä Ronald Fisherin mukaan nimetty kirjailijan luominen sai alkunsa Muriel Bristolin ( eng.  Muriel Bristol ) lausunnosta, joka väitti pystyneensä havaitsemaan, missä järjestyksessä teetä ja maitoa kaadettiin hänen kuppiinsa.

Tapaaminen

Testiä käytetään yleisesti kahden muuttujan välisen suhteen merkittävyyden tutkimiseen faktoridimensiotaulukossa ( contingency table ). Testin todennäköisyysarvo lasketaan ikään kuin taulukon rajojen arvot olisivat tiedossa. Esimerkiksi teen maistelun yhteydessä neiti Bristol tietää kunkin valmistuksen yhteydessä juomien kuppien lukumäärän (ensin maito tai tee), joten oletettavasti antaa oikean määrän arvauksia kussakin luokassa. Kuten Fisher huomautti, olettaen testin riippumattomuuden nollahypoteesin , tämä johtaa hypergeometrisen jakauman käyttämiseen tietylle taulukon pistemäärälle.

Suurilla näytteillä voidaan tässä tilanteessa käyttää khin neliötestiä . Tämä testi ei kuitenkaan ole tarkoituksenmukainen, kun arvojen keskiarvo missä tahansa taulukon solussa tietyillä rajoilla on alle 10: testattavan tilaston laskettu otosjakauma on vain suunnilleen yhtä suuri kuin teoreettinen khin neliöjakauma , ja approksimaatio on riittämätön näissä olosuhteissa (jotka syntyvät, kun otosten koot ovat pieniä tai tiedot jakautuvat erittäin epätasaisesti taulukon solujen kesken). Fisher-testi on nimensä mukaisesti tarkka ja siksi sitä voidaan käyttää näytteen ominaisuuksista riippumatta. Testin laskeminen suurille näytteille tai hyvin tasapainotetuille taulukoille tulee vaikeaksi, mutta onneksi näihin olosuhteisiin Pearson-kriteeri ( ) soveltuu hyvin.

Manuaalisia laskelmia varten testi voidaan suorittaa vain tekijätaulukoiden dimensioiden tapauksessa . Testin periaate voidaan kuitenkin laajentaa yleiseen taulukkotapaukseen , ja jotkin tilastopaketit tarjoavat tällaisia ​​laskelmia (joskus käyttämällä Monte Carlo -menetelmää likiarvon saamiseksi).

Esimerkki

Tarkkojen testien avulla voit saada tarkempia analyysejä pienille näytteille tai tiedoille, jotka ovat harvassa. Ei-parametristen tutkimusten tarkat testit ovat sopiva tilastollinen työkalu epätasapainoisten tietojen käsittelyyn. Asymptoottisilla menetelmillä analysoidut epätasapainoiset tiedot johtavat yleensä epäluotettaviin tuloksiin. Suurille ja hyvin tasapainotetuille tietojoukoille tarkat ja asymptoottiset todennäköisyysarviot ovat hyvin samanlaisia. Mutta pienille, harvoille tai epätasapainoisille tiedoille tarkat ja asymptoottiset arviot voivat olla melko erilaisia ​​ja johtaa jopa päinvastaisiin johtopäätöksiin kehitettävästä hypoteesista [1] [2] [3] .

Fisher-testin tarve syntyy, kun meillä on tiedot jaettu kahteen kategoriaan kahdella eri tavalla. Esimerkiksi otos nuorista voidaan jakaa luokkiin toisaalta sukupuolen mukaan (pojat ja tytöt) ja toisaalta sen mukaan, onko ruokavaliolla vai ei. Voidaan olettaa, että ruokavalioon osallistuvien osuus on suurempi tyttöjen kuin poikien joukossa, ja halutaan selvittää, onko havaittu suhteissa ero tilastollisesti merkitsevä.

Tiedot voivat näyttää tältä:

nuoret miehet tytöt Kaikki yhteensä
laihduttaminen yksi 9 kymmenen
ei dieetillä yksitoista 3 neljätoista
Kaikki yhteensä 12 12 24

Sellaiset tiedot eivät sovellu kiini-neliöanalyysiin, koska taulukon odotusarvot ovat aina alle 10 ja tekijäkokotaulukon vapausasteiden lukumäärä on aina yksi.

Kysymämme näistä tiedoista on seuraava: kun otetaan huomioon, että 10 24 teini-ikäisestä on laihduttajia ja että 12 näistä 24:stä on tyttöjä, mikä on todennäköisyys, että 10 laihduttajaa jakautuu niin epätasaisesti sukupuolten kesken? Jos valitsisimme satunnaisesti 10 teini-ikäistä, mikä on todennäköisyys, että heistä 9 on valittu 12 naisen joukosta ja vain 1 12 pojan joukosta?

Ennen kuin jatkamme Fisher-testin tutkimista, esitellään tarvittava merkintä. Merkitään solujen lukuja kirjaimilla , , ja vastaavasti sanotaan rivien ja sarakkeiden yhteenlasketut summat marginaalisummuksiksi (raja) ja esitetään summa kirjaimella .

Nyt taulukko näyttää tältä:

Nuoret Tytöt Kaikki yhteensä
Laihduttaminen
Ei dieetillä
Kaikki yhteensä

Fisher osoitti, että todennäköisyys saada mikä tahansa tällainen suureiden joukko saadaan hypergeometrisen jakauman avulla:

jossa suluissa olevat sarakkeet ovat binomiaalikertoimia ja symboli " " on tekijäoperaattori .

Tämä kaava antaa tarkan todennäköisyyden minkä tahansa tietyn tietojoukon havainnointiin, kun otetaan huomioon marginaalitulokset, kokonaissumma ja nollahypoteesi samasta ruokavalioon taipumisesta sukupuolesta riippumatta (laihduttajien ja laihduttamattomien välinen suhde on sama pojilla kuin tytöille).

Fisher osoitti, että voimme käsitellä vain tapauksia, joissa marginaalisummat  ovat samat kuin yllä olevassa taulukossa. Yllä olevassa esimerkissä tällaisia ​​tapauksia on 11. Näistä vain yksi on yhtä "vino" (naisen laihdutusalttiuden suuntaan) kuin demo:

Nuoret Tytöt Kaikki yhteensä
Laihduttaminen 0 kymmenen kymmenen
Ei dieetillä 12 2 neljätoista
Kaikki yhteensä 12 12 24

Jotta voidaan arvioida havaittujen tietojen tilastollista merkitsevyyttä eli saman tai selvemmän "vinoutumisen" yleistä todennäköisyyttä ruokavaliolla oleviin tyttöihin, olettaen nollahypoteesi , meidän on laskettava arvotodennäköisyydet molemmille näille taulukoille ja lisää ne. Tämä antaa niin sanotun yksisuuntaisen testin; kaksipuolisessa testissä meidän on otettava huomioon myös taulukot, jotka ovat samalla tavalla vinossa, mutta vastakkaiseen suuntaan (eli harkitsevat pääasiassa miesten laihduttamista).

Taulukoiden luokittelu sen mukaan, ovatko ne "erittäin vinossa", on kuitenkin ongelmallista. R -ohjelmointikielen käyttämä lähestymistapa ehdottaa kriteeriarvon laskemista laskemalla yhteen kaikkien taulukoiden todennäköisyydet, joiden todennäköisyydet ovat pienempiä tai yhtä suuria kuin havaitun taulukon todennäköisyydet. Taulukoissa, joissa on pieni solumäärä, kaksisuuntainen testitulos voi poiketa merkittävästi kaksinkertaisesta yksisuuntaisesta pistemäärästä, toisin kuin tilastoissa, joilla on symmetrinen otantajakauma.

Useimmat nykyaikaiset tilastopaketit laskevat Fisher-testien arvon, joissakin tapauksissa myös khin neliön approksimaatio olisi hyväksyttävä. Tilastoohjelmistopakettien suorittamat todelliset laskelmat poikkeavat yleensä kuvatuista. Erityisesti suuret tekijät voivat aiheuttaa numeerisia vaikeuksia. Yksinkertaiset, mutta entistä tehokkaammat laskennalliset lähestymistavat perustuvat gammafunktion tai logaritmisen gammafunktion käyttöön, mutta hypergeometristen ja binomiaalisten todennäköisyyksien tarkka laskenta on nykyisen tutkimuksen alaa.

Muistiinpanot

  1. Mehta, CR 1995. SPSS 6.1 Tarkka testi Windowsille. Englewood Cliffs, NJ: Prentice Hall
  2. Mehta, CR, Patel, NR, & Tsiatis, AA 1984. Tarkka merkitsevyystestaus hoidon vastaavuuden määrittämiseksi järjestetyn kategorisen datan kanssa. Biometrics, 40(3), 819-825
  3. Mehta, CR, Patel, NR 1997. Tarkka johtopäätös kategorisissa tiedoissa. Biometrics, 53(1), 112-117

Kirjallisuus

Linkit