Welchin t-testi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 19. toukokuuta 2022 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Welchin t-testi on Studentin jakaumaan  perustuva testi, joka on suunniteltu testaamaan tilastollista hypoteesia sellaisten satunnaismuuttujien matemaattisten odotusten yhtäläisyydestä, joilla ei välttämättä ole yhtä suuria tunnettuja variansseja. Se on muunnos Studentin t-testistä . Nimetty brittiläisen tilastotieteilijän Bernard Lewis Welchin mukaan.

Tausta

Kahden otoksen Studentin t-testin soveltamiseksi on välttämätöntä, että kahdella riippumattomalla näytteellä on normaali keskiarvojakauma ja todelliset varianssit ovat yhtä suuret. Welchin t-testin tapauksessa todelliset varianssit eivät välttämättä ole enää yhtä suuret, mutta oletus, että data on normaalijakaumaa, säilyy.

Laskentatilastot

Olkoon kaksi riippumatonta näytettä normaalijakautuneista satunnaismuuttujista:

Testaamme seuraavaa nollahypoteesia matemaattisten odotusten yhtäläisyydestä:

Olkoon nollahypoteesi totta. Sitten ja . Olkoon ja ovat varianssien ja vastaavasti  puolueettomat estimaatit . Lasketaan seuraavat tilastot:

Tehdään seuraava muunnos:

Ensimmäisen tilaston jakauma on standardi normaalijakauma:

Harkitse toista tilastoa ja kutsu sitä lisälaskelmia varten :

Tilasto muistuttaa khin neliön satunnaismuuttujaa jaettuna vapausasteilla, mutta ei sitä ole. Olkoon satunnaismuuttuja, jolla on khin neliöjakauma vapausasteiden kanssa. Sitten samoin . Huomaa nyt, että (koska käytämme varianssien puolueettomia arvioita), ja .

Koska haluamme sen olevan mahdollisimman samankaltainen kuin mahdollista , yhdistämme näiden satunnaismuuttujien varianssit:

Laske satunnaismuuttujan varianssi :

Täältä:

Lopulta meillä on nollahypoteesin voimassa ollessa:

,

missä sijaitsee:

Riittävän suurilla otoskooilla voimme käyttää normaalia approksimaatiota:

Welchin kahden näytteen t-testi riippumattomille näytteille

Olkoon kaksi riippumatonta näytettä normaalijakautuneista satunnaismuuttujista:

Nollahypoteesin alla laskemme seuraavat tilastot:

Olkoon vaihtoehtoinen hypoteesi .

Jos nollahypoteesi pitää paikkansa, jakauma on suunnilleen Studentin jakauma vapausasteilla:

,

missä sijaitsee:

Siksi, jos havaittujen tilastojen arvo absoluuttisina arvoina ylittää tämän jakauman kriittisen arvon (tietyllä merkitsevyystasolla), nollahypoteesi hylätään.

Esimerkki

Seuraavissa esimerkeissä verrataan Studentin t-testiä ja Welchin t-testiä. Näytteet generoi Python - ohjelmointikielen numpy.random - moduuli .

Kaikissa kolmessa esimerkissä matemaattiset odotukset ovat samat ja vastaavasti.

Ensimmäisessä esimerkissä todelliset varianssit ovat ( ) ja otoskoot ( ). Merkitään vastaavilla satunnaisnäytteillä:

Toisessa esimerkissä todelliset varianssit ovat eriarvoisia ( , ) ja otoskoot ovat eriarvoisia ( , ). Pienemmällä otoksella on suurempi varianssi:

Kolmannessa esimerkissä todelliset varianssit ovat eriarvoisia ( , ) ja otoskoot ovat eriarvoisia ( , ). Suuremmalla otoksella on suurempi varianssi:

Näyte Näyte Opiskelijan t-testi Welchin t-testi
Esimerkki -arvo -arvo -arvo -arvo
yksi viisitoista 20.29 4.61 viisitoista 22.67 4.35 -3.07 28 0,005 0,005 −3.07 28.0 0,005 0,004
2 kymmenen 21.10 21.01 kaksikymmentä 22.22 1.04 −1.06 28 0,299 0,465 -0,76 9.57 0,464 0,459
3 kymmenen 20.27 1.31 kaksikymmentä 22.89 16.69 −1,97 28 0,059 0,015 −2.66 23.28 0,014 0,018

Samalla varianssilla ja yhtä suurella otoskoolla Studentin t-testi ja Welchin t-testi antoivat suunnilleen saman tuloksen (esimerkki 1). Epätasaisten varianssien tapauksessa Welchin t-testi arvioi tilaston todellisen jakauman tarkemmin kuin Studentin t-testi ( Welchin t-testin -arvo on lähempänä simuloitua -arvoa kuin Studentin t-testissä).

Jos ei tiedetä, ovatko näiden kahden populaation varianssit yhtä suuret, ei ole ehdottomasti suositeltavaa tehdä esitestejä varianssien yhtäläisyyden määrittämiseksi, vaan on parempi käyttää heti Welchin t-testiä. [yksi]

Toteutus erilaisissa ohjelmistoissa

Ohjelmointikieli/ohjelmisto Toiminto Merkintä
libreoffice TTEST(Data1; Data2; Mode; Type) Lue lisää [2]
MATLAB ttest2(data1, data2, 'Vartype', 'unequal') Lue lisää [3]
Microsoft Excel ennen 2010 TTEST(array1, array2, tails, type) Lue lisää [4]
Microsoft Excel 2010 ja uudemmat T.TEST(array1, array2, tails, type)taiТТЕСТ(массив1;массив2;хвосты;тип) Lue lisää [5] [6]
Python scipy.stats.ttest_ind(a, b, equal_var=False) Lue lisää [7]
R t.test(data1, data2, alternative="two.sided", var.equal=FALSE) Lue lisää [8]
Haskell Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2 Lue lisää [9]
Julia UnequalVarianceTTest(data1, data2) Lue lisää [10]
Osavaltio ttest varname1 == varname2, welch Lue lisää [11]
Google Sheets TTEST(range1, range2, tails, type) Lue lisää [12]

Kirjallisuus

BL Welch Opiskelija-ongelman yleistyminen, kun mukana on useita erilaisia ​​populaatiovariansseja // Voi. 34, nro. 1/2 (tammikuu 1947), s. 28-35

Muistiinpanot

  1. Epätasaisen varianssin t-testi on liian vähän käytetty vaihtoehto Studentin t-testille ja Mann-Whitneyn U-testille| Oxford Academic . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 10. elokuuta 2020.
  2. Tilastofunktiot Osa 5 - LibreOffice-ohje . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 28. helmikuuta 2014.
  3. Kahden otoksen t-testi - MATLAB ttest2 - MathWorks Iso-Britannia . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 5. elokuuta 2016.
  4. Arkistoitu kopio . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 21. maaliskuuta 2014.
  5. T.TEST-toiminto - Office-tuki . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 3. maaliskuuta 2014.
  6. TTEST (TTEST-toiminto) - Office-tuki
  7. scipy.stats.ttest_ind - SciPy v1.5.2 -viiteopas . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 23. lokakuuta 2013.
  8. R: Opiskelijan t-testi . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 29. marraskuuta 2016.
  9. Tilastot.Testi.OpiskelijaT . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 13. kesäkuuta 2021.
  10. Tervetuloa lukemaan Docs - HypothesisTests.jl:n uusinta dokumentaatiota . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 29. maaliskuuta 2016.
  11. Stata 16 -apu ttestiin . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 7. tammikuuta 2010.
  12. T.TEST - Docs Editorin ohje . Haettu 31. toukokuuta 2020. Arkistoitu alkuperäisestä 16. huhtikuuta 2021.