Welchin t-testi on Studentin jakaumaan perustuva testi, joka on suunniteltu testaamaan tilastollista hypoteesia sellaisten satunnaismuuttujien matemaattisten odotusten yhtäläisyydestä, joilla ei välttämättä ole yhtä suuria tunnettuja variansseja. Se on muunnos Studentin t-testistä . Nimetty brittiläisen tilastotieteilijän Bernard Lewis Welchin mukaan.
Kahden otoksen Studentin t-testin soveltamiseksi on välttämätöntä, että kahdella riippumattomalla näytteellä on normaali keskiarvojakauma ja todelliset varianssit ovat yhtä suuret. Welchin t-testin tapauksessa todelliset varianssit eivät välttämättä ole enää yhtä suuret, mutta oletus, että data on normaalijakaumaa, säilyy.
Olkoon kaksi riippumatonta näytettä normaalijakautuneista satunnaismuuttujista:
Testaamme seuraavaa nollahypoteesia matemaattisten odotusten yhtäläisyydestä:
Olkoon nollahypoteesi totta. Sitten ja . Olkoon ja ovat varianssien ja vastaavasti puolueettomat estimaatit . Lasketaan seuraavat tilastot:
Tehdään seuraava muunnos:
Ensimmäisen tilaston jakauma on standardi normaalijakauma:
Harkitse toista tilastoa ja kutsu sitä lisälaskelmia varten :
Tilasto muistuttaa khin neliön satunnaismuuttujaa jaettuna vapausasteilla, mutta ei sitä ole. Olkoon satunnaismuuttuja, jolla on khin neliöjakauma vapausasteiden kanssa. Sitten samoin . Huomaa nyt, että (koska käytämme varianssien puolueettomia arvioita), ja .
Koska haluamme sen olevan mahdollisimman samankaltainen kuin mahdollista , yhdistämme näiden satunnaismuuttujien varianssit:
Laske satunnaismuuttujan varianssi :
Täältä:
Lopulta meillä on nollahypoteesin voimassa ollessa:
,
missä sijaitsee:
Riittävän suurilla otoskooilla voimme käyttää normaalia approksimaatiota:
Olkoon kaksi riippumatonta näytettä normaalijakautuneista satunnaismuuttujista:
Nollahypoteesin alla laskemme seuraavat tilastot:
Olkoon vaihtoehtoinen hypoteesi .
Jos nollahypoteesi pitää paikkansa, jakauma on suunnilleen Studentin jakauma vapausasteilla:
,
missä sijaitsee:
Siksi, jos havaittujen tilastojen arvo absoluuttisina arvoina ylittää tämän jakauman kriittisen arvon (tietyllä merkitsevyystasolla), nollahypoteesi hylätään.
Seuraavissa esimerkeissä verrataan Studentin t-testiä ja Welchin t-testiä. Näytteet generoi Python - ohjelmointikielen numpy.random - moduuli .
Kaikissa kolmessa esimerkissä matemaattiset odotukset ovat samat ja vastaavasti.
Ensimmäisessä esimerkissä todelliset varianssit ovat ( ) ja otoskoot ( ). Merkitään vastaavilla satunnaisnäytteillä:
Toisessa esimerkissä todelliset varianssit ovat eriarvoisia ( , ) ja otoskoot ovat eriarvoisia ( , ). Pienemmällä otoksella on suurempi varianssi:
Kolmannessa esimerkissä todelliset varianssit ovat eriarvoisia ( , ) ja otoskoot ovat eriarvoisia ( , ). Suuremmalla otoksella on suurempi varianssi:
Näyte | Näyte | Opiskelijan t-testi | Welchin t-testi | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Esimerkki | -arvo | -arvo | -arvo | -arvo | ||||||||||
yksi | viisitoista | 20.29 | 4.61 | viisitoista | 22.67 | 4.35 | -3.07 | 28 | 0,005 | 0,005 | −3.07 | 28.0 | 0,005 | 0,004 |
2 | kymmenen | 21.10 | 21.01 | kaksikymmentä | 22.22 | 1.04 | −1.06 | 28 | 0,299 | 0,465 | -0,76 | 9.57 | 0,464 | 0,459 |
3 | kymmenen | 20.27 | 1.31 | kaksikymmentä | 22.89 | 16.69 | −1,97 | 28 | 0,059 | 0,015 | −2.66 | 23.28 | 0,014 | 0,018 |
Samalla varianssilla ja yhtä suurella otoskoolla Studentin t-testi ja Welchin t-testi antoivat suunnilleen saman tuloksen (esimerkki 1). Epätasaisten varianssien tapauksessa Welchin t-testi arvioi tilaston todellisen jakauman tarkemmin kuin Studentin t-testi ( Welchin t-testin -arvo on lähempänä simuloitua -arvoa kuin Studentin t-testissä).
Jos ei tiedetä, ovatko näiden kahden populaation varianssit yhtä suuret, ei ole ehdottomasti suositeltavaa tehdä esitestejä varianssien yhtäläisyyden määrittämiseksi, vaan on parempi käyttää heti Welchin t-testiä. [yksi]
Ohjelmointikieli/ohjelmisto | Toiminto | Merkintä |
---|---|---|
libreoffice | TTEST(Data1; Data2; Mode; Type) | Lue lisää [2] |
MATLAB | ttest2(data1, data2, 'Vartype', 'unequal') | Lue lisää [3] |
Microsoft Excel ennen 2010 | TTEST(array1, array2, tails, type) | Lue lisää [4] |
Microsoft Excel 2010 ja uudemmat | T.TEST(array1, array2, tails, type)taiТТЕСТ(массив1;массив2;хвосты;тип) | Lue lisää [5] [6] |
Python | scipy.stats.ttest_ind(a, b, equal_var=False) | Lue lisää [7] |
R | t.test(data1, data2, alternative="two.sided", var.equal=FALSE) | Lue lisää [8] |
Haskell | Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2 | Lue lisää [9] |
Julia | UnequalVarianceTTest(data1, data2) | Lue lisää [10] |
Osavaltio | ttest varname1 == varname2, welch | Lue lisää [11] |
Google Sheets | TTEST(range1, range2, tails, type) | Lue lisää [12] |