Varianssianalyysi on matemaattisen tilaston menetelmä, jonka tarkoituksena on löytää riippuvuuksia kokeellisista tiedoista tutkimalla keskiarvojen erojen merkitystä [ 1] [2] . Toisin kuin t-testi , sen avulla voit verrata kolmen tai useamman ryhmän keskiarvoja. R. Fisherin kehittämä kokeellisten tutkimusten tulosten analysointia varten. Kirjallisuudesta löytyy myös nimitys ANOVA ( englanniksi ANalysis Of Variance ) [3] .
Varianssianalyysin ydin on tutkia yhden tai useamman riippumattoman muuttujan , joita yleensä kutsutaan tekijöiksi, vaikutusta riippuvaan muuttujaan . Riippuvia muuttujia edustavat absoluuttisten asteikkojen arvot (suhdeasteikko). Riippumattomat muuttujat ovat nimeäviä (nimiasteikko), eli ne kuvastavat ryhmään kuulumista, ja niillä voi olla kaksi tai useampia arvoja (tyyppi, asteikko tai taso). Esimerkkejä riippumattomasta muuttujasta , jolla on kaksi arvoa, olisi sukupuoli (nainen: , mies: ) tai hoitoryhmän tyyppi (kontrolli: , kokeellinen: ). Objektien riippumattomia näytteitä vastaavia gradaatioita kutsutaan ryhmien välisiksi ja riippumattomia näytteitä vastaaviksi ryhmän sisäisiksi.
Muuttujien tyypistä ja lukumäärästä riippuen on olemassa:
Dispersioanalyysin matemaattinen malli on lineaarisen perusmallin erikoistapaus . Käytetään menetelmiä useiden parametrien mittaamiseen, joiden tarkat arvot ovat . Tässä tapauksessa eri suureiden eri menetelmillä mittaustulokset voidaan esittää seuraavasti:
,
missä:
Sitten seuraavien satunnaismuuttujien varianssit: (jossa:
)
ilmaistaan seuraavasti:
ja täyttää henkilöllisyyden:
Varianssianalyysimenettely koostuu systemaattisen (ryhmien välisen) varianssin ja satunnaisen (ryhmän sisäisen) varianssin suhteen määrittämisestä mitatuissa tiedoissa. Vaihtuvuuden indikaattorina käytetään parametrien arvojen keskiarvon poikkeaman neliöiden summaa: ( englanniksi. Sum of Squares ). Voidaan osoittaa, että neliöiden kokonaissumma jakautuu ryhmien väliseksi neliösummaksi ja ryhmän sisäiseksi neliösummaksi :
Olkoon kunkin parametrin tarkka arvo sen matemaattinen odotus, joka on yhtä suuri kuin perusjoukon keskiarvo . Jos systemaattisia virheitä ei ole, ryhmän keskiarvo ja perusjoukon keskiarvo ovat identtiset: . Tällöin satunnaismittausvirhe on mittaustuloksen ja ryhmän keskiarvon erotus: . Jos menetelmällä on systemaattinen vaikutus, niin systemaattinen virhe tämän tekijän vaikutuksesta on ryhmän keskiarvon ja perusjoukon keskiarvon erotus : .
Sitten yhtälö voidaan esittää seuraavasti:
, tai
.
Sitten
missä
Näin ollen
Vapausasteet jaetaan samalla tavalla:
missä
ja on koko otoksen koko ja on ryhmien lukumäärä.
Sitten kunkin osan varianssi, jota kutsutaan varianssianalyysimallissa "keskinelioksi" tai ( englannin sanasta Mean Square ), on neliöiden summan suhde niiden vapausasteiden lukumäärään:
Ryhmien välisten ja ryhmien sisäisten varianssien suhteella on F -jakauma ( Fischer -jakauma ) ja se määritetään käyttämällä ( Fisherin F -kriteeri ):
Varianssianalyysin lähtökohdat ovat
Varianssianalyysin nollahypoteesi on väite keskiarvojen yhtäläisyydestä:
Kun nollahypoteesi hylätään, hyväksytään vaihtoehtoinen hypoteesi, että kaikki keskiarvot eivät ole samanarvoisia, eli on vähintään kaksi ryhmää, jotka eroavat toisistaan:
Jos ryhmiä on kolme tai useampia, keskiarvojen väliset erot määritetään post-hoc t -testeillä tai kontrastimenetelmällä .
Yksinkertaisin varianssianalyysin tapaus on yksiulotteinen yksisuuntainen analyysi kahdelle tai useammalle itsenäiselle ryhmälle, kun kaikki ryhmät yhdistetään yhden attribuutin mukaan. Analyysin aikana testataan nollahypoteesi keskiarvojen yhtäläisyydestä. Kahta ryhmää analysoitaessa varianssianalyysi on identtinen kahden otoksen Studentin t - testin kanssa riippumattomille näytteille ja F - tilaston arvo on yhtä suuri kuin vastaavan t - tilaston neliö .
Dispersioiden tasa-arvoa koskevan väitteen vahvistamiseksi käytetään yleensä Levenen testiä . Jos hypoteesi varianssien yhtäläisyydestä hylätään, pääanalyysiä ei voida soveltaa. Jos varianssit ovat yhtä suuret, niin ryhmien välisen ja ryhmän sisäisen vaihtelun suhdetta arvioidaan Fisherin F -kriteerillä :
Jos F -tilasto ylittää kriittisen arvon, nollahypoteesia ei voida hyväksyä (hylätä) ja tehdään johtopäätös keskiarvojen epätasaisuudesta. Kahden ryhmän keskiarvoja analysoitaessa tulokset voidaan tulkita heti Fisher-testin soveltamisen jälkeen .
Jos ryhmiä on kolme tai useampia, keskiarvojen parivertailu vaaditaan niiden välisten tilastollisesti merkitsevien erojen tunnistamiseksi. A priori -analyysi sisältää kontrastien menetelmän, jossa ryhmien välinen neliösumma jaetaan yksittäisten kontrastien neliösummaksi:
kun näiden kahden ryhmän keskiarvojen välillä on kontrasti, ja sitten Fisher- testiä käyttämällä tarkistetaan kunkin kontrastin keskineliön suhde ryhmän sisäiseen keskineliöön:
A posteriori -analyysi sisältää post-hoc t -testit Bonferroni- tai Scheffen menetelmillä sekä keskiarvoerojen vertailun Tukey-menetelmällä. Post hoc -testien ominaisuus on ryhmän sisäisen keskineliön käyttö minkä tahansa keskiarvoparin arvioimiseksi. Bonferronin ja Scheffen testit ovat konservatiivisimpia, koska ne käyttävät pienintä kriittistä aluetta tietyllä merkitsevyystasolla .
Keskiarvojen arvioinnin lisäksi varianssianalyysi sisältää determinaatiokertoimen määrityksen , joka osoittaa, minkä osuuden kokonaisvaihtelusta tämä tekijä selittää:
, missä:
Toisin kuin yksimuuttujamallissa, jossa on yksi ryhmien välinen neliösumma, monimuuttujaanalyysimalli sisältää kunkin tekijän neliösummat erikseen ja kaikkien niiden välisten vuorovaikutusten neliösummat. Näin ollen kaksikerroisessa mallissa ryhmien välinen neliösumma jaetaan tekijän neliöiden summaksi, tekijän neliöiden summaksi sekä tekijöiden ja vuorovaikutuksen neliöiden summaksi :
Näin ollen kolmitekijämalli sisältää tekijän neliöiden summan, kertoimen neliöiden summan, tekijän neliöiden summan ja tekijöiden ja vuorovaikutusten neliöiden summan , ja , ja sekä kaikkien kolmen tekijän vuorovaikutukset :
Vapausasteita laajennetaan samalla tavalla:
missä
ja on koko näytteen tilavuus, on tekijän tasojen (ryhmien) lukumäärä ja tekijän tasojen (ryhmien) lukumäärä .
Analyysi testaa useita nollahypoteesia :
Jokainen hypoteesi testataan Fisher-kriteerillä:
Kun hylätään nollahypoteesi yksittäisen tekijän vaikutuksesta, hyväksytään väite, että tekijällä on päävaikutus ( jne.). Hylättäessä nollahypoteesi tekijöiden vuorovaikutuksesta hyväksytään väite, että tekijän vaikutus ilmenee eri tavalla tekijän eri tasoilla . Yleensä tässä tapauksessa yleisanalyysin tulokset tunnustetaan virheellisiksi ja tekijän vaikutus tarkistetaan erikseen jokaisella tekijän tasolla käyttämällä yksisuuntaista varianssianalyysiä tai t - testiä .
![]() | |
---|---|
Bibliografisissa luetteloissa |
Pienin neliösumma ja regressioanalyysi | |||||||||
---|---|---|---|---|---|---|---|---|---|
Laskennalliset tilastot |
| ||||||||
Korrelaatio ja riippuvuus |
| ||||||||
Taantumisanalyysi |
| ||||||||
Regressio tilastollisena mallina |
| ||||||||
Varianssihajotus |
| ||||||||
Mallitutkimus |
| ||||||||
Edellytykset |
| ||||||||
Kokeilun suunnittelu |
| ||||||||
Numeerinen likiarvo | |||||||||
Sovellukset |
|