Varianssianalyysi

Varianssianalyysi  on matemaattisen tilaston menetelmä, jonka tarkoituksena on löytää riippuvuuksia kokeellisista tiedoista tutkimalla keskiarvojen erojen merkitystä [ 1] [2] . Toisin kuin t-testi , sen avulla voit verrata kolmen tai useamman ryhmän keskiarvoja. R. Fisherin kehittämä kokeellisten tutkimusten tulosten analysointia varten. Kirjallisuudesta löytyy myös nimitys ANOVA ( englanniksi ANalysis Of Variance ) [3] .  

ANOVA-tyypit

Varianssianalyysin ydin on tutkia yhden tai useamman riippumattoman muuttujan , joita yleensä kutsutaan tekijöiksi, vaikutusta riippuvaan muuttujaan . Riippuvia muuttujia edustavat absoluuttisten asteikkojen arvot (suhdeasteikko). Riippumattomat muuttujat ovat nimeäviä (nimiasteikko), eli ne kuvastavat ryhmään kuulumista, ja niillä voi olla kaksi tai useampia arvoja (tyyppi, asteikko tai taso). Esimerkkejä riippumattomasta muuttujasta , jolla on kaksi arvoa, olisi sukupuoli (nainen: , mies: ) tai hoitoryhmän tyyppi (kontrolli: , kokeellinen: ). Objektien riippumattomia näytteitä vastaavia gradaatioita kutsutaan ryhmien välisiksi ja riippumattomia näytteitä vastaaviksi ryhmän sisäisiksi.

Muuttujien tyypistä ja lukumäärästä riippuen on olemassa:

Varianssianalyysin matemaattinen malli

Dispersioanalyysin matemaattinen malli on lineaarisen perusmallin erikoistapaus . Käytetään menetelmiä useiden parametrien mittaamiseen, joiden tarkat arvot ovat . Tässä tapauksessa eri suureiden eri menetelmillä mittaustulokset voidaan esittää seuraavasti:

,

missä:

Sitten seuraavien satunnaismuuttujien varianssit: (jossa:




)

ilmaistaan ​​seuraavasti:

ja täyttää henkilöllisyyden:

Varianssianalyysimenettely koostuu systemaattisen (ryhmien välisen) varianssin ja satunnaisen (ryhmän sisäisen) varianssin suhteen määrittämisestä mitatuissa tiedoissa. Vaihtuvuuden indikaattorina käytetään parametrien arvojen keskiarvon poikkeaman neliöiden summaa: ( englanniksi. Sum of Squares ). Voidaan osoittaa, että neliöiden kokonaissumma jakautuu ryhmien väliseksi neliösummaksi ja ryhmän sisäiseksi neliösummaksi :

Olkoon kunkin parametrin tarkka arvo sen matemaattinen odotus, joka on yhtä suuri kuin perusjoukon keskiarvo . Jos systemaattisia virheitä ei ole, ryhmän keskiarvo ja perusjoukon keskiarvo ovat identtiset: . Tällöin satunnaismittausvirhe on mittaustuloksen ja ryhmän keskiarvon erotus: . Jos menetelmällä on systemaattinen vaikutus, niin systemaattinen virhe tämän tekijän vaikutuksesta on ryhmän keskiarvon ja perusjoukon keskiarvon erotus : .

Sitten yhtälö voidaan esittää seuraavasti:

, tai

.

Sitten

missä

Näin ollen

Vapausasteet jaetaan samalla tavalla:

missä

ja on koko otoksen koko ja  on ryhmien lukumäärä.

Sitten kunkin osan varianssi, jota kutsutaan varianssianalyysimallissa "keskinelioksi" tai ( englannin sanasta Mean Square ), on neliöiden summan suhde niiden vapausasteiden lukumäärään:

Ryhmien välisten ja ryhmien sisäisten varianssien suhteella on F -jakauma ( Fischer -jakauma ) ja se määritetään käyttämällä ( Fisherin F -kriteeri ):

Periaatteet ja sovellukset

Varianssianalyysin lähtökohdat ovat

Varianssianalyysin nollahypoteesi on väite keskiarvojen yhtäläisyydestä:

Kun nollahypoteesi hylätään, hyväksytään vaihtoehtoinen hypoteesi, että kaikki keskiarvot eivät ole samanarvoisia, eli on vähintään kaksi ryhmää, jotka eroavat toisistaan:

Jos ryhmiä on kolme tai useampia, keskiarvojen väliset erot määritetään post-hoc t -testeillä tai kontrastimenetelmällä .

Yksisuuntainen varianssianalyysi

Yksinkertaisin varianssianalyysin tapaus on yksiulotteinen yksisuuntainen analyysi kahdelle tai useammalle itsenäiselle ryhmälle, kun kaikki ryhmät yhdistetään yhden attribuutin mukaan. Analyysin aikana testataan nollahypoteesi keskiarvojen yhtäläisyydestä. Kahta ryhmää analysoitaessa varianssianalyysi on identtinen kahden otoksen Studentin t - testin kanssa riippumattomille näytteille ja F - tilaston arvo on yhtä suuri kuin vastaavan t - tilaston neliö .

Dispersioiden tasa-arvoa koskevan väitteen vahvistamiseksi käytetään yleensä Levenen testiä . Jos hypoteesi varianssien yhtäläisyydestä hylätään, pääanalyysiä ei voida soveltaa. Jos varianssit ovat yhtä suuret, niin ryhmien välisen ja ryhmän sisäisen vaihtelun suhdetta arvioidaan Fisherin F -kriteerillä :

Jos F -tilasto ylittää kriittisen arvon, nollahypoteesia ei voida hyväksyä (hylätä) ja tehdään johtopäätös keskiarvojen epätasaisuudesta. Kahden ryhmän keskiarvoja analysoitaessa tulokset voidaan tulkita heti Fisher-testin soveltamisen jälkeen .

Jos ryhmiä on kolme tai useampia, keskiarvojen parivertailu vaaditaan niiden välisten tilastollisesti merkitsevien erojen tunnistamiseksi. A priori -analyysi sisältää kontrastien menetelmän, jossa ryhmien välinen neliösumma jaetaan yksittäisten kontrastien neliösummaksi:

kun näiden kahden ryhmän keskiarvojen välillä on kontrasti, ja sitten Fisher- testiä käyttämällä tarkistetaan kunkin kontrastin keskineliön suhde ryhmän sisäiseen keskineliöön:

A posteriori -analyysi sisältää post-hoc t -testit Bonferroni- tai Scheffen menetelmillä sekä keskiarvoerojen vertailun Tukey-menetelmällä. Post hoc -testien ominaisuus on ryhmän sisäisen keskineliön käyttö minkä tahansa keskiarvoparin arvioimiseksi. Bonferronin ja Scheffen testit ovat konservatiivisimpia, koska ne käyttävät pienintä kriittistä aluetta tietyllä merkitsevyystasolla .

Keskiarvojen arvioinnin lisäksi varianssianalyysi sisältää determinaatiokertoimen määrityksen , joka osoittaa, minkä osuuden kokonaisvaihtelusta tämä tekijä selittää:

Monimuuttujavarianssianalyysi

, missä:

Toisin kuin yksimuuttujamallissa, jossa on yksi ryhmien välinen neliösumma, monimuuttujaanalyysimalli sisältää kunkin tekijän neliösummat erikseen ja kaikkien niiden välisten vuorovaikutusten neliösummat. Näin ollen kaksikerroisessa mallissa ryhmien välinen neliösumma jaetaan tekijän neliöiden summaksi, tekijän neliöiden summaksi sekä tekijöiden ja vuorovaikutuksen neliöiden summaksi :

Näin ollen kolmitekijämalli sisältää tekijän neliöiden summan, kertoimen neliöiden summan, tekijän neliöiden summan ja tekijöiden ja vuorovaikutusten neliöiden summan , ja , ja sekä kaikkien kolmen tekijän vuorovaikutukset :

Vapausasteita laajennetaan samalla tavalla:

missä

ja on koko näytteen tilavuus, on  tekijän  tasojen (ryhmien) lukumäärä ja tekijän tasojen (ryhmien) lukumäärä .

Analyysi testaa useita nollahypoteesia :

Jokainen hypoteesi testataan Fisher-kriteerillä:

Kun hylätään nollahypoteesi yksittäisen tekijän vaikutuksesta, hyväksytään väite, että tekijällä on päävaikutus ( jne.). Hylättäessä nollahypoteesi tekijöiden vuorovaikutuksesta hyväksytään väite, että tekijän vaikutus ilmenee eri tavalla tekijän eri tasoilla . Yleensä tässä tapauksessa yleisanalyysin tulokset tunnustetaan virheellisiksi ja tekijän vaikutus tarkistetaan erikseen jokaisella tekijän tasolla käyttämällä yksisuuntaista varianssianalyysiä tai t - testiä .

Muistiinpanot

  1. Varianssianalyysi . Haettu 15. maaliskuuta 2011. Arkistoitu alkuperäisestä 23. toukokuuta 2012.
  2. Dispersioanalyysi - artikkeli Great Soviet Encyclopediasta . Bolshev, L.N.. 
  3. A. D. Nasledov. Psykologisen tutkimuksen matemaattiset menetelmät. Pietari, 2008. ISBN 5-9268-0275-X

Kirjallisuus