Heteroskedastisuus

Heteroskedastisuus on sovelletussa tilastossa (useimmiten ekonometriassa ) käytetty  käsite , joka tarkoittaa havaintojen heterogeenisuutta, joka ilmaistaan ​​regressiomallin (ekonometrisen) satunnaisvirheen epäidenttisenä (epävakiona) varianssina. Heteroskedastisuus on vastakohta homoskedastisuudelle , joka tarkoittaa havaintojen homogeenisuutta, eli mallin satunnaisvirheiden varianssin pysyvyyttä.

Satunnaisvirheiden heteroskedastisuuden esiintyminen johtaa pienimmän neliösumman menetelmällä saatujen arvioiden tehottomuuteen . Lisäksi tässä tapauksessa pienimmän neliösumman parametriestimaattien kovarianssimatriisin klassinen estimaatti osoittautuu puolueelliseksi ja kestämättömäksi . Siksi tilastolliset päätelmät saatujen arvioiden laadusta voivat olla riittämättömiä. Tässä suhteessa heteroskedastisuuden mallien testaus on yksi välttämättömistä toimenpiteistä regressiomallien rakentamiseksi.

Heteroskedastisuuden testaus

Ensimmäisenä approksimaationa heteroskedastisuuden esiintyminen voidaan nähdä joidenkin muuttujien, estimoidun riippuvaisen muuttujan tai havaintoluvun regressiojäännösten (tai niiden neliöiden) kaavioista. Näissä kaavioissa pisteiden leviäminen voi muuttua näiden muuttujien arvon mukaan.

Tarkempaan todentamiseen käytetään esimerkiksi Whiten , Goldfeld -Kuandtin , Broish- Paganin , Parkin , Glaserin ja Spearmanin tilastollisia testejä .

Mallin arviointi heteroskedastisuuden alla

Koska malliparametrien pienimmän neliösumman estimaatit pysyvät puolueettomasti johdonmukaisina heteroskedastisuuden kanssa, niin riittävällä määrällä havaintoja on mahdollista käyttää tavallisia pienimmän neliösumman arvoja. Tarkempia ja oikeampia tilastollisia päätelmiä varten on kuitenkin tarpeen käyttää standardivirheitä Whiten muodossa .

Tapoja vähentää heteroskedastisuutta

  1. Painotettujen pienimmän neliösumman (WLS) käyttö . Tässä menetelmässä jokainen havainto painotetaan käänteisesti kyseisen havainnon satunnaisvirheen arvioidun keskihajonnan kanssa. Tämä lähestymistapa tekee mahdolliseksi tehdä mallin satunnaisista virheistä homoskedastisia. Erityisesti, jos virheiden keskihajonnan oletetaan olevan verrannollinen johonkin muuttujaan , data jaetaan kyseisellä muuttujalla, mukaan lukien vakio.
  2. Alkuperäisen tiedon korvaaminen sen johdannaisilla, kuten logaritmilla, suhteellisella muutoksella tai muulla epälineaarisella funktiolla. Tätä lähestymistapaa käytetään usein, kun virhevarianssi kasvaa riippumattoman muuttujan arvon mukana ja johtaa varianssin stabiloitumiseen laajemmalla syöttödata-alueella.
  3. Sellaisten mallien "kompetenssikenttien" määrittäminen, joiden sisällä virhevarianssi on suhteellisen vakaa, ja mallien yhdistelmän käyttäminen. Siten jokainen malli toimii vain oman toimivaltansa alueella, eikä virhevarianssi ylitä määritettyä raja-arvoa. Tämä lähestymistapa on yleinen hahmontunnistuksen alalla, jossa käytetään usein monimutkaisia ​​epälineaarisia malleja ja heuristiikkaa.

Esimerkki

Tarkastellaanpa esimerkiksi voiton riippuvuutta omaisuuden koosta:

.

Todennäköisesti ei kuitenkaan vain voitto riipu varallisuudesta, vaan myös voiton "vaihtelu" ei ole sama jollekin omaisuusmäärälle. Eli todennäköisimmin mallin satunnaisvirheen keskihajonnan pitäisi olettaa olevan verrannollinen omaisuuden arvoon:

.

Tässä tapauksessa on järkevämpää harkita alkuperäisen mallin sijasta seuraavaa:

,

olettaen, että satunnaiset virheet ovat homoskedastisia tässä mallissa. Voit käyttää tätä muunnettua mallia suoraan tai voit käyttää saatuja parametriestimaatteja alkuperäisen mallin parametriestimaateina (painotetut pienimmän neliösummat). Teoriassa tällä tavalla saatujen arvioiden pitäisi olla parempia.

Katso myös

Kirjallisuus