Kolmogorovin sopivuuskriteeri

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 13. syyskuuta 2013 tarkistetusta versiosta . vahvistus vaatii 21 muokkausta .

Kolmogorovin sopivuustesti on suunniteltu testaamaan hypoteesia, että otos kuuluu johonkin jakautumislakiin, eli tarkistaa, että empiirinen jakauma vastaa odotettua mallia .

Smirnovin homogeenisuuskriteerillä  testataan hypoteesia, että kaksi riippumatonta otosta kuuluu samaan jakautumislakiin, eli että kaksi empiiristä jakaumaa vastaavat samaa lakia .

Nämä kriteerit on nimetty matemaatikoiden Andrei Nikolajevitš Kolmogorovin ja Nikolai Vasilievich Smirnovin mukaan .

Smirnovin kriteeri kahden empiirisen jakauman lain homogeenisuushypoteesin testaamiseksi on yksi yleisimmin käytetyistä ei- parametrisista kriteereistä .

Kuvaus

Jos kriteerit vertaavat kahden jakauman taajuuksia erikseen jokaiselle numerolle, niin tässä verrataan ensin ensimmäisen numeron frekvenssiä, sitten ensimmäisen ja toisen numeron summaa, sitten ensimmäisen, toisen ja kolmannen numeron summaa, jne. Siten joka kerta kertynyt tälle taajuusalueelle.

Jos erot näiden kahden jakauman välillä ovat merkittäviä, niin ero kumuloituneissa taajuuksissa saavuttaa jossain vaiheessa kriittisen arvon, ja eroja voidaan pitää tilastollisesti merkittävinä.  Tämä ero sisältyy kriteerikaavaan . Mitä suurempi empiirinen arvo on, sitä merkittävämpiä ovat erot.

Kolmogorov-testin tilastot

Olkoon otokseen rakennetun empiirisen jakaumafunktion (EDF) muoto:

missä osoittaa, osuiko havainto alueelle :

Tarkistetaan , onko näyte generoitu satunnaismuuttuja jakaumafunktiolla . Empiirisen jakaumafunktion testitilasto määritellään seuraavasti:

missä by  on funktion supremmi .

Kolmogorov-tilastojen jakauma

Merkitään nollahypoteesi hypoteesiksi , että näyte noudattaa jakaumaa . Sitten Kolmogorov-lauseen mukaan käyttöönotetulle tilastolle on totta:

Otamme huomioon, että kriteerissä on oikeakätinen kriittinen alue .

Päätöksen tekeminen Kolmogorov-kriteerin mukaan.
Jos tilasto ylittää tietyn merkitsevyystason Kolmogorov-jakauman prosenttiyksikön , nollahypoteesi (lain noudattamisesta ) hylätään. Muussa tapauksessa hypoteesi hyväksytään tasolla .

Jos se on tarpeeksi lähellä 1:tä, se voidaan arvioida kaavalla:

Testin asymptoottinen teho on 1.

Merkitään nyt nollahypoteesi hypoteesina , että kaksi tutkittavaa näytettä noudattavat samaa satunnaismuuttujan jakaumaa .

Smirnovin lause.
Olkoon tilavuuden ja satunnaismuuttujan riippumattomista näytteistä muodostettuja empiirisiä jakaumafunktioita . Sitten, jos , niin missä .

Smirnovin lause antaa meille mahdollisuuden rakentaa kriteeri kahden näytteen homogeenisuuden testaamiseksi.

Päätöksen tekeminen Smirnov-kriteerin mukaan.
Jos tilastot ylittävät Kolmogorovin jakauman kvantiilin tietyllä merkitsevyystasolla , nollahypoteesi ( näytteiden homogeenisuudesta) hylätään. Muussa tapauksessa hypoteesi hyväksytään tasolla .

Katso myös

Huomautus 1

Kolmogorov-kriteerissä on parempi käyttää tilastoja Bolshevin korjauksella seuraavassa muodossa . Näiden tilastojen jakautuminen ei ole enää niin paljoa riippuvainen otoksen koosta. Sen jakauman riippuvuus otoksen koosta voidaan jättää huomiotta .

Huomautus 2

Klassinen Kolmogorov-testi on suunniteltu testaamaan yksinkertaisia ​​hypoteeseja . Jos testataan hypoteesia havaitun otoksen yhteensopivuudesta lain kanssa, jonka kaikki parametrit ovat tiedossa, niin Kolmogorov -kriteeri on jakautumisvapaa : ei ole väliä millä lailla sopimus tarkistetaan. Jos testattava hypoteesi pitää paikkansa, Kolmogorovin tilaston rajoittava jakauma on Kolmogorov-jakauma .

Kaikki muuttuu testattaessa monimutkaisia ​​hypoteeseja , kun analysoitu näyte arvioi teoreettisen lain parametreja, joiden yhteensopivuus tarkistetaan. Monimutkaisia ​​hypoteeseja testattaessa vapaus jakelusta menetetään. Monimutkaisia ​​hypoteeseja ja testattavan hypoteesin pätevyyttä testattaessa sovitetestien ei-parametrisen hyvyyden tilastojen (ja Kolmogorov-testin) jakaumat riippuvat useista tekijöistä: testattavaa hypoteesia vastaavan havaitun lain tyypistä; arvioitavan parametrin tyypistä ja arvioitavien parametrien lukumäärästä; joissakin tapauksissa tietyllä parametriarvolla (esimerkiksi gamma- ja beeta-jakaumien perheiden tapauksessa); parametrien estimointimenetelmästä. Erot samojen tilastojen marginaalijakaumissa yksinkertaisia ​​ja monimutkaisia ​​hypoteeseja testattaessa ovat niin merkittäviä, että niitä ei missään nimessä pidä jättää huomiotta.

Kolmogorov-kriteerin soveltamisesta monimutkaisten hypoteesien testaamiseen

Linkit