P-arvo

P-arvo ( englanniksi P-arvo ) , p-merkittävyystaso, p-kriteeri - todennäköisyys saada tietylle todennäköisyysmallille satunnaismuuttujan arvojen jakauman sama tai äärimmäinen tilastoarvo (aritmeettinen keskiarvo) , mediaani jne.), verrattuna aiemmin havaittuun, edellyttäen, että nollahypoteesi on totta.

P-arvojen ominaisuus on niiden epävakaus vastaavissa näytteissä , mikä voi olla este koetulosten toistettavuudelle [ 1] [2] [3] . Vaihtoehtoja P-arvojen käytölle ovat menetelmät, kuten pisteet tilastot ja Bayesin kerroin [4] [5] [6] .

Muodollinen määritelmä ja testausmenettely

Antaa olla tilasto , jota käytetään jonkin nollahypoteesin testaamiseen . Oletetaan, että jos nollahypoteesi on totta, niin tämän tilaston jakauma tunnetaan. Merkitse jakautumisfunktiota . P-arvo määritellään useimmiten (oikeakätistä vaihtoehtoa testattaessa) seuraavasti: $T(X)$ $H_{0}$ $F(t)=P(T<t)$

$P(t)=P(T>t)=1-F(t)$

Kun tarkistat vasenkätisen vaihtoehdon,

$P_{0}(t)=P(T<t)=F(t)$

Kaksisuuntaisessa testissä p-arvo on:

$P(t)=2\min(P_{0},P)$

Jos p(t) on pienempi kuin annettu merkitsevyystaso, niin nollahypoteesi hylätään vaihtoehtoisen hyväksi. Muuten sitä ei hylätä.

Tämän lähestymistavan etuna on, että voidaan nähdä millä merkittävyystasolla nollahypoteesi hylätään ja millä se hyväksytään, eli tilastollisten päätelmien luotettavuustaso on näkyvissä, tarkemmin sanottuna todennäköisyys nollahypoteesille. virhe, kun nollahypoteesi hylätään. Millä tahansa merkitsevyystasolla, joka on suurempi kuin nollahypoteesi, se hylätään, ja alemmilla arvoilla se ei ole. $s$

Kritiikki

Monet asiantuntijat ovat kritisoineet p -arvojen käyttöä nollahypoteesien testaamiseen lääketieteen ja luonnontieteissä. On huomattava, että niiden käyttö johtaa usein ensimmäisen tyyppisiin virheisiin ( väärä positiivinen ) [7] . Erityisesti Basic and Applied Social Psychology (BASP) -lehti kielsi vuonna 2015 kokonaan p - arvoja käyttävien artikkelien julkaisemisen . Lehden toimittajat selittivät tämän sanomalla, että ei ole kovin vaikeaa suorittaa tutkimusta, jossa p < 0,05 saadaan, ja niin alhaisista p -arvoista tulee liian usein tekosyy huonolaatuisille tutkimuksille [8] .

P-arvojen väärintulkinta

Yleisesti uskotaan, että P-arvot tulkitaan usein väärin ja niitä käytetään väärin [9] [10] [11] . Yksi käytäntö, joka on saanut erityistä kritiikkiä, on vaihtoehtoisen hypoteesin hyväksyminen mille tahansa P-arvolle, joka on nimellisesti pienempi kuin 0,05, ilman muita todisteita. Vaikka P-arvot ovat hyödyllisiä arvioitaessa, kuinka ristiriidassa tiedot ovat tietyn tilastollisen mallin kanssa, kontekstuaaliset tekijät, kuten "tutkimuksen suunnittelu, mittausten laatu, ulkoinen näyttö tutkittavasta ilmiöstä ja data-analyysin taustalla olevien oletusten luotettavuus", on otettava huomioon. ottaa myös huomioon [11] . Toinen ongelma on, että P-arvo ymmärretään usein väärin todennäköisyydeksi, että nollahypoteesi on totta [11] [12] . Jotkut asiantuntijat ovat ehdottaneet P-arvojen korvaamista vaihtoehtoisilla näyttömittareilla [11] , kuten luottamusvälillä [13] [14] , todennäköisyyssuhteella [15] [16] tai Bayesin kertoimella [17] [18] [19] , mutta akuutti keskustelu tällaisten vaihtoehtojen käyttömahdollisuuksista [20] [21] . Toiset ovat ehdottaneet kiinteiden merkitsevyyskynnysten poistamista ja P-arvojen tulkitsemista jatkuviksi arvoiksi, jotka kuvaavat todisteiden määrää nollahypoteesin todennäköisyyttä vastaan [22] [23] .

Katso myös

Muistiinpanot

↑ Cumming, 2008 .
↑ Nuzzo, 2014 .
↑ Halsey, Curran-Everett, Vowler et ai., 2015 .
↑ Cumming, 2010 .
↑ Taroni, Biedermann, Bozza, 2016 .
↑ Goodman, 2016 .
↑ Douglas H. Johnson. Tilastollisen merkitsevyystestauksen merkityksettömyys // Journal of Wildlife Management . - Wiley-VCH , 1999. - Voi. 3 , ei. 63 . - s. 763-772 .
↑ Chris Woolston. Psykologian lehti kieltää P-arvot (englanniksi) // Nature News. - 05-03-2015. — Voi. 519 , iss. 7541 . - s. 9-9 . - doi : 10.1038/519009f .
↑ Tilastotyökalun menettämät tiedemiehet siivilöidäkseen tutkimusfudgea tosiasiasta // Scientific American : aikakauslehti . - Springer Nature , 2015. - 16. huhtikuuta.
↑ Goodman S.N. Kohti todisteisiin perustuvia lääketieteellisiä tilastoja. 1 : P-arvon virhe // Annals of Internal Medicine : päiväkirja. - 1999. - Voi. 130 , ei. 12 . - s. 995-1004 . - doi : 10.7326/0003-4819-130-12-199906150-00008 . — PMID 10383371 .
↑ 1 2 3 4 Wasserstein, Ronald L.; Lazar, Nicole A.ASA:n lausunto p-arvoista: konteksti, prosessi ja tarkoitus // The American Statistician : päiväkirja. - 2016. - Vol. 70 . - s. 129-133 . - doi : 10.1080/00031305.2016.1154108 .
↑ Colquhoun, David. Tutkimus väärien löytöjen määrästä ja p-arvojen virheellisestä tulkinnasta // Royal Society Open Science : päiväkirja. - 2014. - Vol. 1 . — P. 140216 . - doi : 10.1098/rsos.140216 .
↑ Lee, Dong Kyu. Vaihtoehdot P-arvolle: luottamusväli ja vaikutuksen koko (englanniksi) // Korean Journal of Anesthesiology : päiväkirja. - 2017. - 7. maaliskuuta ( nide 69 , nro 6 ). - s. 555-562 . — ISSN 2005-6419 . - doi : 10.4097/kjae.2016.69.6.555 . — PMID 27924194 .
↑ Ranstam, J. Miksi P-arvokulttuuri on huono ja luottamusvälit parempi vaihtoehto // Nivelrikko ja rusto : päiväkirja. - 2012. - elokuu ( osa 20 , nro 8 ). - s. 805-808 . - doi : 10.1016/j.joca.2012.04.001 .
↑ Perneger, Thomas V. Todisteiden seulominen: Todennäköisyyssuhteet ovat vaihtoehtoja P-arvoille // BMJ : British Medical Journal : päiväkirja. - 2001. - 12. toukokuuta ( nide 322 , nro 7295 ). - s. 1184 . — ISSN 0959-8138 . — PMID 11379590 .
↑ Kuninkaallinen, Richard. Tilastollisen todisteen todennäköisyysparadigma // Tieteellisen todisteen luonne . - s. 119-152. doi : 10.7208 /chicago/9780226789583.003.0005 .
↑ Schimmack, Ulrich P-arvojen korvaaminen Bayes- tekijöillä: ihmelääke toistettavuuskriisiin psykologiassa . Toistettavuusindeksi (30. huhtikuuta 2015). Haettu: 7.3.2017. (määrätön)
↑ Marden, John I. Hypoteesin testaus: p-arvoista Bayesin tekijöihin // Journal of the American Statistical Association : Journal. - 2000. - joulukuu ( nide 95 , nro 452 ). - s. 1316 . - doi : 10.2307/2669779 .
↑ Stern, Hal S. Testi millä tahansa muulla nimellä: arvot, Bayes-tekijät ja tilastollinen päätelmä // Monimuuttujakäyttäytymistutkimus : päiväkirja. - 2016. - 16. helmikuuta ( osa 51 , nro 1 ). - s. 23-29 . - doi : 10.1080/00273171.2015.1099032 . — PMID 26881954 .
↑ Murtaugh, Paul A. P-arvojen puolustamiseksi (määrittämätön) // Ekologia. - 2014. - maaliskuu ( osa 95 , nro 3 ). - S. 611-617 . - doi : 10.1890/13-0590.1 .
↑ Aschwanden, Christie tilastotieteilijät löysivät yhden asian, josta he voivat olla samaa mieltä: on aika lopettaa P-arvojen väärinkäyttö . FiveThirtyEight (7. maaliskuuta 2016). (määrätön)
↑ Amrhein, Valentin; Korner-Nievergelt, Francis; Roth, Tobias. Maa on litteä (p > 0,05): merkittävyyskynnykset ja toistamattoman tutkimuksen kriisi // PeerJ : päiväkirja. - 2017. - Vol. 5 . — P.e3544 . - doi : 10.7717/peerj.3544 .
↑ Amrhein, Valentin; Grönlanti, Sander. Poista tilastollinen merkitsevyys sen sijaan, että määritä uudelleen // Nature Human Behavior : Journal. - 2017. - Vol. 1 . — P. 0224 . - doi : 10.1038/s41562-017-0224-0 .

Kirjallisuus

Cumming, G. Replikointi ja p-välit: p-arvot ennustavat tulevaisuutta vain epämääräisesti, mutta luottamusvälit toimivat paljon paremmin: [ eng. ] // Perspectives on Psychological Science . - 2008. - Voi. 3, ei. 4. - s. 286-300. - doi : 10.1111/j.1745-6924.2008.00079.x .
Cumming, G. P-arvojen ymmärtäminen, opettaminen ja käyttö // ICOTS-8 Conference Proceedings : Data and konteksti tilastokasvatuksessa: kohti todisteisiin perustuvaa yhteiskuntaa : [ eng. ] / C. Lukeminen (Toim.). - International Association for Statistical Education: International Statistical Institute , 2010. - ISBN 978-90-77713-54-9 .
Goodman, S.N. . Tilastollisen ja tieteellisen päättelyn yhdistäminen: Väärinkäsitys ja tilastollisen merkityksen väärinkäyttö haittaavat tiedettä : [ eng. ]//Tiede. - 2016. - Vol. 352, nro 6290. - s. 1180-1181. -doi:10.1126/science.aaf5406.
Halsey, LG Ailahteleva P-arvo tuottaa toistamattomia tuloksia : [ eng. ] / L.G. Halsey, D. Curran-Everett, S.L. Vowler [et ai.] // Nature Methods . - 2015. - Vol. 12, ei. 3. - s. 179-185. - doi : 10.1038/nmeth.3288 .
Nuzzo, R. Tilastolliset virheet: P-arvot, tilastollisen validiteetin "kultastandardi", eivät ole niin luotettavia kuin monet tiedemiehet olettavat: [ eng. ] // Luonto . - 2014. - Vol. 506, nro 7487. - s. 150-152. - doi : 10.1038/506150a .
Taroni, F. Tilastollisten hypoteesien testaus ja yleiset väärintulkinnat: Pitäisikö meidän luopua p-arvosta oikeuslääketieteellisissä sovelluksissa? : [ englanti ] ] / F. Taroni, A. Biedermann, S. Bozza // Forensic Science International . - 2016. - Vol. 259 (helmikuu). - P. e32-e36. - doi : 10.1016/j.forscint.2015.11.013 .

Linkit

Rubanovitš, A. V. Johdatus Bayesilaiseen analyysiin . Luentoesityksiä . IOGEN RAS . Haettu: 13.6.2016. (määrätön)

Sanakirjat ja tietosanakirjat	iso kiinalainen Britannica (verkossa)
Bibliografisissa luetteloissa	GND : 4605821-7