Arvosanatilastot

Estimointitilastot ( Estimation Statistics ) on lähestymistapa  data - analyysiin , joka sisältää yhdistelmän menetelmiä: vaikutuksen koko , luottamusvälit , suunnittelun tarkkuus ja meta-analyysi kokeiden suunnittelua , tietojen analysointia ja tulosten tulkintaa varten. [1] Tämä lähestymistapa eroaa nollahypoteesin merkitsevyystestistä (NHST), jota pidetään vähemmän informatiivisena. [2] [3] Pisteytystilastoa tai yksinkertaisesti pisteytystä , joka tunnetaan myös nimellä uusi tilasto , [3] käytetään psykologiassa , lääketieteellisessä tutkimuksessa, biotieteissä ja monissa muissa kokeellisissa tieteissä, joissa testataan nollahypoteesi on edelleen yleinen lähestymistapa [4] huolimatta siitä, että viime vuosikymmeninä on suositeltu estimointitilastoja suositeltavin lähestymistavana. [5] [6]

Arviointitilaston päätarkoituksena on raportoida vaikutuksen koko (pisteestimaatti) sekä sen luottamusväli , joka liittyy arvion tarkkuuteen. [7] Luottamusväli on yhteenveto todennäköisten arvojen alueesta pääpopulaatiovaikutukselle. Pisteytystilastojen kannattajat ilmoittavat mieluummin vaikutuskoot niiden luottamusvälillä p-merkittävyystasojen sijaan [8] ja uskovat, että pisteytystilastojen tulisi korvata data- analyysin merkitsevyystestimenetelmä . [9]

Historia

Fysiikka on pitkään käyttänyt painotetun keskiarvon menetelmää , joka on samanlainen kuin meta-analyysi . [kymmenen]

Estimointitilastojen historia alkoi Jacob Cohenin 1960-luvulla kehittämällä standardisoitujen vaikutuskokojen . Ensimmäiset arvioivia tilastoja käyttävät tutkimukset olivat Gene W. Glassin edelläkävijä meta-analyysimenetelmän kehittämisen myötä 1970- luvulla. [11] Siitä lähtien estimointitilastomenetelmiä ovat jalostaneet Larry Hedges, Michael Borenstein, Doug Altman, Martin Gardner, Jeff Cumming ja muut. Systemaattinen tarkastelu yhdistettynä meta-analyysiin on siihen liittyvä menetelmä, jota käytetään laajasti lääketieteellisessä tutkimuksessa. Huolimatta meta-analyysin laajasta käytöstä, pisteytystilastollista lähestymistapaa ei vieläkään käytetä johdonmukaisesti valtavirran biolääketieteen tutkimuksessa. [neljä]

1990-luvulla toimittaja Kenneth Rothman kielsi p-arvojen käytön Epidemiology - lehdessä ; kirjoittajat tukivat aloitetta, mutta tämä ei vaikuttanut heidän analyyttiseen ajatteluun tutkimusta tehdessään. [12]

Viime aikoina arviointitilastomenetelmiä on sovellettu sellaisilla aloilla kuin neurotiede , koulutuspsykologia ja psykologia . [13]

American Psychological Associationin julkaisuohjeet suosittelevat hypoteesien estimoimista (estimointia) eikä testaamista (testausta). [14] Dokumentissa Uniform Requirements for Manuscripts Submitted to Biomedical Journals esitetään samanlainen suositus: "Vältä tukemasta pelkästään tilastollisiin hypoteesitestauksiin, kuten p-arvoihin , jotka eivät voi välittää tärkeitä tietoja vaikutusten koosta ." [viisitoista]

Vuonna 2019 Society for Neuroscience -lehti eNeuro esitteli politiikan, jossa suositellaan tulostilastokaavioiden käyttöä tiedon esittämiseen ensisijaisena menetelmänä. [16]

Metodologia

Monilla merkitsevyystesteillä on vastine arviointitilastoissa. [17] Lähes kaikissa tapauksissa testitulos (tai sen p-arvo ) voidaan yksinkertaisesti korvata efektin koolla ja tarkkuuspisteillä . Esimerkiksi Studentin t-testin sijaan analyytikko voi verrata kahta itsenäistä ryhmää laskemalla keskimääräisen eron ja sen 95 %:n luottamusvälin . Sopivia menetelmiä voidaan käyttää parilliseen t-testiin ja useisiin vertailuihin. Vastaavasti regressioanalyysiä varten analyytikon on raportoitava determinaatiokerroin (R 2 ) ja malliyhtälö mallin p-arvon sijaan .

Arvioivien tilastojen kannattajat suosittelevat kuitenkin tietojen analysointia ja esittämistä tietojen visualisoinnin avulla numeeristen laskelmien lisäksi. [2] [6] [7] Esimerkkejä sopivista visualisoinneista ovat hajontakäyrät regressiolle ja Gardner-Altman-kaaviot kahdelle itsenäiselle ryhmälle. [18] Vaikka klassiset juonit (kuten histogrammit , viiksilaatikot ja viulukuviot) eivät näytä vertailua, pistetilastokaavioihin lisätään toinen akseli tehosteen koon selkeästi visualisoimiseksi . [19]

Gardner-Altmanin juoni

Martin Gardner ja Doug Altman kuvasivat Gardner-Altmanin keskimääräisen erokäyrän ensimmäisen kerran vuonna 1986 [18] Tämä tilastollinen käyrä näyttää tietoja kahdesta riippumattomasta ryhmästä. [6] Kaaviosta on myös linkitetyille näytteille sopiva versio . Tärkeimmät ohjeet tämän kaavion rakentamiseen ovat: (1) piirrä kaikki havaitut arvot molemmille ryhmille vierekkäin; (2) aseta toinen akseli oikealle siirtämällä sitä näyttämään keskimääräisen eron asteikon ; ja (3) piirtää keskimääräisen eron sen luottamusvälillä merkkinä, jonka virhearvo on . [3] Gardner-Altman-kuvat voidaan luoda mukautetulla koodilla käyttämällä Ggplot2- , seaborn- tai DABEST-paketteja ; vaihtoehtoisesti analyytikko voi käyttää käteviä ohjelmistoja, kuten Estimation Stats -sovellusta .

Cummingin kaavio

Useille ryhmille Jeff Cumming esitteli ylimääräisen paneelin kahden tai useamman keskimääräisen eron ja niiden luottamusvälien piirtämiseksi , joka on sijoitettu havaittujen arvojen ensimmäisen paneelin alle [3] : tämä järjestely helpottaa keskimääräisten erojen ("deltoja") vertailua. useissa tietoryhmissä. Cumming-kuvaajat voidaan luoda käyttämällä ESCI- , DABEST- tai Estimation Stats -sovellusta .

Muut menetelmät

Keskimääräisen eron lisäksi on olemassa monia muita tehosteen kokotyyppejä , joilla on omat etunsa toisiinsa nähden. Tärkeimmät tyypit sisältävät Cohenin d-tyypin vaikutuskoot ja determinaatiokertoimen (R 2 ) regressioanalyysiä varten . Ei -normaalijakaumia varten on olemassa useita tehokkaampia tapoja laskea tehosteiden kokoja , mukaan lukien Cliff-delta ja Kolmogorov-Smirnov- tilastot .

Heikkoudet hypoteesitestauksessa

Hypoteesitestauksessa tilastollisen laskennan päätarkoitus on saada p-arvo ,  tietyn tuloksen näkemisen todennäköisyys tai äärimmäisempi tulos, jos nollahypoteesi oletetaan pitävän paikkansa. Jos p -arvo on pieni (yleensä <0,05), tilastotieteilijää neuvotaan hylkäämään nollahypoteesi . Estimointitilastojen kannattajat hylkäävät hypoteesien testauslähestymistavan [ 3 ] [7] seuraavista syistä:

Arviointitilastojen edut

Luottamusvälien edut

Luottamusvälit käyttäytyvät ennakoitavasti. Määritelmän mukaan 95 %: n luottamusvälillä on 95 %:n mahdollisuus saada populaation keskiarvo (μ). Tämä ominaisuus pysyy samana otoksen koon kasvaessa ; mikä muuttuu on se, että intervalli pienenee (tarkemmin). Lisäksi 95 %:n luottamusvälit ovat myös 83 %:n ennustevälejä: yksittäisen kokeen luottamusvälillä on 83 %:n mahdollisuus saada minkä tahansa tulevan kokeen keskiarvo . [3] Siten yksittäisen kokeen 95 % :n luottamusvälien tunteminen antaa analyytikolle uskottavan alueen populaation keskiarvolle ja uskottaville tuloksille kaikista myöhemmistä replikaatiokokeista .

Todisteisiin perustuvat tilastot

Tilastojen käsitystä koskevat psykologiset tutkimukset osoittavat, että pisteytysvälit tarjoavat tarkemman käsityksen tiedoista kuin p-arvojen raportit . [25]

Tarkka suunnittelu

Arvion tarkkuus määritellään muodollisesti 1/ varianssiksi ja tehoksi , joka kasvaa otoksen koon mukaan. Kuten teho , suuri tarkkuus on työvoimavaltaista. Tutkimusapurahahakemuksiin tulisi mieluiten sisältyä tarkkuus/kustannusanalyysi. Estimointitilastojen kannattajat uskovat, että tarkkuussuunnittelun tulisi korvata teho , koska itse tilastollinen teho liittyy käsitteellisesti merkitsevyystestaukseen . [3]

Muistiinpanot

  1. Ellis, Paul Tehosteen koko UKK . Haettu 20. tammikuuta 2021. Arkistoitu alkuperäisestä 26. tammikuuta 2021.
  2. ↑ 1 2 Cohen, Jacob Maa on pyöreä (p<.05) . Haettu 20. tammikuuta 2021. Arkistoitu alkuperäisestä 11. lokakuuta 2017.
  3. 1 2 3 4 5 6 7 Cumming, Geoff. Uusien tilastojen ymmärtäminen: tehosteiden koot, luottamusvälit ja meta-analyysi. – New York: Routledge, 2012.
  4. 1 2 Button, Katherine; John P. A. Ioannidis; Claire Mokrysz; Brian A. Nosek; Jonathan Flint; Emma SJ Robinson; Marcus R. Munafò (2013). "Virtakatkos: miksi pieni otoskoko heikentää neurotieteen luotettavuutta." Luontoarvostelut Neuroscience . 14 (5): 365-76. DOI : 10.1038/nrn3475 . PMID23571845  . _
  5. Altman, Douglas. Käytännön tilastoja lääketieteellistä tutkimusta varten . - Lontoo: Chapman ja Hall, 1991.
  6. ↑ 1 2 3 Tilastot luottavaisin mielin / Douglas Altman. – Lontoo: Wiley-Blackwell, 2000.
  7. 1 2 3 Cohen, Jacob (1990). "Mitä olen oppinut (toistaiseksi)" . Amerikkalainen psykologi . 45 (12): 1304. DOI : 10.1037/0003-066x.45.12.1304 . Arkistoitu alkuperäisestä 2021-01-21 . Haettu 20.01.2021 . Käytöstä poistettu parametri |deadlink=( ohje )
  8. Ellis, Paul Miksi en voi vain arvioida tulostani katsomalla p-arvoa? (31. toukokuuta 2010). Haettu 5. kesäkuuta 2013. Arkistoitu alkuperäisestä 28. tammikuuta 2021.
  9. Claridge-Chang, Adam; Assam, Pryseley N (2016). "Estimointitilastojen tulisi korvata merkitsevyystestaus" . Luontomenetelmät . 13 (2): 108-109. DOI : 10.1038/nmeth.3729 . PMID26820542  _ _ S2CID  205424566 . Arkistoitu alkuperäisestä 2021-01-22 . Haettu 20.01.2021 . Käytöstä poistettu parametri |deadlink=( ohje )
  10. Hedges, Larry (1987). "Kuinka kovaa on kova tiede, kuinka pehmeä on pehmeä tiede . " Amerikkalainen psykologi . 42 (5): 443. CiteSeerX  10.1.1.408.2317 . DOI : 10.1037/0003-066x.42.5.443 .
  11. Hunt, Morton. Kuinka tiede arvioi: meta-analyysin tarina . - New York: Russell Sage Foundation, 1997. - ISBN 978-0-87154-398-1 .
  12. Fidler, Fiona (2004). "Toimittajat voivat johtaa tutkijoita luottamusväliin, mutta eivät saa heitä ajattelemaan" . Psykologinen tiede . 15 (2): 119-126. DOI : 10.1111/j.0963-7214.2004.01502008.x . PMID  14738519 . S2CID  21199094 .
  13. Cumming, Geoff ESCI (Exploratory Software for Confidence Intervals) . Haettu 20. tammikuuta 2021. Arkistoitu alkuperäisestä 29. joulukuuta 2013.
  14. American Psychological Associationin julkaisukäsikirja, kuudes painos . Käyttöpäivä: 17. toukokuuta 2013. Arkistoitu alkuperäisestä 5. maaliskuuta 2013.
  15. Yhtenäiset vaatimukset biolääketieteellisiin lehtiin lähetetyille käsikirjoituksille (downlink) . Haettu 17. toukokuuta 2013. Arkistoitu alkuperäisestä 15. toukokuuta 2013. 
  16. Tapa, jolla raportoimme, tulkitsemme ja keskustelemme tuloksistamme, luotamme uudelleen luottamuksen tutkimukseemme . Haettu 20. tammikuuta 2021. Arkistoitu alkuperäisestä 22. tammikuuta 2021.
  17. Cumming, Geoff. Johdatus uusiin tilastoihin: Estimation, Open Science ja Beyond / Geoff Cumming, Robert Calin-Jageman. - Routledge, 2016. - ISBN 978-1138825529 .
  18. ↑ 12 Gardner , MJ; Altman, DG (1986-03-15). "Luottamusvälit P-arvojen sijaan: estimointi hypoteesien testaamisen sijaan" . British Medical Journal (Clinical Research Edit.) . 292 (6522): 746-750. DOI : 10.1136/bmj.292.6522.746 . ISSN  0267-0623 . PMC  1339793 . PMID  3082422 .
  19. Ho, Joses; Tumkaya; Arial; Choi; Claridge-Chang (2018). "Siirtyminen P-arvojen ulkopuolelle: Päivittäinen data-analyysi estimointikaavioilla" . bioRxiv : 377978. doi : 10.1101 /377978 . Arkistoitu alkuperäisestä 28-07-2018 . Haettu 20.01.2021 . Käytöstä poistettu parametri |deadlink=( ohje )
  20. Baril GL, Cannon JT Millä todennäköisyydellä nollahypoteesin testaus on merkityksetöntä? (Englanti). – 1995.
  21. Cohen, Jacob (1994). "Maa on pyöreä (p < .05)". Amerikkalainen psykologi . 49 (12): 997-1003. DOI : 10.1037/0003-066X.49.12.997 .
  22. Ellis, Paul. Vaikutuskokojen olennainen opas: tilastollinen teho, meta-analyysi ja tutkimustulosten tulkinta. - Cambridge: Cambridge University Press, 2010.
  23. Merkitystestin kiista: Lukija / Denton E. Morrison, Ramon E. Henkel. - Aldine Transaction, 2006. - ISBN 978-0202308791 .
  24. Cumming, Geoff Dance p-arvoista . Haettu 20. tammikuuta 2021. Arkistoitu alkuperäisestä 13. helmikuuta 2021.
  25. Beyth-Marom, R; Fidler, F.; Cumming, G. (2008). "Tilastollinen kognitio: Kohti näyttöön perustuvaa käytäntöä tilastoissa ja tilastokasvatuksessa". Statistics Education Research Journal . 7 :20-39.