Näytteen poikkeama

Otantaharha tilastoissa  on sellainen harha , jossa otos otetaan siten, että joillakin aiotun perusjoukon jäsenillä on pienempi tai suurempi otantatodennäköisyys muihin verrattuna . Tämän seurauksena populaatiosta (tai ei-ihmistekijästä) on puolueellinen otos [1] , jossa kaikki kohteet tai näytteet valittiin eri todennäköisyyksillä. [2] Jos tätä harhaa ei oteta huomioon, tuloksia voidaan virheellisesti pitää tutkittavana ilmiönä, ei otantamenetelmänä .

Lääketieteen alan näytteenottovirhettä pidetään joskus harhakäsityksenä [3] [4] . Itse asiassa selvennysvirhe on sama kuin otantavirhe [5] [6] , mutta joskus se erotetaan silti erilliseksi tilastovirheen tyypiksi [5] .

Ero valintavirheestä

Näytteenottoharhaa luonnehditaan yleensä valintabiasin alatyypiksi [ 7] , jopa joskus nimenomaan näytteenottobiasiksi määriteltynä, [8] [9] [10] , mutta muut määrittelevät sen erilliseksi tilastovirheen tyypiksi. [11] Niiden ero, vaikka enemmistö ei sitä tunnista, on se, että otannan harha on se virhe, joka voi kyseenalaistaa testin ulkoisen validiteetin (sen tulosten kyvyn päteä koko populaatioon), kun taas valintavirhe korreloi. vain testin aikana löydettyjen erojen tai yhtäläisyyksien sisäinen validiteetti . Siksi näytteenoton tai kohortin määrittelyn aikana tapahtuvat virheet voivat johtaa näytteenoton harhaan, ja sen jälkeen ilmenevät virheet voivat johtaa valintaharhaan.

Näytteenoton harhaa ja valintavirhettä käytetään kuitenkin usein vaihtokelpoisina. [12]

Laji

Oireihin perustuva näytteenotto

Tutkiessasi lääketieteellisiä raportteja joudut tahattomasti paradoksaal-anekdoottiseen tilaan. Tällaiset raportit sisältävät rakenteeltaan vain tietoa hoito- ja diagnoosimenetelmistä. Lapsella, jolla on ongelmia opiskelun ja kouluelämän kanssa, diagnosoidaan suurella todennäköisyydellä lukihäiriö , mutta lapsi, joka yrittää, opiskelee, mutta ei pärjää hyvin, ei. Diagnoosin saanut aiemmin tutkittu lapsi tutkitaan useammin uudelleen ja asetetaan uusiin tiloihin, mikä vääristää sairastumistilastoja . Vastaavasti ihmiset, jotka ovat kuulleet tällaisista diagnooseista, yhdistävät ne todennäköisemmin käyttäytymishäiriöihin tai henkiseen jälkeenjääneisyyteen , kun taas vanhemmat yrittävät suojata lapsiaan sellaisilta tarroilta, mikä herättää vielä suurempaa ennakkoluulottomuutta heitä kohtaan. Huolellisesti valitut ja tutkitut tutkimusraportit puolestaan ​​osoittavat, että tällaiset sairaudet ovat paljon yleisempiä eivätkä ole niin julmia kantajalleen kuin aiemmin luultiin.

Typistetty valinta sukutaulujen tutkimuksessa

Geneetikkojen kyky kerätä tietoja ihmisistä on rajallinen. Joten esimerkiksi tiedot mitä tahansa henkilön ominaisuudesta. Olemme kiinnostuneita tietämään, onko tämä ominaisuus synnynnäinen, kuten Mendelin mukaan yksinkertainen perinnöllisyys sanoo . Noudatan tämän lain sääntöjä, jos vanhemmilla ei ole tätä ominaisuutta, mutta sitä kantava alleeli on, he voivat mahdollisesti siirtää sen perinnöllisesti (eli heterotsygoottia ei ole määritelty). Tässä skenaariossa mahdollisuus, että lapsi perii tämän ominaisuuden, on 25 %. Herää kuitenkin seuraava kysymys: voimmeko sanoa, missä perheissä molemmat vanhemmat ovat kantajia (heterotsygoottisia), ellei lapsi, jolla saattaa jo olla näitä piirteitä, arvioi? Kuvaus on otettu Suttonin oppikirjasta. [13]

Kuvassa on kaikkien mahdollisten kaksilapsisten perheiden sukutaulut, joissa vanhemmat ovat kantajia (Aa).

Kuvassa näkyy myös todennäköisyys, jolta perhevalinta voi tapahtua, sekä sairaiden lasten valintatiheys. Käytetyn katkaistun valinnan tyypistä riippuen tutkija valitsee taajuuden 4 ⁄ 7 tai 5 ⁄ 8 , kun ominaisuus on olemassa.

Luolamiesefekti

Havaittava esimerkki valintaharhasta on luolamiesefekti. Useimmat nykyaikaiset käsitykset esihistoriallisista kansoista perustuvat luolapiirustuksiin , jotka valmistuivat noin 40 000 vuotta sitten. Samoin palopaikat, korsut , hautaukset jne. pysyvät ennallaan. Jos ihmiset maalaisivat puille, eläinten nahoille tai rinteille, kaikki tämä tieto katoaisi. Emme yhdistä esihistoriallisia ihmisiä luoliin siksi, että he kaikki olisivat eläneet luolissa koko ikänsä, vaan siksi, että vain luolien piirustusten sisältämä tieto on tullut meille. [13]

Näytteenoton harhasta johtuvat ongelmat

Otosharhan esiintymisen vuoksi ongelmia ilmenee, koska on mahdollista, että otoksen analysointia varten kerätyt tilastot ovat systemaattisesti vääriä. Otantaharha voi johtaa kyseisen populaatioparametrin systemaattiseen yli- tai aliarviointiin. Näytteenottovirhe syntyy, koska on lähes mahdotonta varmistaa näytteen puhdasta satunnaisuutta. Jos aliedustuksen prosenttiosuus on pieni, otosta voidaan pitää kohtuullisen keskiarvona satunnaisotokseen nähden. Lisäksi jos otos ei eroa merkittävästi tutkittavassa parametrissa, niin myös puolueellinen näyte voi silti toimia hyväksyttävänä estimaatina.

Sanalla ennakkoluulo on voimakas negatiivinen konnotaatio. Niinpä käy niin, että virheitä syntyy joskus ennakkoluuloisesta aikomuksesta vääristää tutkimustuloksia tai tieteellisiä petoksia . Tilastoanalyysissä systemaattiset virheet ovat yleinen matemaattinen ominaisuus, olivat ne sitten tahallisia tai tahattomia tai epätäydellisistä tutkimuslaitteistoista johtuvia. Vaikka jotkut henkilöt saattavat tarkoituksella käyttää puolueellista otantaa vääristääkseen tutkimustuloksia, useammin kuin ei, otantaharha itsessään on yksinkertaisesti vaikeus tarjota natiivisti edustavaa tietoa tai tietämättömyys harhan mahdollisuudesta koko tutkimus- ja analyysiprosessin ajan. Esimerkki harhan tosiasian tietämättä jättämisestä on yleisesti käytetty suhde (tunnetaan myös nimellä kertamuutos ) biologian eron mittana. Koska on helpompi saada suuri suhde kahdesta pienestä luvusta tietyllä erolla kuin suuri suhde kahdesta suuresta luvusta, joilla on merkittävä ero, merkittävät erot jätetään huomiotta, jolloin verrataan kahta suhteellisen suurta numeerista mittausta. Joskus eron (vähennyslasku) sijaan suhdetta (jakoa) käytettäessä voidaan kuulla "rajausharha", mikä saa tutkimustulokset siirtymään tieteen alueelta pseudotieteeseen (katso " Rajausongelma ").

Joissakin näytteissä käytetään puolueellista tilastolaskentaa, jonka avulla voit kuitenkin arvioida parametrin. Esimerkiksi Yhdysvaltain kansallinen terveystilastokeskus ottaa tarkoituksella yliotokseen pienempiä populaatioita useimmissa valtakunnallisissa tutkimuksissaan saadakseen riittävän tarkkuuden näiden ryhmien arvioinnissa. [14] Mainituissa tutkimuksissa käytetään otospainotusta (katso jäljempänä). Se mahdollistaa kaikkien etnisten ryhmien oikean arvioinnin. Jos kaikki yksittäiset ehdot täyttyvät (lähinnä kertoimen oikealla laskennalla ja käytöllä), tämä otos edustaa tarkkaa arviota tutkittavasta populaatioparametrista.

Historiallisia esimerkkejä

Klassinen esimerkki näytteen harhautumisesta ja siitä johtuvasta harhaanjohtamisesta tapahtui vuonna 1936. Äänestyksen alkuaikoina amerikkalaisen Literary Digest -lehden tutkijat keräsivät lähes kaksi miljoonaa postitse lähetettyä kyselyä, jotka ennustivat republikaanien ehdokkaan Alfred Landonin laajan enemmistön voittoa tulevissa Yhdysvaltain presidentinvaaleissa silloisen virkaan tulleen presidentin Franklin Rooseveltin yli . Itse asiassa kaikki oli juuri päinvastoin. Literary Digest -lehtien toimittajien kokoama kyselyotosjoukko koostui tämän lehden lukijoista sekä henkilöautoja omistavista ja puhelinten käyttäjistä. Tämä otos oli yliedustettu varakkaista ihmisistä, jotka erillisenä ryhmänä äänestivät todennäköisemmin republikaanien ehdokasta. Toisaalta George Gallupin vain 50 000 kansalaisen kysely ennusti menestyksekkäästi tulevien vaalien tulokset, mikä varmisti Gallupin kyselyjen suosion tulevaisuudessa .

Toinen klassinen esimerkki tapahtui vuoden 1948 presidentinvaaleissa . Vaaleja edeltävänä iltana Chicago Tribune julkaisi sanomalehteä otsikolla "Dew Beats Truman", joka myöhemmin osoittautui valheeksi. Aamulla lehteä pitelevä presidentti Harry S. Truman kuvattiin pilkallisen hymyn kanssa. Syy, miksi Tribune teki sen väärin, osoittautui, että heidän tutkimuksensa tehnyt toimittaja teki vain puhelinkyselyn. Kyselytekniikka oli silloin vielä lapsenkengissään, ja siksi harvat tutkijat eivät tienneet, että puhelimitse tehdyn otoksen edustavuus on yleensä nolla, koska se ei ota huomioon koko väestön etuja. Puhelimet eivät olleet tuolloin vielä yleisiä, ja siksi ne, joilla niitä oli, olivat todennäköisesti varakkaita, joilla oli vakituinen asuinpaikka. (Useimmissa kaupungeissa Bell-järjestelmän puhelinluettelo sisälsi samat nimet kuin Society Almanakka.) Toimittajat perustivat oletuksensa Gallupin kyselyyn, mutta jättivät huomiotta sen tosiasian, että se oli 2 viikkoa vanha. [16]

Ilmanlaatuanalyysit tutkivat epäpuhtauksia ( hiilimonoksidia , typpioksidia , typpidioksidia tai otsonia ), jotka usein osoittavat korkean korrelaation , koska ne kaikki tuotetaan samoilla kemiallisilla prosesseilla. Tämä korrelaatio riippuu paikasta (eli sijainnista) ja ajasta (eli ajanjaksosta). Siksi tietyn epäpuhtauden jakautuminen ei välttämättä ole edustettuna kaikkialla ja aina tasaisesti. Jos edullinen mittalaite kalibroidaan kentällä moniulotteiseen dataan, nimittäin vertailulaitteeseen, niin eri yhdisteiden suhdetta käytetään jo mallia standardoitaessa. Mittaustyökalua siirrettäessä voi saada virheellisiä tietoja. [17]

Varhaisin esimerkki näytteenottoharhasta on COVID-19-pandemia , kun analysoitaessa kuolleisuutta ja tapausten ikäjakaumaa eri maiden välillä tiedoissa oli eroja, jotka johtuivat juuri COVID-19-testattujen ihmisten otoksesta . [18] [19]

Tilastolliset korjaukset näytteen harhaan

Jos kokonaiset perusjoukot jätetään pois otoksesta, ei ole oikaisuja, joiden perusteella koko populaatio arvioidaan. Kuitenkin, jos jotkut ryhmät ovat enemmistönä ja niiden yliedustustaso voidaan arvioida, otospaino voi kompensoida harhaa. Valintamalli rajoittaa kuitenkin onnistuneen korjauksen mahdollisuutta. Jos joidenkin muuttujien arvot puuttuvat, menetelmät, joita yleensä käytetään harhan korjaamiseen, voivat epäonnistua. [kaksikymmentä]

Esimerkiksi kuvaannolliseen väestöön kuuluu 10 miljoonaa miestä ja 10 miljoonaa naista. Oletetaan, että puolueellinen otos on 100 henkilöä: 20 on miehiä ja 80 naisia. Tutkija voi kompensoida tätä epätasapainoa käyttämällä painotuskerrointa 2,5 jokaiselle miehelle ja 0,625 jokaiselle naiselle. Näillä manipuloinneilla arvio sovitetaan samojen tulosten tasolle kuin jos otos koostuisi 50 miehestä ja 50 naisesta, paitsi niissä tapauksissa, joissa miesten tai naisten todennäköisyys osallistua tutkimukseen on satunnainen tai erilainen.

Katso myös

Muistiinpanot

  1. Sampling Bias . Lääketieteellinen sanakirja . Haettu 23. syyskuuta 2009. Arkistoitu alkuperäisestä 10. maaliskuuta 2016.
  2. Puolueellinen näyte . TheFreeDictionary . - Mosby's Medical Dictionary, 8. painos. Haettu: 23.9.2009.
  3. R.J. Smith, R.G. Bryant. Metallisubstituutiot hiilihappoanhydraasi: halogenidi-ionien koetintutkimus  // Biochemical and Biophysical Research Communications. – 27.10.1975. - T. 66 , no. 4 . - S. 1281-1286 . — ISSN 0006-291X . - doi : 10.1016/0006-291x(75)90498-2 .
  4. UN Wiesmann, S. DiDonato, NN Herschkowitz. Klorokiinin vaikutus viljeltyihin fibroblasteihin: lysosomaalisten hydrolaasien vapautuminen ja niiden sisäänoton estäminen  // Biokemialliset ja biofysikaaliset tutkimukset. – 27.10.1975. - T. 66 , no. 4 . - S. 1338-1343 . — ISSN 1090-2104 . - doi : 10.1016/0006-291x(75)90506-9 .
  5. ↑ 1 2 W.A. Hendrickson, K.B. Ward. Atomimallit myohemerytriinin ja hemerytriinin polypeptidirungoille  // Biochemical and Biophysical Research Communications. – 27.10.1975. - T. 66 , no. 4 . - S. 1349-1356 . — ISSN 1090-2104 . - doi : 10.1016/0006-291x(75)90508-2 .
  6. YW Chow, R. Pietranico, A. Mukerji. Tutkimukset hapen sitoutumisenergiasta hemoglobiinimolekyyliin  // Biokemiallinen ja biofysikaalinen tutkimusviestintä. – 27.10.1975. - T. 66 , no. 4 . - S. 1424-1431 . — ISSN 0006-291X . - doi : 10.1016/0006-291x(75)90518-5 .
  7. TR Anderson, T.A. Slotkin. Lisämunuaisytimen kypsyminen - IV. Morfiinin vaikutukset  // Biokemiallinen farmakologia. - 15.8.1975. - T. 24 , no. 16 . - S. 1469-1474 . — ISSN 1873-2968 . - doi : 10.1016/0006-2952(75)90020-9 .
  8. "Otoksen valintaharhan vaikutukset rodullisiin eroihin lasten hyväksikäytön raportoinnissa" . Lasten hyväksikäyttö ja laiminlyönti . 22 (2): 103-15. helmikuuta 1998. DOI : 10.1016/S0145-2134(97)00131-2 . PMID  9504213 .
  9. "Sample Selection Bias Correction Theory" (PDF) . Algoritminen oppimisen teoria . 5254 : 38-53. 2008.arXiv : 0805.2775 . _ CiteSeerX 10.1.1.144.4478 . DOI : 10.1007/978-3-540-87987-9_8 . ISBN 978-3-540-87986-2 .  
  10. "Domain adaptation ja näytepoikkeaman korjauksen teoria ja regression algoritmi" (PDF) . Teoreettinen tietojenkäsittelytiede . 519 :103-126. 2014. CiteSeerX  10.1.1.367.6899 . DOI : 10.1016/j.tcs.2013.09.027 .
  11. JM Stein. Adrenaliinin ja alfa- ja beeta-adrenergisten estävien aineiden vaikutus ATP-pitoisuuteen ja 32Pi:n sisällyttämiseen ATP:hen rotan rasvasoluissa  // Biokemiallinen farmakologia. - 15.9.1975. - T. 24 , no. 18 . - S. 1659-1662 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90002-7 .
  12. Maxcy-Rosenau-Viimeinen kansanterveys ja ehkäisevä lääketiede . – 15. - McGraw Hill Professional, 2007. - S. 21. - ISBN 978-0-07-159318-2 .
  13. 1 2 V. M. Bhagwat, B. V. Ramachandran. Hiiren maksa-I:n malationi-A- ja B-esteraasit  // Biokemiallinen farmakologia. - 15.9.1975. - T. 24 , no. 18 . - S. 1713-1717 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90011-8 .
  14. N. Akamatsu, H. Nakajima, M. Ono, Y. Miura. Asetyyli-CoA-syntetaasin aktiivisuuden lisääntyminen fenobarbitaalihoidon jälkeen  // Biokemiallinen farmakologia. - 15.9.1975. - T. 24 , no. 18 . - S. 1725-1727 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90013-1 .
  15. Selaintilastot . Refsnes Data (kesäkuu 2008). Haettu: 5.7.2008.
  16. B. Renaud, M. Buda, B. D. Lewis, J. F. Pujol. 5,6-dihydroksitryptamiinin vaikutukset tyrosiinihydroksylaasiaktiivisuuteen rotan keskeisissä katekoliminergisissa neuroneissa  // Biokemiallinen farmakologia. - 15.9.1975. - T. 24 , no. 18 . - S. 1739-1742 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90018-0 .
  17. MM Ris, RA Deitrich, JP Von Wartburg. Aldehydireduktaasi-isoentsyymien esto ihmisen ja rotan aivoissa  // Biokemiallinen farmakologia. – 15.10.1975. - T. 24 , no. 20 . — S. 1865–1869 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90405-0 .
  18. AE Halaris, KT Belendiuk, DX Freedman. Masennuslääkkeet vaikuttavat dopamiinin imeytymiseen  // Biokemiallinen farmakologia. – 15.10.1975. - T. 24 , no. 20 . — S. 1896–1897 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90412-8 .
  19. W. Barthel, F. Markwardt. Verihiutaleiden aggregaatio adrenaliinilla ja sen otto  // Biokemiallinen farmakologia. – 15.10.1975. - T. 24 , no. 20 . - S. 1903-1904 . — ISSN 0006-2952 . - doi : 10.1016/0006-2952(75)90415-3 .
  20. O. Isaac, K. Thiemer. [Kamomillan komponenttien biokemialliset tutkimukset/III. In vitro -tutkimukset (--)-alfa-bisabololin antipeptisesta vaikutuksesta (tekijän käännös) ] // Arzneimittel-Forschung. - 1975-09. - T. 25 , no. 9 . - S. 1352-1354 . — ISSN 0004-4172 .