Hämmentävä muuttuja

Hämmentävä muuttuja, hämmentävä tekijä, hämmentävä tekijä,  on tilastoissa muuttuja, joka vaikuttaa sekä riippuvaan että riippumattomaan muuttujaan , mikä johtaa väärään suhteeseen . Kietoutuminen on kausaalikäsite , kausaalimallin elementti , eikä sitä sellaisenaan voi kuvata korrelaatioiden tai assosiaatioiden avulla [1] [2] [3] . Hämmentäjät ovat yksi syy-analyysin muuttujatyypeistä yhdessä moderaattoreiden , välittäjien ja törmäystekijöiden kanssa [4] [5] [6].

Määritelmä

Kietoutuminen voidaan määritellä datan luomisen perusteella (kuten yllä olevassa kuvassa). Olkoon X  jokin riippumaton muuttuja ja Y  jokin riippuva muuttuja . Arvioidakseen X :n vaikutuksen Y :hen tilastotieteilijän on eliminoitava ulkopuolisten muuttujien vaikutus, jotka vaikuttavat sekä X :ään että Y :hen. Sanomme, että X ja Y ovat kietoutuneet johonkin muuttujaan Z aina , kun Z vaikuttaa kausaalisesti sekä X :ään että Y: ään.

Olkoon  tapahtuman Y = y todennäköisyys hypoteettisessa interventiossa X = x . X ja Y eivät ole kietoutuneet, jos ja vain, jos seuraava ehto on totta:

kaikille tapahtumatodennäköisyyksille X = x ja tapahtumalle Y = y , missä  on ehdollinen todennäköisyys X = x . Intuitiivisesti tämä yhtälö ilmaisee, että X ja Y eivät ole kietoutuneet, jos havaittu suhde niiden välillä on sama kuin suhde, joka mitataan kontrolloidussa kokeessa satunnaistetulla x :llä .

Periaatteessa määrittävä yhtäläisyys voidaan testata datan generointimallia vastaan ​​olettaen, että meillä on kaikki malliin liittyvät yhtälöt ja todennäköisyydet. Tämä tehdään mallintamalla interventio (katso Bayesin verkko ) ja tarkistamalla , onko tuloksena saatu todennäköisyys Y yhtä suuri kuin ehdollinen todennäköisyys . Osoittautuu, että graafin ominaisuudet riittävät yhtäläisyyden tarkistamiseen .

Ohjaus

Harkitse tutkijaa, joka yrittää arvioida lääkkeen X tehoa väestötietojen perusteella, jolloin potilaat itse valitsevat käytettävän lääkkeen. Tiedot osoittavat, että sukupuoli ( Z ) vaikuttaa potilaan lääkkeen valintaan sekä toipumismahdollisuuksiin ( Y ). Tässä skenaariossa Z :n sukupuoli rikkoo X :n ja Y:n välisen suhteen, koska Z on sekä X :n että Y :n syy  :

Meillä on eriarvoisuutta

,

koska havaittu suure sisältää tietoa X :n ja Z :n välisestä korrelaatiosta , mutta hämmentävä suure ei (koska X ei korreloi Z :n kanssa satunnaistetussa kokeessa). Tilastotyöntekijä tarvitsee puolueettoman arvion , mutta tapauksissa, joissa on saatavilla vain havaintodataa, puolueeton arvio saadaan vain ottamalla huomioon kaikki hämmentävät tekijät eli ottamalla huomioon niiden erilaiset arvot ja keskimääräinen tulos. Jos kyseessä on yksi hämmentävä tekijä Z , tämä johtaa "säätökaavaan":

,

joka antaa puolueettoman arvion X :n kausaalisesta vaikutuksesta Y :ään . Sama kaava toimii useiden hämmentäviä tekijöitä, paitsi että tässä tapauksessa puolueettoman arvion takaavan Z-joukon valinta on tehtävä varoen. Hämmentävien muuttujien oikean valinnan kriteeriä kutsutaan takaoveksi [7] [8] ja se edellyttää, että valittu joukko Z "estää" (tai katkaisee) jokaisen polun X :stä Y :hen, joka päättyy nuoleen X:ssä. Tällaisia ​​joukkoja kutsutaan "valid backdoor" ja voi sisältää muuttujia, jotka eivät ole yleisiä X :n ja Y :n syitä , vaan niiden korvikkeita.

Palatakseni lääkeesimerkkiin, koska Z täyttää takaoven vaatimuksen (eli katkaisee yhden polun ), niin "säätökaava" on voimassa:

.

Näin ollen tutkija voi ennustaa lääkkeen käytön todennäköisen vaikutuksen havainnointitutkimuksilla , joissa yhtälön oikealla puolella esiintyvät ehdolliset todennäköisyydet voidaan arvioida regression avulla.

Vastoin yleistä luuloa, -kovariaattien lisääminen Z - joukkoon voi johtaa vääristymiin. Tyypillinen vastaesimerkki tapahtuu, kun Z on X :n ja Y :n yhteinen tulos [9] , jolloin Z ei ole hämmentävä tekijä (ts. tyhjä joukko on kelvollinen takaovi) ja Z :n huomioon ottaminen aiheuttaisi vääristymän, joka tunnetaan törmätäjänä . tai Berksonin paradoksi .

Yleensä kietoutumista voidaan hallita säätämällä, jos ja vain jos on joukko havaittavia yhteismuuttujia, jotka täyttävät takaoven ehdon. Lisäksi, jos Z on tällainen joukko, yhtälön (3) virityskaava on todellakin <4.5>. Jude Pearlin Do-laskenta tarjoaa lisäehtoja, joilla P ( y  | do ( x )) voidaan arvioida ilman säätöä [10] .

Historia

Morabian (2011) [11] mukaan hämmentäjän käsite tulee keskiaikaisesta latinalaisesta verbistä "confudere" (latinan kielestä: con = kanssa + fusus = yhdistää tai yhdistää), mikä tarkoittaa "sekoittaa", ja se valittiin todennäköisesti verbiksi. tarkoittaa sekaannusta arvioitavan syyn ja muiden syiden välillä, jotka voivat vaikuttaa tulokseen ja siten hämmentää tai häiritä haluttua arviointia. Fisher käytti sanaa "kietoutuminen" vuoden 1935 kirjassaan Design of Experiments [12] viittaamaan virheen lähteeseen kuvattaessa ihanteellista satunnaistettua koetta. Vandenbroucken (2004) [13] mukaan Leslie Kish [14] käytti ensin sanaa "kietoutuminen" sanan nykyisessä merkityksessä viittaamaan kahden tai useamman joukon "yhteensopimattomuuteen" (esim. valotetut ja valottamattomat ) havaintotutkimuksen aikana .

Grönland ja Robins (1986) [15] kehittivät epidemiologiassa Jerzy Neumannin (1935) [16] ja Donald Rubinin kieltä käyttäen muodolliset ehdot, jotka määrittävät, miksi jotkut joukot ovat "vertailukelpoisia" ja toiset "vertailuttomia". (1974) [17] . Näitä täydennettiin myöhemmin graafisilla kriteereillä, kuten takaoven kriteerillä (Pearl 1993; Greenland, Pearl ja Robins, 1999) [3] [7] . On osoitettu, että graafiset kriteerit vastaavat muodollisesti kontrafaktuaalista määritelmää [18] , mutta ovat läpinäkyvämpiä prosessimalleihin tukeutuville tutkijoille.

Tyypit

Arvioitaessa tietyn tekijän riskiä terveydelle , on tärkeää hallita , jotta voidaan eristää tietyn uhan, kuten elintarvikelisäaineen, torjunta - aineen tai uuden lääkkeen, vaikutus. Prospektiivitutkimuksiin on vaikeaa rekrytoida ja seuloa vapaaehtoisia, joilla on sama tausta (ikä, ruokavalio, koulutus , maantiede jne.). Ja poikkileikkaustutkimuksissa ja toistuvissa tutkimuksissa riippuvat muuttujat voivat käyttäytyä samalla tavalla erilaisista syistä. Koska vapaaehtoisten laatua ei pystytä hallitsemaan, sotkeutuminen on erityinen ongelma ihmistutkimuksissa. Näistä syistä kokeet , toisin kuin havaintotutkimukset, ovat tapa välttää useimmat sotkeutumismuodot.

Joillakin aloilla takertuminen luokitellaan eri tyyppeihin. Epidemiologiassa yksi tyyppi on "indikaatiosekoitus" [19] , joka liittyy havainnointitutkimusten tulosten vääristymiseen . Koska ennustetekijät voivat vaikuttaa hoitopäätöksiin (ja vääristää arvioita hoidon vaikutuksista), tunnettujen ennakoivien tekijöiden hallinta voi vähentää tätä ongelmaa, mutta aina on mahdollista, että jokin unohdettu tai tuntematon tekijä on jätetty pois tai tekijät ovat vuorovaikutuksessa monimutkaisessa tilanteessa. tapa. Havainnointitutkimusten tärkeimpänä rajoituksena pidetään indikatiivista sekaannusta. Satunnaisjakaumasta johtuva indikaatiosekaannukset eivät vaikuta satunnaistettuihin kokeisiin [ .

Hämmentävät muuttujat voidaan myös luokitella niiden lähteen mukaan: mittausvälineen valinta (toiminnallinen hämmennys), tilanteen ominaisuudet (prosessien sekavuus) tai ihmisten väliset erot (persoonallisuuden hämmennys).

Esimerkkejä

Oletetaan, että joku tutkii suhdetta syntymäjärjestyksen (1. lapsi, 2. lapsi jne.) ja sen välillä, onko lapsella Downin syndrooma . Tässä tutkimuksessa äidin ikä on hämmentävä muuttuja:

  1. Äidin korkeampi ikä liittyy suoraan lapsen Downin oireyhtymään
  2. Äidin vanhempi ikä liittyy suoraan Downin oireyhtymään syntymäjärjestyksestä riippumatta (äiti, joka saa ensimmäisen tai kolmannen lapsensa 50-vuotiaana, aiheuttaa saman riskin)
  3. Äidin ikä liittyy suoraan syntymäjärjestykseen (2. lapsi kaksosia lukuun ottamatta syntyy, kun äiti on vanhempi kuin hän oli ensimmäisen lapsen syntymähetkellä)
  4. Äidin ikä ei ole seurausta syntymäjärjestyksestä (2. lapsen saaminen ei vaikuta äidin ikään)

Riskejä arvioitaessa terveydentilaan vaikuttavat usein tekijät, kuten ikä, sukupuoli ja koulutustaso, ja siksi niitä tulee seurata. Näiden tekijöiden lisäksi tutkijat eivät välttämättä ota huomioon muita syytekijöitä koskevia tietoja tai heillä ei ole pääsyä niihin. Esimerkkinä on tutkimus tupakanpolton vaikutuksista ihmisten terveyteen. Tupakointi, alkoholinkäyttö ja ruokavalio liittyvät toisiinsa. Riskinarviointi, jossa otetaan huomioon tupakoinnin vaikutukset mutta ei alkoholin kulutusta tai ruokavaliota, voi yliarvioida tupakoinnin riskin [22] . Tupakointi ja takertuminen otetaan huomioon työperäisten riskien arvioinnissa, kuten hiilikaivosten turvallisuusarvioinneissa [23] . Kun tietyssä ammatissa ei ole suurta otosta tupakoimattomista tai ei-juovista, riskinarviointi voi vääristyä ammatin kielteisiä terveysvaikutuksia kohti.

Vähentää sotkeutumisen mahdollisuutta

Hämmentävien tekijöiden ilmaantumisen ja vaikutuksen todennäköisyyttä voidaan vähentää lisäämällä tutkimuksessa tehtyjen vertailujen tyyppejä ja määrää. Jos päämuuttujien mittaukset tai manipulaatiot ovat sekaisin (eli toiminnallisia tai menettelyllisiä sekaannuksia), alaryhmäanalyysi ei välttämättä paljasta ongelmia tutkimuksessa. Muista kuitenkin, että vertailujen määrän lisääminen voi aiheuttaa muita ongelmia (katso Useita vertailuja ).

Vertaisarviointi  on prosessi, joka voi auttaa vähentämään sekaannusta joko ennen tutkimuksen suorittamista tai analyysin suorittamisen jälkeen. Vertaisarviointi perustuu tieteenalan sisäiseen vertaisarviointiin tunnistaakseen mahdolliset heikkoudet tutkimuksen suunnittelussa ja analysoinnissa, mukaan lukien se, miten sekaannukset voivat vaikuttaa tuloksiin. Vastaavasti replikointi antaa sinun tarkistaa tutkimuksen tulosten luotettavuuden vaihtoehtoisissa tutkimusolosuhteissa tai vaihtoehtoisissa lähestymistavoissa sen tulosten analysointiin (esimerkiksi ottaen huomioon mahdolliset sekaannukset, joita ei tunnistettu alkuperäisessä tutkimuksessa).

Tutkimuksen suunnittelusta riippuen on olemassa useita tapoja sulkea pois tai hallita hämmentäviä muuttujia [24] :

Kaikilla näillä menetelmillä on haittapuolensa:

  1. Paras suoja hämmentäviä vääriä positiivisia tuloksia vastaan ​​on usein luopua kerrostuspyrkimyksistä ja sen sijaan suorittaa koe riittävän suurella näytteellä kokonaisuutena tarkasteltuna, jotta kaikki mahdolliset hämmentävät muuttujat (tunnetut ja tuntemattomat) jakautuvat satunnaisesti kaikille. tutkimusryhmiä, joten se ei korreloi binäärimuuttujan kanssa .
  2. Eettiset näkökohdat: Kaksoissokkoutetuissa ja satunnaistetuissa kontrolloiduissa tutkimuksissa osallistujat eivät ole tietoisia saavansa valehoitoa , mikä tarkoittaa, että heiltä voidaan evätä tehokas hoito [25] . On mahdollista, että potilaat suostuvat invasiiviseen leikkaukseen (johon liittyy todellisia lääketieteellisiä riskejä) vain sillä ehdolla, että he saavat hoitoa.

Katso myös

Muistiinpanot

  1. Pearl, J., (2009). Simpsonin paradoksi , hämmentäminen ja kausaalisuuden kutistuvuus: mallit, päättely ja päättely (2. painos). New York: Cambridge University Press.
  2. VanderWeele, TJ (2013). "Sekoitustekijän määritelmästä" . Annals of Statistics . 41 (1): 196-220. arXiv : 1304.0564 . DOI : 10.1214/12-aos1058 . PMID  25544784 .
  3. 1 2 Greenland, S. (1999). "Sekoitus ja kutistuvuus kausaalisessa päätelmässä" . Tilastotiede . 14 (1):29-46. DOI : 10.1214/ss/1009211805 .
  4. Field-Fote, Edelle. Välittäjät ja moderaattorit, hämmentäjät ja kovariaatit: Neurorehabilitaation "aktiivisia ainesosia" valaisevien tai hämärtävien muuttujien tutkiminen . Journal of Neurologic Physical Therapy, huhtikuu 2019, osa 43, Issue 2, s. 83-84, doi: 10.1097/NPT.0000000000000275 . Haettu 8. joulukuuta 2021. Arkistoitu alkuperäisestä 8. joulukuuta 2021.
  5. Adrian E. Bauman, PhD, James F. Sallis, PhD, David A. Dzewaltowski, PhD, Neville Owen, PhD. Kohti fyysiseen aktiivisuuteen kohdistuvien vaikutusten parempaa ymmärtämistä: Determinanttien, korrelaattien, kausaalimuuttujien, välittäjien, moderaattorien ja hämmentäjien rooli . American Journal of Preventive Medicine, 2002, osa 23, numero 2S .
  6. David P. MacKinnon. Välittäjä-, hämmennys- ja törmäysefektien yhdistäminen . ehkäisytiede. Osa 22, sivut 1185–1193 (2021) . Haettu 9. joulukuuta 2021. Arkistoitu alkuperäisestä 9. joulukuuta 2021.
  7. 1 2 Pearl, J., (1993). "Aspects of Graphical Models Connected With Causality", julkaisussa Proceedings of the 49th Session of the International Statistical Science Institute, s. 391-401.
  8. Pearl, J. (2009). Syy-kaaviot ja syy-vaikutusten tunnistaminen syy-suhteessa : mallit, päättely ja päättely (2. painos). New York, NY, USA: Cambridge University Press.
  9. Lee, P.H. (2014). "Pitäisikö meidän mukautua hämmennykseen, jos empiiriset ja teoreettiset kriteerit tuottavat ristiriitaisia ​​tuloksia? Simulaatiotutkimus”. sci rep . 4 : 6085. Bibcode : 2014NatSR ...4E6085L . doi : 10.1038/ srep06085 . PMID 25124526 . 
  10. Shpitser, I. (2008). "Kausaalihierarkian täydelliset tunnistusmenetelmät". Journal of Machine Learning Research . 9 : 1941-1979.
  11. Morabia, A (2011). "Historia of the Modern epidemiological concept of confounding" (PDF) . Journal of Epidemiology and Community Health . 65 (4): 297-300. DOI : 10.1136/jech.2010.112565 . PMID  20696848 . Arkistoitu (PDF) alkuperäisestä 2021-12-05 . Haettu 2021-12-05 . Käytöstä poistettu parametri |deadlink=( ohje )
  12. Fisher, R.A. (1935). Kokeiden suunnittelu (s. 114-145).
  13. Vandenbroucke, JP (2004). "Löytämisen historia". Soz Praventivmed . 47 (4): 216-224. DOI : 10.1007/BF01326402 . PMID  12415925 .
  14. Kish, L (1959). "Joitakin tilastollisia ongelmia tutkimuksen suunnittelussa". Olen Sociol . 26 (3): 328-338. DOI : 10.2307/2089381 .
  15. Greenland, S. (1986). "Tunnettavuus, vaihdettavuus ja epidemiologinen hämmennys" . International Journal of Epidemiology . 15 (3): 413-419. DOI : 10.1093/ije/15.3.413 . PMID  3771081 .
  16. Neyman, J., yhteistyössä K. Iwaskiewicsin ja St. Kolodziejczyk (1935). Tilastolliset ongelmat maatalouskokeilussa (keskusteluineen). Suppl J Roy Statist Soc Ser B 2 107-180.
  17. Rubin, D.B. (1974). "Hoitojen syy-vaikutusten arviointi satunnaistetuissa ja ei-satunnaistetuissa tutkimuksissa" . Journal of Educational Psychology . 66 (5): 688-701. DOI : 10.1037/h0037350 .
  18. Pearl, J., (2009). Syy-yhteys: mallit, päättely ja päätelmät (2. painos). New York, NY, USA: Cambridge University Press.
  19. Johnston, S.C. (2001). "Hämäysten tunnistaminen indikaatioiden perusteella sokean tulevaisuuden arvioinnin avulla." American Journal of Epidemiology . 154 (3): 276-284. DOI : 10.1093/aje/154.3.276 . PMID  11479193 .
  20. 1 2 Pelham, Brett. Psykologian tutkimuksen tekeminen. - 2006. - ISBN 978-0-534-53294-9 .
  21. Steg, L. Applied Social Psychology: Understanding and Managing Social Problems / L. Steg, A. P. Buunk. – 2008.
  22. Tjønneland, Anne (tammikuu 1999). Viinin saanti ja ruokavalio satunnaisessa otoksessa, jossa oli 48763 tanskalaista miestä ja naista . American Journal of Clinical Nutrition . 69 (1): 49-54. DOI : 10.1093/ajcn/69.1.49 . PMID  9925122 .
  23. Axelson, O. (1989). "Tupakoinnin aiheuttama hämmennys ammattiepidemiologiassa" . British Journal of Industrial Medicine . 46 (8): 505-07. DOI : 10.1136/oem.46.8.505 . PMID2673334  . _
  24. Mayrent, Sherry L. Epidemiology in Medicine . - Lippincott Williams & Wilkins , 1987. - ISBN 978-0-316-35636-7 .
  25. Emanuel, Ezekiel J (20. syyskuuta 2001). "Plasebokontrolloitujen kokeiden etiikka – keskitie" . New England Journal of Medicine . 345 (12): 915-9. doi : 10.1056/ nimi200109203451211 . PMID 11565527 . 

Kirjallisuus

Linkit