Kausaalinen malli

Kausaalimalli , kausaalimalli  on käsitteellinen malli , joka kuvaa järjestelmän kausaalimekanismeja . Syy-mallit voivat parantaa tutkimuksen laatua antamalla selkeät säännöt riippumattomien muuttujien sisällyttämiseksi analyysiin [2] . Niiden avulla voidaan vastata joihinkin kysymyksiin olemassa olevien havaintotietojen perusteella ilman interventiotutkimusta, kuten satunnaistettua kontrolloitua tutkimusta . Jotkut interventiotutkimukset eivät sovellu eettisistä tai käytännön syistä, mikä tarkoittaa, että ilman kausaalimallia joitain hypoteeseja ei voida testata [3] .

Kausaaliset mallit voivat auttaa ratkaisemaan kysymyksen ulkoisesta validiteetista (päteekö yhden tutkimuksen tulokset tutkimattomiin ryhmiin). Syy-mallit voivat mahdollistaa useiden tutkimusten tietojen yhdistämisen vastaamaan kysymyksiin, joihin mikään yksittäinen tietojoukko ei voi vastata. Syy-mallit ovat falsifioitavissa , ja jos ne eivät sovi dataan, ne on hylättävä virheellisinä. Niiden tulee olla myös ymmärrettäviä niille, jotka ovat lähellä ilmiöitä, joita mallilla on tarkoitus selittää [4] .

Kausaalimalleilla on sovelluksia signaalinkäsittelyssä , epidemiologiassa ja koneoppimisessa . Judah Pearlin mukaan kirjassa The  Book of Why , 2018, kausaaliset mallit ovat välttämätön elementti vahvan tekoälyn kehittämisessä [5] .

Määritelmä

Syy-mallit ovat matemaattisia malleja, jotka edustavat kausaalisia suhteita tietyn järjestelmän tai ryhmän sisällä. Niiden avulla on helpompi päätellä syy-yhteydet tilastotiedoista. Ne voivat kertoa meille paljon kausaalisuuden epistemologiasta sekä kausaalisuuden ja todennäköisyyden välisestä suhteesta . Niitä on sovellettu myös filosofeja kiinnostaviin aiheisiin, kuten päätösteoriaan ja tosiasiallisen kausaliteetin analyysiin [6] .

Judah Pearl määrittelee kausaalimallin järjestetyksi kolmiosaiseksi , jossa  on joukko eksogeenisiä muuttujia, joiden arvot määrittävät mallin ulkopuoliset tekijät;  — joukko endogeenisiä muuttujia, joiden arvot määrittävät mallin tekijät; ja  on joukko rakenneyhtälöitä, jotka ilmaisevat kunkin endogeenisen muuttujan arvon muiden muuttujien arvojen funktiona ja [7] .

Historia

Aristoteles määritteli syy -yhteyden taksonomian , joka sisältää aineelliset, muodolliset, tehokkaat ja lopulliset syyt. Hume hylkäsi Aristoteleen lähestymistavan kontrafaktuaalisen ajattelun puolesta. Yhdessä vaiheessa hän kiisti, että esineillä on "voimia", jotka tekevät niistä yhden syyn ja toisesta seurauksen. Myöhemmin hän kuitenkin hyväksyi lausunnon: "Jos ensimmäistä kohdetta ei olisi olemassa, toista ei olisi koskaan olemassa" (kausaalisuuden välttämätön ehto) [8] .

1800-luvun lopulla tilastot alkoivat muotoutua tieteenalana. Vuosia yrittäessään tunnistaa kausaalisia sääntöjä sellaisille alueille kuin biologinen perinnöllisyys , Galton esitteli regression käsitteen keskiarvoon (havainnoimalla toisen vuoden opiskelijan oireyhtymää urheilussa), mikä johti hänet myöhemmin ei-kausaaliseen korrelaation käsitteeseen .

Karl Pearson , joka oli positivisti , sulki kausaalisuuden käsitteen pois suurimmasta osasta tieteestä todisteettomana assosiaatiotapauksena ja otti käyttöön korrelaatiokertoimen assosiaatiometriana. Hän kirjoitti: "Voima liikkeen syynä on täsmälleen sama kuin puun jumala kasvun aiheuttajana", ja että kausaalisuus oli vain "fetissi modernin tieteen käsittämättömien mysteerien joukossa". Pearson perusti Biometrika -yrityksen ja biometrisen laboratorion University College Londoniin , josta on tullut maailman johtava tilastotutkimuksen toimittaja.

Vuonna 1908 Hardy ja Weinberg ratkaisivat piirteiden stabiilisuuden ongelman , ja heidän ratkaisunsa johti Galtonin luopumaan kausaalisuudesta ja elvyttämään Mendelin perinnön [9] .

Vuonna 1921 polkuanalyysistä tuli kausaalimallinnuksen ja kausaalikaavioiden teoreettinen esi-isä . Hän kehitti tämän lähestymistavan yrittääkseen selvittää perinnöllisyyden , kehityksen ja ympäristön suhteellista vaikutusta marsun turkkiin . Hän tuki teoreettisia väitteitään osoittamalla, kuinka tällainen analyysi voisi selittää marsun syntymäpainon, raskausiän ja pentueen koon välisen suhteen. Vakiintuneiden tilastotieteilijöiden vastustus näitä ajatuksia kohtaan johti siihen, että ne jätettiin huomiotta seuraavien 40 vuoden aikana (lukuun ottamatta eläinten kasvattajia ). Sen sijaan tutkijat luottivat korrelaatioihin, osittain Wrightin kriitikon Ronald Fisherin ansiosta [10] .

Vuonna 1923 Jerzy Neumann esitteli mahdollisen tuloksen käsitteen, mutta hänen artikkelinsa käännettiin puolasta englanniksi vasta vuonna 1990.

Vuonna 1958 David Cox varoitti, että Z-muuttujaa tulisi hallita vain, jos on erittäin epätodennäköistä, että riippumattomat muuttujat vaikuttavat siihen. 1960-luvulla Duncan , Blalock ja Goldberger löysivät polkuanalyysin uudelleen.

Sosiologit kutsuivat kausaalimalleja alun perin rakenneyhtälömallinnukseksi mutta kun siitä tuli mekaaninen menetelmä, se menetti käyttökelpoisuutensa, jolloin jotkut harjoittajat hylkäsivät kaiken yhteyden kausaalisuuteen. Taloustieteilijät ovat omaksuneet polkuanalyysin algebrallisen osan, kutsuen sitä yhtälöiden samanaikaiseksi mallintamiseksi. He kuitenkin välttyivät antamasta yhtälöilleen kausaalista merkitystä.

Kuusikymmentä vuotta ensimmäisen artikkelinsa jälkeen Wright julkaisi paperin, jossa hän teki yhteenvedon ensimmäisestä, seuraten Carlinin ja muiden kritiikkiä, jotka vastustivat, että se käsittelee vain lineaarisia suhteita ja että vankat, mallittomat dataesitykset ovat paljastavampia.

Vuonna 1973 David Lewis kannatti korrelaation korvaamista syy-yhteydellä (kontrafaktuaaleilla). Hän viittasi ihmisten kykyyn kuvitella vaihtoehtoisia maailmoja, joissa syy esiintyy tai ei, ja joissa seuraus ilmenee vasta syynsä jälkeen. Vuonna 1974 Rubin esitteli "potentiaalisten tulosten" käsitteen kielenä kausaalisia kysymyksiä varten.

Vuonna 1983 Nancy Cartwright ehdotti että kaikki tekijät, jotka ovat "syy-yhteydessä" vaikutukseen, tulisi olla ehdollisia, mikä ylittää pelkän todennäköisyyden ainoana ohjeena.

Vuonna 1986 Baron ja Kenny esittelivät välityksen havaitsemisen ja arvioinnin periaatteet lineaarisessa yhtälöjärjestelmässä [11] . Vuodesta 2014 lähtien heidän paperinsa oli kaikkien aikojen 33. eniten lainattu. Samana vuonna Greenland ja Robins esittelivät "korjattavuus"-lähestymistavan käsitelläkseen hämmentäviä tekijöitä ottamalla huomioon kontrafaktuaalit. He ehdottivat, että arvioitaisiin, mitä potilasryhmälle olisi tapahtunut, jos he eivät olisi saaneet hoitoa, ja verrattaisiin tätä tulosta kontrolliryhmän tulokseen . Jos tulokset täsmäävät, sotkeutumista ei ole [9] .

Tällä hetkellä Columbian yliopiston tekoälylaboratorio tekee tutkimusta kausaalisen mallinnuksen teorian soveltamisesta keinotekoisiin hermoverkkoihin [12] .

Kausaalisuustikkaat

Pearlin kausaalinen metamalli sisältää kolmitasoisen abstraktion, jota hän kutsuu kausaalisuuden tikkaiksi. Alin taso, assosiatiivinen (näkeminen/havainnointi), sisältää kuvioiden tai kuvioiden havaitsemisen syöttötiedoissa, ilmaistuna korrelaatioina. Keskitaso, interventio, ennustaa tahallisten toimien seurauksia, jotka ilmaistaan ​​syy-suhteina. Korkein taso, kontrafaktuaalinen, sisältää teorian rakentamisen, joka selittää, miksi tietyillä toimilla on erityisiä vaikutuksia ja mitä tapahtuu, jos tällaisia ​​toimia ei ole [9] .

Yhdistys

Yksi kohde yhdistetään toiseen, jos yhden havainnointi muuttaa toisen havainnoinnin todennäköisyyttä . Esimerkki: Asiakkaat, jotka ostavat hammastahnaa, ostavat todennäköisemmin myös hammaslankaa . Assosiaatioita voidaan mitata myös laskemalla kahden tapahtuman korrelaatio . Assosiaatioilla ei ole kausaalista merkitystä. Yksi tapahtuma voi aiheuttaa toisen, päinvastoin voi olla totta tai molemmat tapahtumat voivat johtua jostain kolmannesta tapahtumasta.

Häiriöt

Tämä taso vahvistaa tiettyjä kausaalisia suhteita tapahtumien välillä. Syy-yhteyttä arvioidaan suorittamalla kokeellisesti jokin toimenpide, joka vaikuttaa johonkin tapahtumaan. Esimerkki: Jos kaksinkertaistaisimme hammastahnan hinnan, mikä olisi uuden ostotodennäköisyys? Syy-yhteyttä ei voida todeta tarkastelemalla hinnanmuutoshistoriaa, koska hinnanmuutos saattoi johtua jostain muusta syystä, joka itse olisi voinut vaikuttaa toiseen tapahtumaan (molempien tavaroiden hintaa nostava tariffi) [13] .

Kontrafaktuaalinen

Korkeimmalla tasolla, kontrafaktuaalinen, pohditaan vaihtoehtoista versiota menneestä tapahtumasta tai siitä, mitä olisi voinut tapahtua eri olosuhteissa samassa kokeellisessa asetelmassa. Millä todennäköisyydellä esimerkiksi, jos myymälä kaksinkertaistaisi hammaslangan hinnan, hammastahnan asiakas ostaisi sen silti?

Kontrafaktuaalit voivat osoittaa syy-yhteyden olemassaolon. Kontrafaktuaaleja sisältävät mallit mahdollistavat tarkat interventiot, joiden seuraukset voidaan ennakoida. Äärimmäisessä tapauksessa tällaiset mallit hyväksytään fysikaalisiksi laeiksi, esimerkiksi hitauslaki sanoo, että jos paikallaan olevaan esineeseen ei kohdisteta voimaa, se ei liiku [9] .

Syy-yhteys

Syy-suhde vs. korrelaatio

Tilastot keskittyvät useiden muuttujien välisten suhteiden analysointiin. Perinteisesti näitä suhteita kuvataan korrelaatioiksi , assosiaatioiksi ilman mitään implisiittistä kausaalisuutta . Kausaaliset mallit yrittävät laajentaa tätä viitekehystä lisäämällä siihen kausaation käsitteen, jossa yhden muuttujan muutokset aiheuttavat muutoksia muissa [7] .

1900-luvun kausaalisuuden määritelmät perustuivat yksinomaan todennäköisyyksiin/assosiaatioihin. On sanottu, että yksi tapahtuma (X) aiheuttaa toisen, jos se lisää toisen (Y) todennäköisyyttä. Matemaattisesti tämä ilmaistaan ​​muodossa

Tällaiset määritelmät ovat riittämättömiä, koska muut suhteet (esimerkiksi X:n ja Y:n yhteinen syy) voivat täyttää ehdon. Syy-yhteys liittyy tikkaiden toiseen asteeseen. Yhdistykset ovat ensimmäisessä vaiheessa ja tarjoavat todisteita vain jälkimmäisestä. Myöhempi määritelmä yritti ratkaista tämän epäselvyyden taustatekijöiden ehdolla. Matemaattisesti tämä ilmaistaan ​​muodossa

jossa K on joukko taustamuuttujia ja k ovat näiden muuttujien arvot tietyssä kontekstissa. Vaadittu taustamuuttujien joukko on kuitenkin määrittelemätön niin kauan kuin todennäköisyys on ainoa kriteeri, koska useat joukot voivat lisätä todennäköisyyttä.

Muita yrityksiä kausaalisuuden määrittämiseksi ovat Grangerin kausaalisuus , tilastollinen testi hypoteesille, jonka mukaan taloustieteessä kausaalisuutta voidaan arvioida mittaamalla kykyä ennustaa yhden aikasarjan tulevaisuuden arvoja toisen aikasarjan aikaisempien arvojen perusteella.

Tyypit

Syy voi olla välttämätön, riittävä, suotuisa tai sillä voi olla useita näistä ominaisuuksista [14] .

välttämättömyys

Jotta tapahtuma x olisi välttämätön syy y:lle, y:n läsnäolon täytyy tarkoittaa x:n aiempaa esiintymistä. X:n läsnäolo ei kuitenkaan tarkoita, että y tapahtuu. Tämä tarkoittaa, että y:tä ei olisi tapahtunut, jos x ei olisi tapahtunut.

Riittävät syyt

Jotta tapahtuma x olisi riittävä syy y:lle, x:n läsnäolon täytyy merkitä y:n myöhempää esiintymistä. Toinen z:n syy voi kuitenkin itsenäisesti aiheuttaa y:n. Siten y:n läsnäolo ei edellytä x:n aiempaa esiintymistä [15] .

Liittyvät syyt

Jotta x olisi y:n samanaikainen syy, x:n läsnäolon on lisättävä y:n todennäköisyyttä. Jos todennäköisyys on 100%, niin x:n sanotaan olevan riittävä. Myös samanaikainen syy voi olla tarpeen [16] .

Malli

Syykaavio

Syy-kaavio on suunnattu kaavio , joka näyttää kausaalisen mallin muuttujien väliset syysuhteet. Se sisältää joukon muuttujia (tai solmuja ). Jokainen solmu on yhdistetty nuolella yhteen tai useampaan muuhun solmuun, joihin sillä on kausaalinen vaikutus. Nuoli määrittelee kausaalisuuden suunnan , esimerkiksi nuoli, joka yhdistää muuttujat A ja B nuolella pisteessä B, osoittaa, että muutos A:ssa aiheuttaa muutoksen B:ssä (sopivalla todennäköisyydellä). Polku on kaavion läpikulku kahden kausaalinuolia seuraavan solmun välillä.

Syy-kaaviot sisältävät sykliset kaaviot , suunnatut asykliset kaaviot ja Ishikawa-kaaviot [9] .

Syy-kaaviot eivät riipu kvantitatiivisista todennäköisyyksistä. Muutokset näissä todennäköisyyksissä (esim. teknologisista parannuksista johtuvat) eivät vaadi muutoksia malliin.

Mallin elementit

Kausaalimalleilla on muodollisia rakenteita elementeillä, joilla on tiettyjä ominaisuuksia.

Kytkentämallit

Kolmen solmun liitäntöjä on 3 tyyppiä - lineaariset piirit, haarukat ja törmäimet .

Ketjut

Ketjut ovat suoria viestintälinjoja, joissa nuolet osoittavat syystä seuraukseen. Tässä mallissa B on välittäjä siinä mielessä, että hän välittää vaikutusta, joka A:lla olisi C:hen.

Haarukat

Haarukoissa yhdellä syyllä on monia seurauksia. A:n ja C:n välillä on ei-kausaalinen, harhaanjohtava korrelaatio , joka voidaan eliminoida ehdottamalla B:tä tietylle B:n arvolle.

Haarukan kehitys näyttää tältä:

Tällaisissa malleissa B on A:n ja C:n yleinen syy (joka aiheuttaa myös A:n), jolloin B on välittäjä.

Collider

Törmäyslaitteissa useat syyt vaikuttavat samaan tulokseen. B:n tietyn arvon ehdollistaminen paljastaa usein epäsyyllisen negatiivisen korrelaation A:n ja C:n välillä. Tätä negatiivista korrelaatiota on kutsuttu törmäysvirheeksi : B selittää A:n ja C:n välisen korrelaation. Korrelaatio voi olla positiivinen, kun sekä A:n että C:n panokset ovat tarvitaan vaikuttamaan B:

Solmutyypit

Sovittelija

Välitysmuuttuja muuttaa muiden syiden vaikutusta lopputulokseen (toisin kuin pelkkä lopputulokseen vaikuttaminen). Esimerkiksi yllä olevassa esimerkissä piiri B on välittäjä, koska se muuttaa A:n (epäsuora syy C) vaikutuksen C:ksi (tulos).

Hämmentävä muuttuja

Hämmentävä muuttuja ( confounder ) vaikuttaa useisiin tuloksiin luomalla positiivisen korrelaation niiden välille.

Instrumenttimuuttuja

Instrumenttimuuttuja:

  • on polku tulokseen
  • ei ole muuta polkua kausaalimuuttujiin
  • sillä ei ole suoraa vaikutusta tulokseen

Regressiokertoimet voivat mitata instrumentaalimuuttujan kausaalista vaikutusta tulokseen, kunhan tämä vaikutus ei ole sotkeutunut.[ määritä ] . Näin ollen instrumentaaliset muuttujat mahdollistavat syytekijöiden kvantifioinnin ilman hämmentäviä muuttujia koskevia tietoja.

Esimerkiksi mallissa:

jossa Z on instrumentaalinen muuttuja, koska sillä on polku tulokseen Y eikä sillä ole kantaa esimerkiksi U:lle.

Voit parantaa mallin tarkkuutta ehdollistamalla toisen muuttujan, joka estää työkalun ja hämmennystekijän väliset polut, ja yhdistämällä useita muuttujia yhdeksi työkaluksi.

Yhdistykset

Itsenäisyyden ehdot

Riippumattomuusehdot ovat sääntöjä, joilla päätetään, ovatko kaksi muuttujaa toisistaan ​​riippumattomia. Muuttujat ovat riippumattomia, jos yhden arvot eivät vaikuta suoraan toisen arvoihin. Useat syy-mallit voivat jakaa riippumattomuusehdot. Esimerkiksi mallit

ja

niillä on samat riippumattomuusehdot, koska B:n ehdollisuus jättää A:n ja C:n riippumattomiksi. Näillä kahdella mallilla ei kuitenkaan ole sama arvo, ja ne voidaan väärentää tietojen perusteella (eli jos havaintotiedot osoittavat suhteen A:n ja C:n välillä B:n ehdollistamisen jälkeen, molemmat mallit ovat vääriä). Sitä vastoin tiedot eivät voi osoittaa, kumpi kahdesta mallista on oikea, koska niillä on samat riippumattomuusehdot. Muuttujan ehdollistaminen on mekanismi hypoteettisten kokeiden suorittamiseksi. Muuttujan ehdollistamiseen kuuluu muiden muuttujien arvojen tutkiminen ehdollisen muuttujan tietylle arvolle. Ensimmäisessä esimerkissä ehdollistaminen B:lle merkitsee sitä, että havainnot tietylle B:n arvolle eivät saa näyttää mitään suhdetta A:n ja C:n välillä. Jos tällainen suhde on olemassa, malli on väärä. Ei-kausaaliset mallit eivät voi tehdä tällaisia ​​eroja, koska ne eivät anna kausaalisia väitteitä.

Hämmentäjä ja hämmennyksen purkaja

Tärkeä osa korrelaatiotutkimusta on tunnistaa mahdollisesti ristiriitaiset vaikutukset tutkittavaan muuttujaan, kuten demografisiin tekijöihin . Oikeaa hämmentävien muuttujien luetteloa ei kuitenkaan voida määrittää etukäteen. Näin ollen on mahdollista, että tutkimus voi hallita epäolennaisia ​​muuttujia tai jopa (epäsuorasti) tutkittavaa muuttujaa.

Kausaaliset mallit tarjoavat luotettavan menetelmän relevanttien hämmentäviä muuttujia tunnistaa. Muodollisesti Z on hämmentävä, jos Y on yhdistetty Z:hen poluilla, jotka eivät kulje X:n läpi. Nämä voidaan usein määrittää käyttämällä muita tutkimuksia varten kerättyä dataa.

Takaoven säätö

Jotta voidaan analysoida X:n kausaalista vaikutusta Y:ään kausaalimallissa, kaikkia hämmennysmuuttujia on säädettävä.

Muistiinpanot

  1. Karl Friston (helmikuu 2009). "Syy-mallinnus ja aivojen yhteys toiminnallisessa magneettikuvauksessa" . PLOS Biologia . 7 (2): e1000033. doi : 10.1371/journal.pbio.1000033 . PMC2642881  _ _ PMID  19226186 .
  2. SYY- (SYY- JA VAIKUTUS) MALLINTO. Kausaalinen mallinnus on nykyään käytössä oleva nerokkain ja matemaattisesti monimutkaisin kvantitatiivinen ennustamismenetelmä . www.bibliotekar.ru _ Haettu 9. maaliskuuta 2021. Arkistoitu alkuperäisestä 26. heinäkuuta 2020.
  3. Syy-mallit regressioanalyysissä . Studme . Haettu 9. maaliskuuta 2021. Arkistoitu alkuperäisestä 25. helmikuuta 2017.
  4. Barlas, Yaman; Carpenter, Stanley (1990). " Mallin validoinnin filosofiset juuret: kaksi paradigmaa ". System Dynamics Review . 6 (2): 148-166. doi:10.1002/sdr.4260060203.
  5. Pearl J., Mackenzie D. (2018) The Book of Why. Syyn ja seurauksen uusi tiede. NY: Peruskirjat. s. 362–363.
  6. Christopher Hitchcock. Kausaaliset mallit . – 07.08.2018 Arkistoitu alkuperäisestä 21.7.2020.
  7. ↑ 1 2 Juudean helmi. Johdatus kausaaliseen päättelyyn  // The International Journal of Biostatistics. – 26.2.2010. - T. 6 , no. 2 . — ISSN 1557-4679 . - doi : 10.2202/1557-4679.1203 . Arkistoitu alkuperäisestä 1. helmikuuta 2021.
  8. Karpenko Aleksanteri Stepanovitš. Kontrafaktuaalinen ajattelu  // Looginen tutkimus. - 2017. - T. 23 , nro 2 . — ISSN 2074-1472 .
  9. ↑ 1 2 3 4 5 Pearl, Juudea ; Mackenzie, Dana (15.5.2018). The Book of Why: Syyn ja seurauksen uusi tiede arkistoitu 13. kesäkuuta 2021 Wayback Machinessa . Peruskirjat. ISBN9780465097616.
  10. Okasha, Samir (12.1.2012). " Cusation in Biology arkistoitu 11. huhtikuuta 2019 Wayback Machinessa ". In Beebee, Helen; Hitchcock, Christopher; Menzies, Peter (toim.). Oxfordin syy-yhteyden käsikirja . 1 . OU Oxford. doi:10.1093/oxfordhb/9780199279739.001.0001 . ISBN9780191629464.
  11. Baronin ja Kennyn sovittelumenetelmä . Tilastoratkaisut (30.8.2017). Haettu 9. maaliskuuta 2021. Arkistoitu alkuperäisestä 7. huhtikuuta 2021.
  12. Mitä tekoäly ei vieläkään voi  tehdä . MIT Technology Review . Haettu 9. maaliskuuta 2021. Arkistoitu alkuperäisestä 11. maaliskuuta 2021.
  13. Pearl, Juudea (29. lokakuuta 2019). "Cusal and Counterfactual Inference" Arkistoitu 20. syyskuuta 2021 Wayback Machineen (PDF).
  14. Susanna S. Epp. Diskreetti matematiikka sovellusten kanssa . - Thomson-Brooks/Cole, 2004. - 936 s. — ISBN 978-0-534-49096-6 .
  15. Kausaalinen päättely . Haettu 16. maaliskuuta 2021. Arkistoitu alkuperäisestä 24. helmikuuta 2021.
  16. Riegelman, R. (1979). " Syy: tarpeeton ja riittämätön ". lääketieteen jatko . 66 (2): 177-179.