Kausaalimalli , kausaalimalli on käsitteellinen malli , joka kuvaa järjestelmän kausaalimekanismeja . Syy-mallit voivat parantaa tutkimuksen laatua antamalla selkeät säännöt riippumattomien muuttujien sisällyttämiseksi analyysiin [2] . Niiden avulla voidaan vastata joihinkin kysymyksiin olemassa olevien havaintotietojen perusteella ilman interventiotutkimusta, kuten satunnaistettua kontrolloitua tutkimusta . Jotkut interventiotutkimukset eivät sovellu eettisistä tai käytännön syistä, mikä tarkoittaa, että ilman kausaalimallia joitain hypoteeseja ei voida testata [3] .
Kausaaliset mallit voivat auttaa ratkaisemaan kysymyksen ulkoisesta validiteetista (päteekö yhden tutkimuksen tulokset tutkimattomiin ryhmiin). Syy-mallit voivat mahdollistaa useiden tutkimusten tietojen yhdistämisen vastaamaan kysymyksiin, joihin mikään yksittäinen tietojoukko ei voi vastata. Syy-mallit ovat falsifioitavissa , ja jos ne eivät sovi dataan, ne on hylättävä virheellisinä. Niiden tulee olla myös ymmärrettäviä niille, jotka ovat lähellä ilmiöitä, joita mallilla on tarkoitus selittää [4] .
Kausaalimalleilla on sovelluksia signaalinkäsittelyssä , epidemiologiassa ja koneoppimisessa . Judah Pearlin mukaan kirjassa The Book of Why , 2018, kausaaliset mallit ovat välttämätön elementti vahvan tekoälyn kehittämisessä [5] .
Syy-mallit ovat matemaattisia malleja, jotka edustavat kausaalisia suhteita tietyn järjestelmän tai ryhmän sisällä. Niiden avulla on helpompi päätellä syy-yhteydet tilastotiedoista. Ne voivat kertoa meille paljon kausaalisuuden epistemologiasta sekä kausaalisuuden ja todennäköisyyden välisestä suhteesta . Niitä on sovellettu myös filosofeja kiinnostaviin aiheisiin, kuten päätösteoriaan ja tosiasiallisen kausaliteetin analyysiin [6] .
Judah Pearl määrittelee kausaalimallin järjestetyksi kolmiosaiseksi , jossa on joukko eksogeenisiä muuttujia, joiden arvot määrittävät mallin ulkopuoliset tekijät; — joukko endogeenisiä muuttujia, joiden arvot määrittävät mallin tekijät; ja on joukko rakenneyhtälöitä, jotka ilmaisevat kunkin endogeenisen muuttujan arvon muiden muuttujien arvojen funktiona ja [7] .
Aristoteles määritteli syy -yhteyden taksonomian , joka sisältää aineelliset, muodolliset, tehokkaat ja lopulliset syyt. Hume hylkäsi Aristoteleen lähestymistavan kontrafaktuaalisen ajattelun puolesta. Yhdessä vaiheessa hän kiisti, että esineillä on "voimia", jotka tekevät niistä yhden syyn ja toisesta seurauksen. Myöhemmin hän kuitenkin hyväksyi lausunnon: "Jos ensimmäistä kohdetta ei olisi olemassa, toista ei olisi koskaan olemassa" (kausaalisuuden välttämätön ehto) [8] .
1800-luvun lopulla tilastot alkoivat muotoutua tieteenalana. Vuosia yrittäessään tunnistaa kausaalisia sääntöjä sellaisille alueille kuin biologinen perinnöllisyys , Galton esitteli regression käsitteen keskiarvoon (havainnoimalla toisen vuoden opiskelijan oireyhtymää urheilussa), mikä johti hänet myöhemmin ei-kausaaliseen korrelaation käsitteeseen .
Karl Pearson , joka oli positivisti , sulki kausaalisuuden käsitteen pois suurimmasta osasta tieteestä todisteettomana assosiaatiotapauksena ja otti käyttöön korrelaatiokertoimen assosiaatiometriana. Hän kirjoitti: "Voima liikkeen syynä on täsmälleen sama kuin puun jumala kasvun aiheuttajana", ja että kausaalisuus oli vain "fetissi modernin tieteen käsittämättömien mysteerien joukossa". Pearson perusti Biometrika -yrityksen ja biometrisen laboratorion University College Londoniin , josta on tullut maailman johtava tilastotutkimuksen toimittaja.
Vuonna 1908 Hardy ja Weinberg ratkaisivat piirteiden stabiilisuuden ongelman , ja heidän ratkaisunsa johti Galtonin luopumaan kausaalisuudesta ja elvyttämään Mendelin perinnön [9] .
Vuonna 1921 polkuanalyysistä tuli kausaalimallinnuksen ja kausaalikaavioiden teoreettinen esi-isä . Hän kehitti tämän lähestymistavan yrittääkseen selvittää perinnöllisyyden , kehityksen ja ympäristön suhteellista vaikutusta marsun turkkiin . Hän tuki teoreettisia väitteitään osoittamalla, kuinka tällainen analyysi voisi selittää marsun syntymäpainon, raskausiän ja pentueen koon välisen suhteen. Vakiintuneiden tilastotieteilijöiden vastustus näitä ajatuksia kohtaan johti siihen, että ne jätettiin huomiotta seuraavien 40 vuoden aikana (lukuun ottamatta eläinten kasvattajia ). Sen sijaan tutkijat luottivat korrelaatioihin, osittain Wrightin kriitikon Ronald Fisherin ansiosta [10] .
Vuonna 1923 Jerzy Neumann esitteli mahdollisen tuloksen käsitteen, mutta hänen artikkelinsa käännettiin puolasta englanniksi vasta vuonna 1990.
Vuonna 1958 David Cox varoitti, että Z-muuttujaa tulisi hallita vain, jos on erittäin epätodennäköistä, että riippumattomat muuttujat vaikuttavat siihen. 1960-luvulla Duncan , Blalock ja Goldberger löysivät polkuanalyysin uudelleen.
Sosiologit kutsuivat kausaalimalleja alun perin rakenneyhtälömallinnukseksi mutta kun siitä tuli mekaaninen menetelmä, se menetti käyttökelpoisuutensa, jolloin jotkut harjoittajat hylkäsivät kaiken yhteyden kausaalisuuteen. Taloustieteilijät ovat omaksuneet polkuanalyysin algebrallisen osan, kutsuen sitä yhtälöiden samanaikaiseksi mallintamiseksi. He kuitenkin välttyivät antamasta yhtälöilleen kausaalista merkitystä.
Kuusikymmentä vuotta ensimmäisen artikkelinsa jälkeen Wright julkaisi paperin, jossa hän teki yhteenvedon ensimmäisestä, seuraten Carlinin ja muiden kritiikkiä, jotka vastustivat, että se käsittelee vain lineaarisia suhteita ja että vankat, mallittomat dataesitykset ovat paljastavampia.
Vuonna 1973 David Lewis kannatti korrelaation korvaamista syy-yhteydellä (kontrafaktuaaleilla). Hän viittasi ihmisten kykyyn kuvitella vaihtoehtoisia maailmoja, joissa syy esiintyy tai ei, ja joissa seuraus ilmenee vasta syynsä jälkeen. Vuonna 1974 Rubin esitteli "potentiaalisten tulosten" käsitteen kielenä kausaalisia kysymyksiä varten.
Vuonna 1983 Nancy Cartwright ehdotti että kaikki tekijät, jotka ovat "syy-yhteydessä" vaikutukseen, tulisi olla ehdollisia, mikä ylittää pelkän todennäköisyyden ainoana ohjeena.
Vuonna 1986 Baron ja Kenny esittelivät välityksen havaitsemisen ja arvioinnin periaatteet lineaarisessa yhtälöjärjestelmässä [11] . Vuodesta 2014 lähtien heidän paperinsa oli kaikkien aikojen 33. eniten lainattu. Samana vuonna Greenland ja Robins esittelivät "korjattavuus"-lähestymistavan käsitelläkseen hämmentäviä tekijöitä ottamalla huomioon kontrafaktuaalit. He ehdottivat, että arvioitaisiin, mitä potilasryhmälle olisi tapahtunut, jos he eivät olisi saaneet hoitoa, ja verrattaisiin tätä tulosta kontrolliryhmän tulokseen . Jos tulokset täsmäävät, sotkeutumista ei ole [9] .
Tällä hetkellä Columbian yliopiston tekoälylaboratorio tekee tutkimusta kausaalisen mallinnuksen teorian soveltamisesta keinotekoisiin hermoverkkoihin [12] .
Pearlin kausaalinen metamalli sisältää kolmitasoisen abstraktion, jota hän kutsuu kausaalisuuden tikkaiksi. Alin taso, assosiatiivinen (näkeminen/havainnointi), sisältää kuvioiden tai kuvioiden havaitsemisen syöttötiedoissa, ilmaistuna korrelaatioina. Keskitaso, interventio, ennustaa tahallisten toimien seurauksia, jotka ilmaistaan syy-suhteina. Korkein taso, kontrafaktuaalinen, sisältää teorian rakentamisen, joka selittää, miksi tietyillä toimilla on erityisiä vaikutuksia ja mitä tapahtuu, jos tällaisia toimia ei ole [9] .
Yksi kohde yhdistetään toiseen, jos yhden havainnointi muuttaa toisen havainnoinnin todennäköisyyttä . Esimerkki: Asiakkaat, jotka ostavat hammastahnaa, ostavat todennäköisemmin myös hammaslankaa . Assosiaatioita voidaan mitata myös laskemalla kahden tapahtuman korrelaatio . Assosiaatioilla ei ole kausaalista merkitystä. Yksi tapahtuma voi aiheuttaa toisen, päinvastoin voi olla totta tai molemmat tapahtumat voivat johtua jostain kolmannesta tapahtumasta.
Tämä taso vahvistaa tiettyjä kausaalisia suhteita tapahtumien välillä. Syy-yhteyttä arvioidaan suorittamalla kokeellisesti jokin toimenpide, joka vaikuttaa johonkin tapahtumaan. Esimerkki: Jos kaksinkertaistaisimme hammastahnan hinnan, mikä olisi uuden ostotodennäköisyys? Syy-yhteyttä ei voida todeta tarkastelemalla hinnanmuutoshistoriaa, koska hinnanmuutos saattoi johtua jostain muusta syystä, joka itse olisi voinut vaikuttaa toiseen tapahtumaan (molempien tavaroiden hintaa nostava tariffi) [13] .
Korkeimmalla tasolla, kontrafaktuaalinen, pohditaan vaihtoehtoista versiota menneestä tapahtumasta tai siitä, mitä olisi voinut tapahtua eri olosuhteissa samassa kokeellisessa asetelmassa. Millä todennäköisyydellä esimerkiksi, jos myymälä kaksinkertaistaisi hammaslangan hinnan, hammastahnan asiakas ostaisi sen silti?
Kontrafaktuaalit voivat osoittaa syy-yhteyden olemassaolon. Kontrafaktuaaleja sisältävät mallit mahdollistavat tarkat interventiot, joiden seuraukset voidaan ennakoida. Äärimmäisessä tapauksessa tällaiset mallit hyväksytään fysikaalisiksi laeiksi, esimerkiksi hitauslaki sanoo, että jos paikallaan olevaan esineeseen ei kohdisteta voimaa, se ei liiku [9] .
Tilastot keskittyvät useiden muuttujien välisten suhteiden analysointiin. Perinteisesti näitä suhteita kuvataan korrelaatioiksi , assosiaatioiksi ilman mitään implisiittistä kausaalisuutta . Kausaaliset mallit yrittävät laajentaa tätä viitekehystä lisäämällä siihen kausaation käsitteen, jossa yhden muuttujan muutokset aiheuttavat muutoksia muissa [7] .
1900-luvun kausaalisuuden määritelmät perustuivat yksinomaan todennäköisyyksiin/assosiaatioihin. On sanottu, että yksi tapahtuma (X) aiheuttaa toisen, jos se lisää toisen (Y) todennäköisyyttä. Matemaattisesti tämä ilmaistaan muodossa
Tällaiset määritelmät ovat riittämättömiä, koska muut suhteet (esimerkiksi X:n ja Y:n yhteinen syy) voivat täyttää ehdon. Syy-yhteys liittyy tikkaiden toiseen asteeseen. Yhdistykset ovat ensimmäisessä vaiheessa ja tarjoavat todisteita vain jälkimmäisestä. Myöhempi määritelmä yritti ratkaista tämän epäselvyyden taustatekijöiden ehdolla. Matemaattisesti tämä ilmaistaan muodossa
jossa K on joukko taustamuuttujia ja k ovat näiden muuttujien arvot tietyssä kontekstissa. Vaadittu taustamuuttujien joukko on kuitenkin määrittelemätön niin kauan kuin todennäköisyys on ainoa kriteeri, koska useat joukot voivat lisätä todennäköisyyttä.
Muita yrityksiä kausaalisuuden määrittämiseksi ovat Grangerin kausaalisuus , tilastollinen testi hypoteesille, jonka mukaan taloustieteessä kausaalisuutta voidaan arvioida mittaamalla kykyä ennustaa yhden aikasarjan tulevaisuuden arvoja toisen aikasarjan aikaisempien arvojen perusteella.
Syy voi olla välttämätön, riittävä, suotuisa tai sillä voi olla useita näistä ominaisuuksista [14] .
välttämättömyysJotta tapahtuma x olisi välttämätön syy y:lle, y:n läsnäolon täytyy tarkoittaa x:n aiempaa esiintymistä. X:n läsnäolo ei kuitenkaan tarkoita, että y tapahtuu. Tämä tarkoittaa, että y:tä ei olisi tapahtunut, jos x ei olisi tapahtunut.
Riittävät syytJotta tapahtuma x olisi riittävä syy y:lle, x:n läsnäolon täytyy merkitä y:n myöhempää esiintymistä. Toinen z:n syy voi kuitenkin itsenäisesti aiheuttaa y:n. Siten y:n läsnäolo ei edellytä x:n aiempaa esiintymistä [15] .
Liittyvät syytJotta x olisi y:n samanaikainen syy, x:n läsnäolon on lisättävä y:n todennäköisyyttä. Jos todennäköisyys on 100%, niin x:n sanotaan olevan riittävä. Myös samanaikainen syy voi olla tarpeen [16] .
Syy-kaavio on suunnattu kaavio , joka näyttää kausaalisen mallin muuttujien väliset syysuhteet. Se sisältää joukon muuttujia (tai solmuja ). Jokainen solmu on yhdistetty nuolella yhteen tai useampaan muuhun solmuun, joihin sillä on kausaalinen vaikutus. Nuoli määrittelee kausaalisuuden suunnan , esimerkiksi nuoli, joka yhdistää muuttujat A ja B nuolella pisteessä B, osoittaa, että muutos A:ssa aiheuttaa muutoksen B:ssä (sopivalla todennäköisyydellä). Polku on kaavion läpikulku kahden kausaalinuolia seuraavan solmun välillä.
Syy-kaaviot sisältävät sykliset kaaviot , suunnatut asykliset kaaviot ja Ishikawa-kaaviot [9] .
Syy-kaaviot eivät riipu kvantitatiivisista todennäköisyyksistä. Muutokset näissä todennäköisyyksissä (esim. teknologisista parannuksista johtuvat) eivät vaadi muutoksia malliin.
Kausaalimalleilla on muodollisia rakenteita elementeillä, joilla on tiettyjä ominaisuuksia.
KytkentämallitKolmen solmun liitäntöjä on 3 tyyppiä - lineaariset piirit, haarukat ja törmäimet .
KetjutKetjut ovat suoria viestintälinjoja, joissa nuolet osoittavat syystä seuraukseen. Tässä mallissa B on välittäjä siinä mielessä, että hän välittää vaikutusta, joka A:lla olisi C:hen.
Haarukat
Haarukoissa yhdellä syyllä on monia seurauksia. A:n ja C:n välillä on ei-kausaalinen, harhaanjohtava korrelaatio , joka voidaan eliminoida ehdottamalla B:tä tietylle B:n arvolle.
Haarukan kehitys näyttää tältä:
Tällaisissa malleissa B on A:n ja C:n yleinen syy (joka aiheuttaa myös A:n), jolloin B on välittäjä.
ColliderTörmäyslaitteissa useat syyt vaikuttavat samaan tulokseen. B:n tietyn arvon ehdollistaminen paljastaa usein epäsyyllisen negatiivisen korrelaation A:n ja C:n välillä. Tätä negatiivista korrelaatiota on kutsuttu törmäysvirheeksi : B selittää A:n ja C:n välisen korrelaation. Korrelaatio voi olla positiivinen, kun sekä A:n että C:n panokset ovat tarvitaan vaikuttamaan B:
Välitysmuuttuja muuttaa muiden syiden vaikutusta lopputulokseen (toisin kuin pelkkä lopputulokseen vaikuttaminen). Esimerkiksi yllä olevassa esimerkissä piiri B on välittäjä, koska se muuttaa A:n (epäsuora syy C) vaikutuksen C:ksi (tulos).
Hämmentävä muuttujaHämmentävä muuttuja ( confounder ) vaikuttaa useisiin tuloksiin luomalla positiivisen korrelaation niiden välille.
InstrumenttimuuttujaInstrumenttimuuttuja:
Regressiokertoimet voivat mitata instrumentaalimuuttujan kausaalista vaikutusta tulokseen, kunhan tämä vaikutus ei ole sotkeutunut.[ määritä ] . Näin ollen instrumentaaliset muuttujat mahdollistavat syytekijöiden kvantifioinnin ilman hämmentäviä muuttujia koskevia tietoja.
Esimerkiksi mallissa:
jossa Z on instrumentaalinen muuttuja, koska sillä on polku tulokseen Y eikä sillä ole kantaa esimerkiksi U:lle.
Voit parantaa mallin tarkkuutta ehdollistamalla toisen muuttujan, joka estää työkalun ja hämmennystekijän väliset polut, ja yhdistämällä useita muuttujia yhdeksi työkaluksi.
Riippumattomuusehdot ovat sääntöjä, joilla päätetään, ovatko kaksi muuttujaa toisistaan riippumattomia. Muuttujat ovat riippumattomia, jos yhden arvot eivät vaikuta suoraan toisen arvoihin. Useat syy-mallit voivat jakaa riippumattomuusehdot. Esimerkiksi mallit
ja
niillä on samat riippumattomuusehdot, koska B:n ehdollisuus jättää A:n ja C:n riippumattomiksi. Näillä kahdella mallilla ei kuitenkaan ole sama arvo, ja ne voidaan väärentää tietojen perusteella (eli jos havaintotiedot osoittavat suhteen A:n ja C:n välillä B:n ehdollistamisen jälkeen, molemmat mallit ovat vääriä). Sitä vastoin tiedot eivät voi osoittaa, kumpi kahdesta mallista on oikea, koska niillä on samat riippumattomuusehdot. Muuttujan ehdollistaminen on mekanismi hypoteettisten kokeiden suorittamiseksi. Muuttujan ehdollistamiseen kuuluu muiden muuttujien arvojen tutkiminen ehdollisen muuttujan tietylle arvolle. Ensimmäisessä esimerkissä ehdollistaminen B:lle merkitsee sitä, että havainnot tietylle B:n arvolle eivät saa näyttää mitään suhdetta A:n ja C:n välillä. Jos tällainen suhde on olemassa, malli on väärä. Ei-kausaaliset mallit eivät voi tehdä tällaisia eroja, koska ne eivät anna kausaalisia väitteitä.
Tärkeä osa korrelaatiotutkimusta on tunnistaa mahdollisesti ristiriitaiset vaikutukset tutkittavaan muuttujaan, kuten demografisiin tekijöihin . Oikeaa hämmentävien muuttujien luetteloa ei kuitenkaan voida määrittää etukäteen. Näin ollen on mahdollista, että tutkimus voi hallita epäolennaisia muuttujia tai jopa (epäsuorasti) tutkittavaa muuttujaa.
Kausaaliset mallit tarjoavat luotettavan menetelmän relevanttien hämmentäviä muuttujia tunnistaa. Muodollisesti Z on hämmentävä, jos Y on yhdistetty Z:hen poluilla, jotka eivät kulje X:n läpi. Nämä voidaan usein määrittää käyttämällä muita tutkimuksia varten kerättyä dataa.
Jotta voidaan analysoida X:n kausaalista vaikutusta Y:ään kausaalimallissa, kaikkia hämmennysmuuttujia on säädettävä.