Sir Francis Galtonin mukaan nimetty Galtonin ongelma on kulttuurienvälisistä tiedoista päättelemisen ongelma, joka perustuu tilastolliseen ilmiöön, joka tunnetaan nykyään verkkoautokorrelaationa .. Ongelma tunnustetaan nyt yleiseksi ongelmaksi, joka koskee kaikkea ei-kokeellista tutkimusta sekä kokeellista suunnittelua. Sitä voidaan yksinkertaisesti kuvata tilastollisten laskelmien ulkoiseksi ongelmaksi, jossa valitut kohteet eivät ole tilastollisesti riippumattomia. Jos kysyt kahdelta samassa talossa olevalta ihmiseltä esimerkiksi katsovatko he televisiota, et saa tilastollisesti riippumattomia vastauksia. Riippumattomien havaintojen otoskoko n on tässä tapauksessa yksi, ei kaksi. Asianmukaisten säätöjen jälkeen tämä käsittelee jo ulkoisia riippuvuuksia, ja sitten sovelletaan todennäköisyysteorian tilastollista riippuvuutta koskevia aksioomia. Sellaisia aksioomiatärkeää vaihtelevuuden kriteerien asettamiseen (esimerkiksi) tai tilastollisen merkitsevyyden testaamiseen .
Vuonna 1888 Galton oli läsnä, kun Sir Edward Tylor esitteli työnsä Royal Anthropological Institutessa. Tylor keräsi tietoa avioliiton ja perinnön instituutioista 350 kulttuurilta ja tutki myös näiden instituutioiden välistä korrelaatiota yhteiskunnan rakenteen kehitystasoon. Tylor tulkitsi tulokset osoittavan yleisen evolutionaarisen sekvenssin, jossa instituutiot muuttivat painopisteensä äidiltä isän yhteiskunnan sosiaalisen rakenteen kehittyessä. Galton oli eri mieltä ja huomautti, että kulttuurien väliset yhtäläisyydet saattoivat johtua adoptiosta, yhteisestä syntyperästä tai evolutionaarisesta kehityksestä; hän kannatti ajatusta, että ilman lainaamisen ja yhteisen esivanhemman parametrien valvontaa ei voida tehdä luotettavia johtopäätöksiä evoluution kehityksestä. Galtonin kritiikki tuli tunnetuksi samannimisenä Galton - ongelmana [1] :175 , kuten sitä kutsui Raul Naroll , [2] [3] joka ehdotti ensimmäiset tilastolliset ratkaisut.
1900-luvun alkuun mennessä yksilineaarisen evoluution teoria oli unohdettu, samoin kuin suorien johtopäätösten tekeminen evolutionaarisista sekvenssikorrelaatioista. Galtonin kritiikki on kuitenkin osoittanut pätevyyden päätellä toiminnallisia suhteita korrelaatioista. Autokorrelaation ongelma oli edelleen olemassa.
Vuonna 1914 tilastotieteilijä William S. Gosset kehitti menetelmiä virheellisten korrelaatioiden poistamiseksi sen perusteella, kuinka sijainti ajassa ja tilassa vaikuttaa samankaltaisuuden asteeseen. Tämän hetken väestökyselyt vaaleista osoittavat samanlaisen ongelman: mitä lähempänä vaaleja, sitä vähemmän ihmiset ajattelevat itsenäisesti ja sitä suurempi on kyselytulosten epäluotettavuus, erityisesti virhemarginaali tai luottamusrajat . Otospopulaatiosta n riippumattoman tapauksen suorituskyky laskee vaalien lähestyessä.
Tilastollinen merkitsevyys laskee rinnakkain pienempien efektiivisten otoskokojen kanssa.
Ongelma syntyy otantatutkimuksissa, kun haastatteluajan lyhentämiseksi sosiologit jakavat populaation paikallisiin klustereihin ja ottavat satunnaisesti otoksen klustereiden kesken ja sitten taas otoksen klustereiden sisällä. Jos he pollaavat n lukumäärää ihmisiä koon m klusterista, tehokkaan otoskoon (efs) alaraja on 1 + (n − 1) / m, jos kaikki klusterin jäsenet ovat identtisiä. Jos klusterin sisällä on vain osittainen samankaltaisuus, nykyisen kaavan m pienenee vastaavasti. Tämän tyyppinen kaava on 1 + d (n − 1), jossa d on luokan sisäinen korrelaatio kyseessä olevalle tilastolle. [neljä]
Yleisesti ottaen vastaavien efs-arvojen estimaatti riippuu arvioiduista tilastoista, kuten keskiarvosta, khinneliöstä, korrelaatiosta , regressiokertoimesta ja niiden vaihteluista . Kulttuurien välisiä tutkimuksia varten Murdoch ja White [5] arvioivat samankaltaisuuslaastarien koon 186 yhteiskunnan otoksessaan. Heidän neljällä tutkimallaan muuttujalla – kieli, taloustiede, poliittinen integraatio ja perintö – oli samankaltaisuuslappuja, jotka vaihtelivat kooltaan 3 kokoon 10. Nyrkkisääntöä voidaan käyttää samankaltaisuusmerkkien koon neliöjuuren jakamiseen n:llä siten, että tehokkaita otoskoot ovat 58 ja 107 annetuille laastareille , vastaavasti. Jälleen tilastollinen merkitsevyys laskee pienemmällä tehokkaalla otoskoolla.
Modernissa analyysissä spatiaalisia viiveitä mallinnetaan nykyaikaisten yhteiskuntien globalisaatiotason arvioimiseksi. [6]
Spatiaalinen korrelaatio tai autokorrelaatio on maantieteen peruskäsite. Maantieteilijöiden kehittämät menetelmät, joita käytetään spatiaalisen autokorrelaation mittaamiseen ja seuraamiseen [7] [8] , tekevät paljon enemmän kuin pelkän n:n tehollisen arvon pienentämisen korrelaation merkityksen testaamiseksi. Yksi esimerkki on hienostunut hypoteesi, jonka mukaan "uhkapelaamisen esiintyminen yhteiskunnassa on suoraan verrannollinen kaupallisten rahastojen olemassaoloon ja merkittävien sosioekonomisten erojen olemassaoloon, ja se on käänteisessä suhteessa siihen, onko yhteiskunta nomadipaimenyhteiskunta vai ei. Tätä hypoteesia 60 yhteiskunnan otoksessa he eivät kyenneet hylkäämään nollahypoteesia , mutta autokorrelaatioanalyysi osoitti sosioekonomisten erojen merkittävän vaikutuksen [9]
Kuinka yleinen autokorrelaatio on monikulttuurisessa tutkimuksessa käsiteltyjen muuttujien välillä? Anton Eff testasi 1 700 muuttujaa yhdistetyssä tietokannassa World Cultures -lehdessä julkaistulle Standard Cross-Cultural Sample -näytteelle ja mittasi Moran's I -indeksin spatiaalisen autokorrelaation (etäisyyden), kielellisen autokorrelaation (yhteissyntyinen) ja kulttuurisen monimutkaisuuden autokorrelaation (perusevoluutio) osalta. "Tulokset viittaavat siihen, että... kannattaisi testata spatiaalista ja fylogeneettistä autokorrelaatiota suoritettaessa regressioanalyysejä Standard Cross-Cultural Samplingilla." [kymmenen]
Autokorrelaatiotestien käyttöä tutkivissa data-analyyseissä on havainnollistettu, mikä heijastaa sitä, kuinka tietyn tutkimuksen muuttujia voitaisiin arvioida, jos tapausriippumattomuutta ei ole etäisyyden, kielen ja kulttuurisen monimutkaisuuden suhteen. Tämän jälkeen näiden autokorrelaatiovaikutusten arviointimenetelmät selitetään ja havainnollistetaan tavalliselle pienimmän neliösumman regressiolle käyttämällä Moranin I autokorrelaatioindeksin merkitsevyyden mittaa.
Jos autokorrelaatio on olemassa, se voidaan usein eliminoida puolueettoman arvion saamiseksi regressiokertoimista ja niiden muuttujista rakentamalla reset-riippuvainen muuttuja, joka "viivästyy" painottamalla riippuva muuttuja uudelleen muissa paikoissa, joissa paino on suhteen aste. Tällainen viiveestä riippuva muuttuja on endogeeninen ja estimointi vaatii joko kaksivaiheisen pienimmän neliösumman menetelmän tai maksimitodennäköisyyden menetelmän. [yksitoista]
Julkinen palvelin, kun sitä käytetään ulkoisesti osoitteessa http://SocSciCompute.ss.uci.edu , tarjoaa etnografisia tietoja, muuttujia ja päättelytyökaluja Dow'n (2007) ja Eff & Dow'n (2009) R-skripteillä NSF:n tukemissa projekteissa. ( http://getgalaxy.org ) ja ( https://www.xsede.org ) opettajille, opiskelijoille ja tutkijoille suorittamaan CoSSci (Integrated Social Science) -kulttuurien välisiä tutkimussimulaatioita, jotka hallitsevat Galtonin ongelmaa käyttämällä vakiomuotoiset kulttuurien väliset näytteenottomuuttujat ovat saatavilla osoitteessa https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt .
Antropologiassa, jossa tilastotieteilijä Galton tunnisti Tylor-ongelman ensimmäisen kerran vuonna 1889, ei vieläkään ole laajalti hyväksyttyä, että havainnoiduissa esimerkeissä on vakiomuotoisia tilastollisia mukautuksia samankaltaisuuspisteiden ongelmaan, eikä mahdollisuutta tehdä uusia löytöjä autokorrelaatiotekniikoita käyttämällä. Jotkut kulttuurien väliset tutkijat (katso esimerkiksi Korotaev ja de Munk, 2003) [12] päättelevät, että todisteet levinneisyydestä, historiallisesta alkuperästä ja muista samankaltaisuuden lähteistä sukulaisten yhteiskuntien ja yksilöiden välillä tulisi nimetä uudelleen Galton Opportunity tai Galton Resource. sen sijaan, että sitä kutsuttaisiin Galtonin ongelmaksi. Tutkijat käyttävät nyt pitkittäisen, kulttuurien välisen ja alueellisen vaihtelun analyyseja tutkiakseen rutiininomaisesti kilpailevia hypoteeseja: toiminnallisia suhteita, jakautumista, yhteistä historiallista alkuperää, monilinjaista kehitystä, sopeutumista ympäristöön ja monimutkaisen sosiaalisen vuorovaikutuksen dynamiikkaa . [13]
Antropologiassa Galtonin ongelma mainitaan usein syynä vertailevien tutkimusten hylkäämiselle. Koska ongelma on luonteeltaan yleinen, yhteinen tieteille ja tilastollisille päätelmille yleensä, tällainen erityinen kulttuurienvälisten tai vertailevien tutkimusten kritiikki - ja niitä on monia - johtaa loogisesti tieteen ja tilaston hylkäämiseen yhdessä. Kaikki esimerkiksi etnografien keräämät ja analysoimat tiedot ovat myös Galtonin ongelman alaisia, ymmärrettynä laajimmassa merkityksessä. Vertailun vastaisen kritiikin kritiikki ei rajoitu tilastolliseen vertailuun, vaan se pätee myös tekstianalyysiin. Toisin sanoen tekstin analysointia ja käyttöä väitteessä voidaan arvostella johtopäätösten todisteiden pohjalta. Pelkästään retoriikkaan tukeutuminen ei ole puolustus väitteen pätevyyttä ja sen todisteita koskevaa kritiikkiä vastaan.
On kuitenkin tuskin epäilystäkään siitä, etteikö kulttuurien välinen tutkimusyhteisö sivuuttaisi Galtonin ongelmaa. Asiantuntijatutkimukset osoittavat havaintoja, jotka viittaavat vahvasti siihen, että laajat raportit naiiveista chi-neliön keskinäisen riippumattomuuden testeistä, joissa on käytetty kulttuurien välistä dataa viime vuosikymmeninä, ovat hylänneet nollateoriat väärin tasoilla, jotka ovat huomattavasti ennustettua 5 % korkeammat. [14] :247
Tutkija päättelee, että "Väärät teoriat, jotka on "säilytetty" naiiveilla keskinäisen chi-neliöriippumattomuuden testeillä vertailevan datan avulla, voidaan edelleen testata tiukasti tieteellisesti tulevaisuudessa." [14] :270 Muokattu klusterin näytemuuttuja annetaan jälleen sellaisenaan kerrottuna luvulla 1 + d (k + 1), missä k on keskimääräinen klusterin koko ja monimutkaisempi säätö annetaan ristikon korrelaatiomuuttujana. taulukot r rivillä ja sarakkeella. Sen jälkeen kun tämä kritiikki julkaistiin vuonna 1993, samoin kuin muut sen kaltaiset lausunnot, useammat kirjoittajat ovat alkaneet mukauttaa korrelaatioita Galtonin ongelmaan, mutta useimmat kulttuurienvälisellä alalla työskentelevät asiantuntijat eivät sitä tee. Näin ollen suurin osa julkaistuista tuloksista, jotka perustuvat naiiveihin merkitsevyystesteihin ja mukauttavat P < 0,05 -standardia P < 0,005:n sijaan, ovat todennäköisesti virheitä, koska ne ovat alttiimpia tyypin I virheille, mikä hylkää nollahypoteesin, kun se on totta.
Jotkut kulttuurienväliset tutkijat hylkäävät Galtonin ongelman vakavuuden, koska he uskovat, että korrelaatioarviot ja -keinot voivat olla objektiivisia, vaikka autokorrelaatio olisi olemassa (jopa heikko tai vahva). Ilman autokorrelaatiotutkimusta he voivat silti arvioida tilastot väärin muuttujien välisistä suhteista. Esimerkiksi regressioanalyysissä autokorreloitujen jäännösten mallien tutkiminen voi tarjota tärkeitä vihjeitä kolmansiin tekijöihin, jotka voivat vaikuttaa muuttujien välisiin suhteisiin, mutta joita ei sisällytetty regressiomalliin. Toiseksi, jos otoksessa on samankaltaisten tai toisiinsa liittyvien yhteiskuntien klustereita, varianssimittaukset aliarvioidaan, mikä johtaa harhaanjohtaviin tilastollisiin päätelmiin, kuten korrelaatioiden tilastollisen merkityksen yliarviointiin. Kolmanneksi varianssin aliarvioiminen vaikeuttaa kahden eri näytteen tulosten replikaatioiden tarkistamista, koska tulokset usein hylätään samanlaisina.