A Sir Francis Galtonról elnevezett Galton -probléma a kultúrák közötti adatokból való következtetés problémája egy ma hálózati autokorreláció néven ismert statisztikai jelenségen . A problémát ma már általános problémaként ismerik fel, amely minden nem kísérleti kutatásra, valamint a kísérleti tervezésre vonatkozik. Legegyszerűbben a statisztikai számítások külső problémájaként írható le, ahol a kiválasztott tételek statisztikailag nem függetlenek. Ha megkérdezünk két embert ugyanabban a házban, például, hogy néznek-e tévét, nem kapunk statisztikailag független válaszokat. A független megfigyelések n mintanagysága ebben az esetben egy, nem kettő. A megfelelő korrekciók elvégzése után ez már foglalkozik a külső függőségekkel, majd a valószínűségszámítás statisztikai függőségre vonatkozó axiómáit alkalmazzuk. Az ilyen axiómák fontosak a variabilitás kritériumainak meghatározásához (például) vagy a statisztikai szignifikancia teszteléséhez .
1888-ban Galton jelen volt, amikor Sir Edward Tylor bemutatta munkáját a Királyi Antropológiai Intézetben. Tylor 350 kultúra számára gyűjtött információkat a házasság és az öröklés intézményeiről, valamint vizsgálta ezen intézmények összefüggéseit a társadalom szerkezetének fejlettségi szintjével. Tylor eredményeit úgy értelmezte, mint amelyek egy általános evolúciós folyamatot jeleznek, amelyben az intézmények a társadalom társadalmi szerkezetének fejlődésével az anyairól az apaira helyezték át fókuszukat. Galton ezzel nem értett egyet, rámutatva, hogy a kultúrák közötti hasonlóságok oka lehet az örökbefogadás, a közös leszármazás vagy az evolúciós fejlődés; támogatta azt az elképzelést, hogy a kölcsönzés és a közös származás paramétereinek ellenőrzése nélkül nem lehet megbízható következtetéseket levonni az evolúciós fejlődésről. Galton kritikája a névadó Galton Problem , [1] :175 néven vált ismertté , ahogy Raul Naroll nevezte , [2] [3] aki az első statisztikai megoldásokat javasolta.
A 20. század elejére az unilineáris evolúció elmélete feledésbe merült, ahogy az evolúciós szekvencia-korrelációkból való közvetlen következtetések levonása is. Galton kritikája azonban bebizonyította, hogy a korrelációkból funkcionális kapcsolatokra következtet. Az autokorreláció problémája továbbra is fennáll.
1914-ben William S. Gosset statisztikus módszereket dolgozott ki a hamis összefüggések kiküszöbölésére azon alapul, hogy az időben és térben való elhelyezkedés hogyan befolyásolja a hasonlóság mértékét. A választásokkal kapcsolatos kortárs lakossági közvélemény-kutatások hasonló problémát mutatnak: minél közelebb van a választás, annál kevesebben gondolkodnak önállóan, és annál nagyobb a megbízhatatlanság a közvélemény-kutatási eredményekben, különösen a hibahatárban vagy a bizalmi határokban . A mintapopulációjukból n független eset teljesítménye csökken a választások közeledtével.
A statisztikai szignifikancia az alacsonyabb effektív mintaméretekkel párhuzamosan esik.
Probléma merül fel a mintavételes felméréseknél, amikor az interjúidő lerövidítése érdekében a szociológusok a sokaságot helyi klaszterekre osztják, és véletlenszerűen mintát vesznek a klaszterek között, majd ismét a klasztereken belül. Ha egy m méretű klaszterben n számú embert kérnek le, akkor az effektív mintanagyság (efs) alsó határa 1 + (n − 1) / m, ha a klaszterben mindenki azonos. Ha egy klaszteren belül csak részleges hasonlóság van, akkor a jelen képletben m ennek megfelelően csökken. Ez a képlettípus 1 + d (n − 1), ahol d a kérdéses statisztika osztályon belüli korrelációja. [négy]
Általában a megfelelő ef-ek becslése a becsült statisztikáktól függ, mint például az átlagtól, a khi-négyzettől, a korrelációtól , a regressziós együtthatótól és ezek variációitól . A kultúrák közötti tanulmányokhoz Murdoch és White [5] megbecsülte a hasonlósági foltok méretét 186 társadalmat tartalmazó mintájukban. Az általuk vizsgált négy változó – a nyelv, a közgazdaságtan, a politikai integráció és az öröklődés – hasonlósági foltokkal rendelkezik, amelyek mérete 3-tól 10-es méretig terjedt. Egy hüvelykujjszabállyal eloszthatjuk a hasonlósági foltok méretének négyzetgyökét n-nel úgy, hogy a Hatékony a mintaméret 58 és 107 az adott foltokhoz . Ismét csökken a statisztikai szignifikancia alacsonyabb effektív mintaméretekkel.
A modern elemzésben a térbeli lemaradásokat modellezzük a modern társadalmak globalizációs szintjének felmérése érdekében. [6]
A térbeli korreláció vagy autokorreláció a földrajz alapvető fogalma. A térbeli autokorreláció mérésére és monitorozására használt geográfusok által kifejlesztett módszerek [7] [8] sokkal többet tesznek annál, mint hogy egyszerűen csökkentik az n effektív értékét a korreláció szignifikanciájának tesztelésére. Az egyik példa egy kifinomult hipotézis, amely szerint "a szerencsejáték jelenléte egy társadalomban egyenesen arányos a kereskedelmi alapok jelenlétével és a jelentős társadalmi-gazdasági különbségek jelenlétével, és fordítottan összefügg azzal, hogy a társadalom nomád terelőtársadalom-e vagy sem. Ezt a hipotézist egy 60 társadalomból álló mintában nem tudták elvetni a nullhipotézist , de az autokorrelációs elemzés kimutatta a társadalmi- gazdasági különbségek jelentős hatását [9]
Mennyire gyakori az autokorreláció a kultúrák közötti vizsgálatban figyelembe vett változók között? Anton Eff egy összevont adatbázisban 1700 változóval tesztelte a World Cultures-ben közzétett Standard Cross-Cultural Sample-t, és megmérte a Moran-I indexet a térbeli autokorrelációra (távolság), a nyelvi autokorrelációra (közös származás) és a kulturális komplexitás autokorrelációjára (alapfejlődés). "Az eredmények azt sugallják, hogy... érdemes lenne tesztelni a térbeli és filogenetikai autokorrelációt, amikor regressziós elemzéseket végeznek a Standard Cross-Cultural Sampling segítségével." [tíz]
Az autokorrelációs tesztek feltáró adatelemzésekben való felhasználását szemléltetjük, tükrözve, hogy egy adott vizsgálatban a változókat hogyan lehet értékelni az esetfüggetlenség hiányában a távolság, a nyelv és a kulturális komplexitás tekintetében. Ezeknek az autokorrelációs hatásoknak az értékelésére szolgáló módszereket azután elmagyarázzuk és szemléltetjük a közönséges legkisebb négyzetek regressziójára, a Moran-féle autokorrelációs index szignifikancia mértékével.
Ha van autokorreláció, akkor gyakran kiküszöbölhető, hogy a regressziós együtthatók és változóik torzítatlan becslését kapjuk egy reset függő változó összeállításával, amely "lemarad" a függő változó más helyeken történő újrasúlyozásával, ahol a súly a kapcsolat mértéke. Egy ilyen lemaradástól függő változó endogén, és a becsléshez vagy kétlépcsős legkisebb négyzetek módszere vagy maximum likelihood módszere szükséges. [tizenegy]
A nyilvános szerver, ha külsőleg használják a http://SocSciCompute.ss.uci.edu címen , etnográfiai adatokat, változókat és következtetési eszközöket kínál a Dow (2007) és az Eff & Dow (2009) R-scriptekkel az NSF által támogatott projektekben. ( http://getgalaxy.org ) és ( https://www.xsede.org ) oktatók, diákok és kutatók számára, hogy CoSSci (Integrált Társadalomtudományi) Kultúrák közötti Kutatási Szimulációkat végezzenek, a Galton problémáját a szabványos, kultúrák közötti mintavételi változók elérhetők a https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt címen .
Az antropológiában, ahol a Tylor-problémát először Galton statisztikus ismerte fel 1889-ben, még mindig nem széles körben elfogadott, hogy a megfigyelt példákban a hasonlósági foltok problémájára léteznének szabványos statisztikai kiigazítások, sem pedig az autokorrelációs technikák segítségével történő új felfedezések lehetősége. Egyes kultúrák közötti kutatók (lásd például Korotaev és de Munk, 2003) [12] arra a következtetésre jutottak, hogy a rokon társadalmak és egyének közötti elterjedés, történelmi eredet és más hasonlóság forrásairól szóló bizonyítékokat át kell nevezni Galton Opportunity vagy Galton Resource névre. mintsem Galton-problémának nevezzük. A kutatók manapság longitudinális, kultúrák közötti és regionális eltérések elemzését használják fel, hogy rutinszerűen feltárják a versengő hipotéziseket: funkcionális kapcsolatok, eloszlás, közös történelmi származás, többvonalas evolúció, a környezettel való együttes alkalmazkodás és a komplex társadalmi interakciók dinamikája . [13]
Az antropológián belül gyakran hivatkoznak Galton problémájára az összehasonlító tanulmányok elutasításának indokaként. Mivel a probléma általános jellegű, közös a tudományokban és általában a statisztikai következtetésekben, a kultúrák közötti vagy összehasonlító tanulmányok ilyen specifikus kritikája – és sok ilyen van – logikusan a tudomány és a statisztika együttes elutasításához vezet. Az etnográfusok által összegyűjtött és elemzett adatok például szintén Galton problémájának tárgyát képezik, a legtágabb értelemben értelmezve. Az összehasonlításellenes kritika kritikája nem korlátozódik a statisztikai összehasonlításra, hanem a szövegelemzésre is érvényes lesz. Vagyis a szöveg elemzése és használata az érvelésben kritikák tárgyát képezi a következtetések bizonyítékalapját illetően. A pusztán a retorikára hagyatkozás nem jelent védelmet egy érv érvényességének és bizonyítékalapjának bírálatával szemben.
Aligha kétséges azonban, hogy a kultúrák közötti kutatóközösség véletlenül figyelmen kívül hagyja Galton problémáját. A témával kapcsolatos szakértői kutatások olyan eredményeket mutatnak be, amelyek "erősen azt sugallják, hogy a khi-négyzet kölcsönös függetlenségének naiv tesztjeiről szóló kiterjedt jelentések az elmúlt néhány évtizedben kultúrák közötti adatok felhasználásával tévesen utasították el a null elméleteket a jósolt 5%-nál lényegesen magasabb szinten". [14] :247
A kutató arra a következtetésre jut, hogy "azok a helytelen elméletek, amelyeket a kölcsönös khi-négyzet függetlenségének naiv tesztjeivel "megőriztek" összehasonlító adatok felhasználásával, a jövőben is szigorúan tudományosan tesztelhetők." [14] :270 A korrigált klasztermintaváltozót ebben a formában 1 + d-vel (k + 1) szorozva adjuk meg, ahol k az átlagos klaszterméret, a bonyolultabb korreláció pedig a keresztezés korrelációs változójaként van megadva. táblázatok r sorral és oszloppal. A jelen kritika 1993-as megjelenése és más ehhez hasonló állítások óta több szerző kezdte adaptálni az összefüggéseket a Galton-problémára, azonban a legtöbb kultúraközi területen dolgozó szakember nem teszi ezt. Ennek megfelelően a publikált eredmények többsége, amelyek naiv szignifikancia-tesztekre támaszkodnak, és a P < 0,05 szabványt alkalmazzák, nem pedig a P < 0,005 szabványt, valószínűleg tévesek, mivel hajlamosabbak az I. típusú hibára, amely elutasítja a nullhipotézist, ha az igaz.
Egyes kultúrák közötti kutatók elutasítják Galton problémájának komolyságát, mert úgy vélik, hogy a korrelációs becslések és eszközök objektívek lehetnek még akkor is, ha létezik autokorreláció (akár gyenge, akár erős). Autokorrelációs vizsgálat nélkül azonban továbbra is tévesen ítélhetik meg a változók közötti kapcsolatokra vonatkozó statisztikákat. A regressziós elemzésben például az autokorrelált reziduumok mintázatainak vizsgálata fontos támpontokat adhat olyan harmadik tényezőkhöz, amelyek befolyásolhatják a változók közötti kapcsolatokat, de nem szerepeltek a regressziós modellben. Másodszor, ha hasonló vagy rokon társadalmak klaszterei vannak a mintában, a varianciaméréseket alulbecsülik, ami félrevezető statisztikai következtetésekhez vezet, például a korrelációk statisztikai szignifikanciájának túlbecsüléséhez. Harmadszor, a variancia alábecslése megnehezíti a két különböző mintából származó eredmények replikációjának ellenőrzését, mivel az eredményeket gyakran hasonlónak tekintik.