Oksági modell

Az oksági modell , az oksági modell  egy fogalmi modell , amely egy rendszer oksági mechanizmusait írja le . Az oksági modellek javíthatják a kutatás minőségét azáltal, hogy világos szabályokat adnak a független változók elemzésbe való bevonására [2] . Lehetővé tehetik bizonyos kérdések megválaszolását a meglévő megfigyelési adatok alapján anélkül, hogy intervenciós vizsgálatra, például randomizált kontrollált vizsgálatra lenne szükség . Egyes beavatkozási tanulmányok etikai vagy gyakorlati okokból nem alkalmasak, ami azt jelenti, hogy oksági modell nélkül egyes hipotézisek nem tesztelhetők [3] .

Az ok-okozati modellek segíthetnek a külső érvényesség kérdésének megoldásában (hogy egy vizsgálat eredményei érvényesek-e feltáratlan csoportokra). Az ok-okozati modellek lehetővé teszik több tanulmányból származó adatok kombinálását olyan kérdések megválaszolására, amelyekre egyetlen adathalmaz sem tud válaszolni. Az ok- okozati modellek meghamisíthatók , és ha nem illeszkednek az adatokhoz, akkor érvénytelenként el kell őket utasítani. Érthetőnek kell lenniük azok számára is, akik közel állnak a modell által megmagyarázni kívánt jelenségekhez [4] .

Az oksági modelleket a jelfeldolgozásban , az epidemiológiában és a gépi tanulásban alkalmazzák . Judah Pearl szerint , amelyet a The  Book of Why 2018-ban fejez ki, az oksági modellek szükséges elemei az erős mesterséges intelligencia fejlesztésének [5] .

Definíció

Az oksági modellek olyan matematikai modellek, amelyek egy adott rendszeren vagy csoporton belül ok-okozati összefüggéseket mutatnak be. Megkönnyítik az ok-okozati összefüggések statisztikai adatokból való következtetését. Sokat elárulhatnak az ok-okozati összefüggés ismeretelméletéről , valamint az okság és a valószínűség közötti kapcsolatról . Alkalmazták azokat a filozófusok érdeklődésére számot tartó témákban is, mint például a döntéselmélet és a tényszerű ok-okozati összefüggés elemzése [6] .

Judah Pearl az oksági modellt rendezett hármasként határozza meg , ahol  olyan exogén változók halmaza, amelyek értékeit a modellen kívüli tényezők határozzák meg; — endogén változók  halmaza, amelyek értékeit a modellen belüli tényezők határozzák meg; és szerkezeti egyenletek halmaza, amely az egyes endogén változók értékét fejezi ki a és  a többi változó értékének függvényében [7] .

Történelem

Arisztotelész meghatározta az ok- okozati összefüggés taxonómiáját , beleértve az anyagi, formális, hatékony és végső okokat. Hume elutasította Arisztotelész megközelítését a kontrafaktuális gondolkodás mellett. Egy ponton tagadta, hogy a tárgyaknak "hatalmai" vannak, amelyek az egyiket okká, a másikat pedig okozattá teszik. Később azonban átvette a kijelentést: "ha az első tárgy nem létezne, a második soha nem létezne" (az okság szükséges feltétele) [8] .

A 19. század végén a statisztika tudományos tudományágként kezdett formát ölteni. Miután több éven át igyekezett azonosítani az ok-okozati szabályokat olyan területeken, mint a biológiai öröklődés , Galton bevezette a regresszió fogalmát az átlagba (megfigyelve a másodéves szindrómát a sportban), ami később a korreláció nem oksági fogalmához vezetett .

Karl Pearson pozitivista lévén kizárta az okság fogalmát a legtöbb tudományból, mint az asszociáció bizonyíthatatlan speciális esetét, és bevezette a korrelációs együtthatót mint asszociációs mérőszámot. Azt írta: "Az erő, mint a mozgás oka pontosan ugyanaz, mint a fa istene, mint a növekedés oka", és hogy az okság csak "fétis a modern tudomány felfoghatatlan titkai között". Pearson megalapította a Biometrika céget és a biometrikus laboratóriumot a University College Londonban , amely a statisztikai kutatás világelsőjévé vált.

1908-ban Hardy és Weinberg megoldotta a vonások stabilitásának problémáját , és megoldásuk arra késztette Galtont , hogy felhagyjon az ok-okozati összefüggésekkel, újjáélesztve a mendeli öröklődést [9] .

1921-ben Wright az oksági modellezés és az oksági gráfok elméleti ősévé vált. Ezt a megközelítést azért dolgozta ki, hogy megkísérelje feltárni az öröklődés , a fejlődés és a környezet relatív hatását a tengerimalac bundájára . Elméleti állításait azzal támasztotta alá, hogy bemutatta, hogy egy ilyen elemzés hogyan magyarázhatja meg a tengerimalac születési súlya, a terhességi kor és az alomméret közötti kapcsolatot. A megalapozott statisztikusok ezekkel az elképzelésekkel szembeni ellenállása oda vezetett, hogy a következő 40 évben figyelmen kívül hagyták őket (az állattenyésztők kivételével ). Ehelyett a tudósok összefüggésekre hagyatkoztak, köszönhetően többek között Wright kritikusának, Ronald Fishernek [10] .

1923-ban Jerzy Neumann bevezette a lehetséges kimenetel fogalmát, de írását csak 1990-ben fordították le lengyelről angolra.

1958-ban David Cox arra figyelmeztetett, hogy a Z változót csak akkor szabad szabályozni, ha rendkívül valószínűtlen, hogy független változók befolyásolják. Az 1960-as években Duncan , Blalock és Goldberger újra felfedezte az útelemzést.

A szociológusok eredetileg strukturális egyenletmodellezésnek nevezték az oksági modelleket de miután mechanikus módszerré vált, elvesztette hasznosságát, ami miatt egyes szakemberek elutasították az oksági összefüggést. A közgazdászok átvették az útelemzés algebrai részét, egyenletek szimultán modellezésének nevezve. Azonban továbbra is kerülték, hogy oksági jelentést tulajdonítsanak egyenleteiknek.

Hatvan évvel az első írása után Wright kiadott egy cikket, amelyben összefoglalta az elsőt, Carlin és mások bírálatát követően, akik kifogásolták, hogy csak lineáris kapcsolatokat kezel, és hogy a robusztus, modellmentes adatábrázolások sokkal árulkodóbbak.

1973-ban David Lewis azt szorgalmazta, hogy a korrelációt az okozati összefüggéssel (kontrafaktuálisokkal) cseréljék fel. Utalt az emberek azon képességére, hogy alternatív világokat képzeljenek el, amelyekben egy ok előfordul vagy nem, és amelyekben a hatás csak az ok után jelenik meg. 1974-ben Rubin bevezette a "potenciális kimenetel" fogalmát, mint az ok-okozati kérdések feltevésének nyelvét.

1983-ban Nancy Cartwright azt javasolta, hogy minden olyan tényezőt, amely „ok-okozati összefüggésben van” egy hatással, kondicionálni kell, túllépve a puszta valószínűségen, mint egyedüli iránymutatón.

1986-ban Baron és Kenny bevezette a közvetítés kimutatásának és értékelésének alapelveit egy lineáris egyenletrendszerben [11] . 2014-ben lapjuk minden idők 33. legtöbbet idézettje volt. Ugyanebben az évben Grönland és Robins bevezette a „helyettesíthetőség” megközelítést a zavaró tényezők kezelésére a kontrafaktuális helyzet figyelembevételével. Javasolták, hogy értékeljék, mi történt volna a betegek egy csoportjával, ha nem kaptak volna kezelést, és ezt az eredményt hasonlítsák össze a kontrollcsoport eredményeivel . Ha az eredmények megegyeznek, akkor nincs összefonódás [9] .

Jelenleg a Columbia Egyetem mesterséges intelligencia laboratóriumában folynak kutatások az oksági modellezés elméletének mesterséges neurális hálózatokra való alkalmazásával kapcsolatban [12] .

Oksági létra

Pearl oksági metamodellje háromszintű absztrakciót foglal magában, amelyet az okság létrájának nevez. A legalacsonyabb szint, az asszociatív (látás/megfigyelés), magában foglalja a minták vagy minták észlelését a bemeneti adatokban, összefüggésekben kifejezve. A középső szint, az intervenció előrejelzi a szándékos cselekvések ok-okozati összefüggésben kifejezett következményeit. A legmagasabb szint, a kontrafaktuális, egy olyan elmélet felépítését jelenti, amely megmagyarázza, hogy bizonyos cselekvéseknek miért vannak konkrét hatásai, és mi történik ilyen cselekvések hiányában [9] .

Egyesület

Egy objektum akkor kapcsolódik a másikhoz, ha az egyik megfigyelése megváltoztatja a másik megfigyelésének valószínűségét . Példa: Azok az ügyfelek, akik fogkrémet vásárolnak, nagyobb valószínűséggel vásárolnak fogselymet is . Az asszociációk két esemény korrelációjának kiszámításával is mérhetők . Az asszociációknak nincs ok-okozati jelentésük. Az egyik esemény okozhatja a másikat, ennek fordítottja lehet igaz, vagy mindkét eseményt valamilyen harmadik esemény okozhatja.

Interferencia

Ez a szint bizonyos ok-okozati összefüggéseket állít az események között. Az ok-okozati összefüggést úgy értékelik, hogy kísérletileg végrehajtanak valamilyen cselekvést, amely hatással van az események egyikére. Példa: Ha megdupláznánk a fogkrém árát, mennyi lenne az új vásárlási valószínűség? Ok-okozati összefüggés nem állapítható meg az árváltozások történetének vizsgálatával, mert az árváltozást más ok is okozhatta, amely maga is befolyásolhatta a második eseményt (mindkét áru árát növelő tarifa) [13] .

Ellentétes

A legmagasabb szint, a kontrafaktuális, egy múltbeli esemény alternatív változatának mérlegelését jelenti, vagy azt, hogy mi történhetett volna más körülmények között ugyanazon kísérleti elrendezésben. Például, mekkora a valószínűsége annak, hogy ha egy bolt megduplázná a fogselyem árát, a vásárló a fogkrémet akkor is megvenné?

Az ellentétes tények ok-okozati összefüggés fennállását jelezhetik. A kontrafaktuális modellek olyan precíz beavatkozásokat tesznek lehetővé, amelyek következményei előre jelezhetők. Extrém esetben az ilyen modelleket fizikai törvényként fogadják el, például a tehetetlenség törvénye kimondja, hogy ha egy álló tárgyra nem fejt ki erőt, az nem fog elmozdulni [9] .

Ok-okozati összefüggés

Ok-okozati összefüggés kontra korreláció

A statisztika több változó közötti kapcsolatok elemzése körül forog. Hagyományosan ezeket a kapcsolatokat korrelációknak , asszociációknak írják le , amelyek nem tartalmaznak ok- okozati összefüggést . Az ok-okozati modellek megpróbálják ezt a keretet kibővíteni az ok-okozati összefüggés fogalmának hozzáadásával, amelyben az egyik változó változása mások változását okozza [7] .

Az okság huszadik századi meghatározásai kizárólag a valószínűségeken/asszociációkon alapultak. Azt mondták, hogy az egyik esemény (X) egy másikat okoz, ha növeli egy másik (Y) valószínűségét. Matematikailag ezt a következőképpen fejezzük ki

Az ilyen definíciók nem megfelelőek, mert más kapcsolatok (például X és Y közös oka) kielégíthetik a feltételt. Az ok-okozati összefüggés a létra második fokához kapcsolódik. Az asszociációk az első szakaszban vannak, és csak az utóbbira nyújtanak bizonyítékot. Egy későbbi meghatározás megpróbálta feloldani ezt a kétértelműséget azzal, hogy háttértényezőktől függ. Matematikailag ezt a következőképpen fejezzük ki

ahol K a háttérváltozók halmaza, és k ezeknek a változóknak az értékei egy adott kontextusban. A háttérváltozók szükséges halmaza azonban nincs meghatározva, amíg a valószínűség az egyetlen kritérium, mivel több halmaz növelheti a valószínűséget.

Az ok- okozati összefüggés meghatározására tett további kísérletek közé tartozik a Granger-okozati összefüggés , amely annak a hipotézisnek a statisztikai tesztje , miszerint a közgazdaságtanban az ok-okozati összefüggést úgy lehet felmérni, hogy megmérjük egy idősor jövőbeli értékeit egy másik idősor korábbi értékei alapján.

Típusok

Az ok lehet szükséges, elégséges, elősegítő, vagy több ilyen tulajdonsággal rendelkezhet [14] .

Szükségesség

Ahhoz, hogy egy x esemény szükségszerű oka legyen y-nak, y jelenléte x korábbi előfordulását kell, hogy jelentse. Az x jelenléte azonban nem jelenti azt, hogy y megtörténik. Ez azt jelenti, hogy y nem történt volna meg, ha x nem fordul elő.

Elegendő ok

Ahhoz, hogy egy x esemény elegendő oka legyen y-nak, x jelenléte y későbbi előfordulását kell, hogy jelentse. A z egy másik oka azonban függetlenül is okozhatja y-t. Így y jelenlétéhez nem szükséges x előzetes előfordulása [15] .

Kapcsolódó okok

Ahhoz, hogy x az y egyidejű oka legyen, x jelenlétének növelnie kell y valószínűségét. Ha a valószínűség 100%, akkor helyette x elegendőnek mondható. Egyidejű ok is szükséges lehet [16] .

Modell

Ok-okozati diagram

Az oksági diagram egy irányított grafikon , amely az oksági modell változói közötti ok-okozati összefüggéseket jeleníti meg. Változókészletet (vagy csomópontot ) tartalmaz. Minden csomópont nyíllal van összekötve egy vagy több másik csomóponttal, amelyekre ok-okozati hatással van. Egy nyíl határozza meg az ok- okozati összefüggés irányát , például az A és B változókat a B pontban lévő nyíllal összekötő nyíl azt jelzi, hogy A változása B változást okoz (megfelelő valószínűséggel). Az útvonal a gráf bejárása két csomópont között, amelyek az oksági nyilakat követik.

Az oksági diagramok közé tartoznak a ciklikus diagramok , az irányított aciklikus gráfok és az Ishikawa diagramok [9] .

Az oksági diagramok nem függnek a mennyiségi valószínűségektől. Ezen valószínűségek változása (pl. technológiai fejlesztések miatt) nem igényli a modell módosítását.

Modellelemek

Az ok-okozati modelleknek formális struktúrájuk van meghatározott tulajdonságokkal rendelkező elemekkel.

Csatlakozási minták

A három csomópont háromféle csatlakozása létezik - lineáris áramkörök, villák és ütközők .

Láncok

A láncok egyenes kommunikációs vonalak, amelyekben nyilak mutatnak az októl az okozatra. Ebben a modellben B közvetítő abban az értelemben, hogy közvetíti azt a hatást, amelyet A gyakorolna C-re.

Forks

A villákban egy oknak sok következménye van. Nem oksági, hamis összefüggés van A és C között, amely kiküszöbölhető, ha B-t kondicionálunk egy adott B értékre.

A villa fejlődése így néz ki:

Az ilyen modellekben B az A és C közös oka (ami A-t is okoz), így B a közvetítő.

Collider

Ütközőben több ok is befolyásolja ugyanazt az eredményt. A B egy adott értékének kondicionálása gyakran ok-okozatilag negatív korrelációt tár fel A és C között. Ezt a negatív korrelációt ütköztető tévedésnek nevezték : B magyarázza az A és C közötti összefüggést. A korreláció akkor lehet pozitív, ha mind az A, mind a C hozzájárulása B befolyásolásához szükséges:

Csomóponttípusok

Közvetítő

A proxy változó megváltoztatja más okok hatását az eredményre (ellentétben azzal, hogy egyszerűen befolyásolja az eredményt). Például a fenti példában a B áramkör a közvetítő, mert az A (közvetett ok C) hatását C-vé (eredmény) változtatja.

Zavarba ejtő változó

A zavaró változó ( confounder ) több kimenetelre is hatással van azáltal, hogy pozitív korrelációt hoz létre közöttük.

Eszközváltozó

Műszerváltozó:

  • van egy út az eredményhez
  • nincs más útja az ok-okozati változókhoz
  • nincs közvetlen hatása az eredményre

A regressziós együtthatók mérhetik egy instrumentális változó ok-okozati hatását az eredményre, mindaddig, amíg ez a hatás nem összefonódik.[ adja meg ] . Így az instrumentális változók lehetővé teszik az ok-okozati tényezők számszerűsítését a zavaró változókra vonatkozó adatok nélkül.

Például a modellben:

ahol Z egy instrumentális változó, mert van egy útvonala az Y eredményhez, és nincs bázisa például U-hoz.

Javíthatja a modell pontosságát, ha egy másik változót kondicionál az eszköz és a keverő közötti útvonalak blokkolására, valamint több változó kombinálásával egyetlen eszközt alkot.

Egyesületek

A függetlenség feltételei

A függetlenségi feltételek annak eldöntésére szolgáló szabályok, hogy két változó független-e egymástól. A változók függetlenek, ha az egyik értéke nem befolyásolja közvetlenül a másik értékeit. Számos ok-okozati modell osztozhat a függetlenségi feltételek között. Például modellek

és

ugyanazok a függetlenségi feltételek, mert a B-re vonatkozó feltételrendszer függetlenné teszi A-t és C-t. A két modell azonban nem azonos értékű, és az adatok alapján meghamisítható (vagyis ha a megfigyelési adatok A és C közötti kapcsolatot mutatnak a B-n végzett kondicionálás után, akkor mindkét modell hibás). Ezzel szemben az adatok nem mutatják meg, hogy a két modell közül melyik a helyes, mert azonosak a függetlenségi feltételek. Egy változó kondicionálása hipotetikus kísérletek végrehajtásának mechanizmusa. A változó kondicionálása magában foglalja a feltételes változó adott értékéhez tartozó más változók értékeinek vizsgálatát. Az első példában a B-re vonatkozó kondicionálás azt jelenti, hogy a B adott értékére vonatkozó megfigyelések nem mutathatnak semmilyen kapcsolatot A és C között. Ha létezik ilyen kapcsolat, akkor a modell hibás. A nem-okozati modellek nem tudnak ilyen különbséget tenni, mert nem tesznek oksági kijelentéseket.

Zavar- és dekonfounder

A korrelációkutatás fontos eleme a vizsgált változóra, például a demográfiai jellemzőkre gyakorolt ​​potenciálisan ellentmondó hatások azonosítása . A zavaró változók helyes listája azonban nem határozható meg eleve. Így lehetséges, hogy a vizsgálat ellenőrizheti az irreleváns változókat, vagy akár (közvetve) a vizsgált változót.

A kauzális modellek megbízható módszert kínálnak a releváns zavaró változók azonosítására. Formálisan Z zavaró tényező, ha Y olyan utakon kapcsolódik Z-hez, amelyek nem haladnak át X-en. Ezek gyakran más vizsgálatokhoz gyűjtött adatok alapján határozhatók meg.

Backdoor Adjustment

Az X ok-okozati hatásának elemzéséhez Y-ra egy oksági modellben, az összes zavaró változót módosítani kell.

Jegyzetek

  1. Karl Friston (2009. február). „Az ok-okozati modellezés és az agy összekapcsolhatósága a funkcionális mágneses rezonancia képalkotásban” . PLOS Biológia . 7. cikk (2): e1000033. doi : 10.1371/journal.pbio.1000033 . PMC2642881  _ _ PMID  19226186 .
  2. OKOZATI (OK ÉS KÖVETKEZTETÉS) MODELLEZÉS. Az ok-okozati modellezés a ma használt legzseniálisabb és matematikailag legösszetettebb mennyiségi előrejelzési módszer . www.bibliotekar.ru _ Letöltve: 2021. március 9. Az eredetiből archiválva : 2020. július 26.
  3. Ok-okozati modellek a regressziós elemzésben . Studme . Letöltve: 2021. március 9. Az eredetiből archiválva : 2017. február 25.
  4. Barlas, Yaman; Carpenter, Stanley (1990). " A modell érvényesítésének filozófiai gyökerei: két paradigma ". Rendszerdinamikai áttekintés . 6 (2): 148-166. doi:10.1002/sdr.4260060203.
  5. Pearl J., Mackenzie D. (2018) The Book of Why. Az ok és okozat új tudománya. NY: Alapkönyvek. P. 362–363.
  6. Christopher Hitchcock. Ok-okozati modellek . — 2018-08-07. Archiválva az eredetiből 2020. július 21-én.
  7. ↑ 1 2 Judea Pearl. Bevezetés az oksági következtetésbe  // The International Journal of Biostatistics. — 2010-02-26. - T. 6 , sz. 2 . — ISSN 1557-4679 . - doi : 10.2202/1557-4679.1203 . Az eredetiből archiválva : 2021. február 1.
  8. Karpenko Alekszandr Sztyepanovics. Ellentétes gondolkodás  // Logikai kutatás. - 2017. - T. 23 , sz. 2 . — ISSN 2074-1472 .
  9. ↑ 1 2 3 4 5 Pearl, Judea ; Mackenzie, Dana (2018-05-15). The Book of Why: Az ok és okozat új tudománya archiválva 2021. június 13-án a Wayback Machine -nél . Alapvető könyvek. ISBN9780465097616.
  10. Okasha, Samir (2012-01-12). „ Causation in Biology archiválva 2019. április 11-én a Wayback Machine -nél ”. Beebee-ben Helen; Hitchcock, Christopher; Menzies, Peter (szerk.). Az ok-okozati összefüggés oxfordi kézikönyve . 1 . OU Oxford. doi:10.1093/oxfordhb/9780199279739.001.0001 . ISBN9780191629464.
  11. Baron és Kenny közvetítési módszere . Statisztikai megoldások (2017. augusztus 30.). Letöltve: 2021. március 9. Az eredetiből archiválva : 2021. április 7.
  12. Amit a mesterséges intelligencia még mindig nem tud  megtenni . MIT Technology Review . Letöltve: 2021. március 9. Az eredetiből archiválva : 2021. március 11.
  13. Pearl, Júdea (2019. október 29.). „Cusal and Counterfactual Inference” archiválva 2021. szeptember 20-án a Wayback Machine -nél (PDF).
  14. Susanna S. Epp. Diszkrét matematika alkalmazásokkal . - Thomson-Brooks/Cole, 2004. - 936 p. — ISBN 978-0-534-49096-6 .
  15. Ok-okozati érvelés . Letöltve: 2021. március 16. Az eredetiből archiválva : 2021. február 24.
  16. Riegelman, R. (1979). " Közben járulékos ok: szükségtelen és elégtelen ". posztgraduális orvostudomány . 66 (2): 177-179.