Zavarba ejtő változó

A zavaró változó, egy zavaró tényező, egy  olyan változó a statisztikákban, amely mind a függő, mind a független változókat érinti , és hamis kapcsolatot eredményez . Az összefonódás oksági fogalom, az oksági modell eleme , és mint ilyen, nem írható le összefüggésekkel vagy asszociációkkal [1] [2] [3] . Az ok- okozati elemzésben a zavaró tényezők a moderátorok , közvetítők és ütközők [4] [5] [6] változói mellett .

Definíció

Az összefonódás az adatgenerálás szempontjából határozható meg (mint a fenti ábrán). Legyen X  valamilyen független változó és Y  valamilyen függő változó . Az X Y -ra gyakorolt ​​hatásának becsléséhez a statisztikusnak meg kell szüntetnie az X-re és Y-ra egyaránt ható külső változók hatását . Azt mondjuk, hogy X és Y összefonódik valamilyen Z változóval , amikor Z ok- okozatilag befolyásolja X - et és Y-t is .

Legyen az Y = y  esemény valószínűsége egy hipotetikus X = x beavatkozás mellett . X és Y akkor és csak akkor nem összefonódnak, ha a következő feltétel igaz:

minden eseményvalószínűségre X = x és Y = y eseményre , ahol  a feltételes valószínűség X = x . Intuitív módon ez az egyenlőség kimondja, hogy X és Y nincs összegabalyodva, ha a köztük megfigyelt kapcsolat megegyezik azzal a kapcsolattal, amelyet egy randomizált x - szel végzett kontrollált kísérletben mérnénk .

Elvileg a definiáló egyenlőség tesztelhető az adatgenerációs modellel, feltételezve, hogy a modellhez tartozó összes egyenlet és valószínűség megvan. Ez úgy történik, hogy modellezzük a beavatkozást (lásd a Bayes-hálózatot ), és ellenőrizzük , hogy a kapott Y valószínűség egyenlő-e a feltételes valószínűséggel . Kiderült, hogy a gráf tulajdonságai elegendőek az egyenlőség ellenőrzéséhez .

Vezérlés

Tekintsünk egy kutatót, aki populációs adatok alapján próbálja értékelni az X gyógyszer hatékonyságát , miközben a betegek maguk választják ki az alkalmazott gyógyszert. Az adatok azt mutatják, hogy a nem ( Z ) befolyásolja a páciens gyógyszerválasztását, valamint a gyógyulási esélyeit ( Y ). Ebben a forgatókönyvben a Z neme megszakítja az X és Y közötti kapcsolatot, mivel Z mind X , mind Y oka  :

Nálunk egyenlőtlenség van

,

mert a megfigyelt mennyiség tartalmaz információt X és Z korrelációjáról , de a zavaró mennyiség nem (mivel X nem korrelál Z -vel egy randomizált kísérletben). A statisztikusnak elfogulatlan becslésre van szüksége , de olyan esetekben, amikor csak megfigyelési adatok állnak rendelkezésre, elfogulatlan becslést csak az összes zavaró tényező figyelembevételével kaphat, nevezetesen azok eltérő értékét és az átlagos eredményt. Egyetlen Z zavaró tényező esetén ez egy "kiigazítási képlethez" vezet:

,

amely torzítatlan becslést ad X ok-okozati hatásáról Y -ra. Ugyanez a képlet több zavaró tényező jelenlétében is működik, kivéve, hogy ebben az esetben körültekintően kell kiválasztani azt a Z halmazt, amely garantálja a torzításmentes becslést. A zavaró változók helyes kiválasztásának kritériumát hátsó ajtónak [7] [8] nevezzük, és megköveteli, hogy a kiválasztott Z halmaz „blokkoljon” (vagy elfogjon) minden X -től Y -ig tartó utat, amely X -ben nyíllal végződik. Az ilyen halmazokat "érvényes hátsó ajtó", és olyan változókat is tartalmazhat, amelyek nem az X és Y általános okai , hanem azok helyettesítői.

Visszatérve a drogpéldához, mivel Z teljesíti a hátsó ajtó követelményét (azaz elfog egy utat ), akkor a "beállítási képlet" érvényes:

.

Így a kutató megfigyeléses vizsgálatok alapján tudja megjósolni egy gyógyszer használatának valószínű hatását , amelyben az egyenlet jobb oldalán megjelenő feltételes valószínűségek regresszióval becsülhetők.

A közhiedelemmel ellentétben kovariánsok hozzáadása a Z halmazhoz torzuláshoz vezethet. Tipikus ellenpélda akkor fordul elő, amikor Z az X és Y közös eredménye , [9] ebben az esetben Z nem zavaró tényező (azaz az üres halmaz érvényes hátsó ajtó), és Z figyelembe vétele ütközőnek nevezett torzítást hozna létre. vagy Berkson paradoxona .

Általánosságban elmondható, hogy az összegabalyodás akkor és csak akkor szabályozható beállítással, ha van egy olyan megfigyelhető kovariáns, amely kielégíti a hátsó ajtó feltételét. Sőt, ha Z egy ilyen halmaz, akkor a (3) egyenlet hangolási képlete valóban <4,5>. Jude Pearl Do-kalkulusa további feltételeket biztosít, amelyek mellett P ( y  | do ( x )) korrekció nélkül becsülhető [10] .

Történelem

Morabia (2011) [11] szerint a zavaró fogalma a középkori latin "confudere" igéből származik (latinból: con = -val + fusus = összerakni vagy összevonni), ami azt jelenti, hogy "keveredik", és valószínűleg arra választották. az értékelendő ok és más olyan okok összetévesztését jelöli, amelyek befolyásolhatják az eredményt, és így megzavarhatják vagy megzavarhatják a kívánt értékelést. Fisher az 1935-ös Design of Experiments [12] című könyvében az "összefonódás" szót használta, hogy utaljon a hibaforrásra az ideális randomizált kísérlet leírásában. Vandenbroucke (2004) [13] szerint Leslie Kish [14] használta először az „összefonódás” szót a szó modern értelmében, hogy két vagy több halmaz „összeférhetetlenségére” utaljon (pl. exponált és exponálatlan). ) megfigyeléses kutatás során .

Azokat a formális feltételeket, amelyek meghatározzák, hogy egyes halmazok miért „összehasonlíthatóak”, mások pedig „összehasonlíthatatlanok”, az epidemiológiában Greenland és Robins (1986) [15] dolgozta ki Jerzy Neumann (1935) [16] és Donald Rubin 15] kontrafaktuális nyelvezetével. (1974) [17] . Ezeket később olyan grafikus kritériumokkal egészítették ki, mint például a hátsó ajtó kritérium (Pearl 1993; Greenland, Pearl és Robins, 1999) [3] [7] . Kimutatták, hogy a grafikus kritériumok formálisan egyenértékűek a kontrafaktuális definícióval [18] , de átláthatóbbak a folyamatmodellekre támaszkodó kutatók számára.

Típusok

Egy adott tényező egészségre gyakorolt ​​kockázatának értékelése esetén fontos az ellenőrzése annak érdekében, hogy elkülönítsük egy adott fenyegetés, például élelmiszer-adalékanyag, peszticid vagy új gyógyszer hatását. Prospektív tanulmányokhoz nehéz azonos háttérrel (életkor, táplálkozás, végzettség, földrajz stb.) rendelkező önkénteseket toborozni és kiszűrni . A keresztmetszeti és ismételt vizsgálatokban a függő változók eltérő okokból hasonló módon viselkedhetnek. Az önkéntesek minőségének ellenőrzésére való képtelenség miatt az összegabalyodás különös problémát jelent az emberi vizsgálatokban. Ezen okokból kifolyólag a kísérletek – a megfigyeléses vizsgálatokkal ellentétben – az összefonódás legtöbb formájának elkerülésére szolgálnak.

Egyes tudományágakban az összefonódást különböző típusokba sorolják. Az epidemiológiában az egyik típus az "indication confusion" [19] , amely a megfigyeléses vizsgálatok eredményeinek torzulásával jár . Mivel a prognosztikai tényezők befolyásolhatják a kezelési döntéseket (és torzíthatják a kezelési hatások becslését), az ismert prediktív tényezők ellenőrzése csökkentheti ezt a problémát, de mindig fennáll annak a lehetősége, hogy egy elfelejtett vagy ismeretlen tényezőt kihagytak, vagy a tényezők kölcsönhatásba lépnek egy bonyolult folyamatban. út. Az indikatív zavartság a megfigyelési vizsgálatok legfontosabb korlátja. A randomizált vizsgálatokat nem befolyásolja a véletlenszerű eloszlás miatti indikációs zavar .

A zavaró változók forrásuk szerint is kategorizálhatók: a mérőeszköz megválasztása (működési zavar), a helyzet jellemzői (eljárási zavar) vagy az interperszonális különbségek (személyiségzavar).

Példák

Tegyük fel, hogy valaki a születési sorrend (1. gyermek, 2. gyermek stb.) és a gyermek Down-szindróma közötti összefüggést tanulmányozza . Ebben a tanulmányban az anya életkora zavaró változó lesz:

  1. A magasabb anyai életkor közvetlenül összefügg a gyermek Down-szindrómával
  2. Az idősebb anyai életkor közvetlenül összefügg a Down-szindrómával, függetlenül a születési sorrendtől (az anya, akinek első vagy harmadik gyermeke 50 évesen születik, ugyanolyan kockázatot jelent)
  3. Az anya életkora közvetlenül függ a születési sorrendtől (a 2. gyermek az ikrek kivételével akkor születik, amikor az anya idősebb, mint az első gyermek születésekor)
  4. Az anya életkora nem a születési sorrend következménye (a 2. gyermek születése nem befolyásolja az anya életkorát)

A kockázat értékelése során olyan tényezők, mint az életkor, a nem és az iskolai végzettség gyakran befolyásolják az egészségi állapotot, ezért ezeket figyelemmel kell kísérni. Ezeken a tényezőkön kívül előfordulhat, hogy a kutatók nem vesznek figyelembe más ok-okozati tényezőkre vonatkozó adatokat, vagy nem férnek hozzá adatokhoz. Példa erre a dohányzás emberi egészségre gyakorolt ​​hatásának tanulmányozása. A dohányzás, az alkoholfogyasztás és az étrend összefügg. Egy kockázatértékelés, amely figyelembe veszi a dohányzás hatásait, de nem veszi figyelembe az alkoholfogyasztást vagy az étrendet, túlbecsülheti a dohányzás kockázatát [22] . A dohányzást és az összegabalyodást figyelembe veszik a foglalkozási kockázatértékelésekben, például a szénbányászat biztonsági értékeléseiben [23] . Ha egy adott szakmában nincs nagy minta a nemdohányzókból vagy nem ivókból, a kockázatértékelés a szakma negatív egészségügyi hatásai felé torzulhat.

Az összegabalyodás lehetőségének csökkentése

A zavaró tényezők megjelenésének és befolyásának valószínűsége csökkenthető a vizsgálat során végzett összehasonlítások típusának és számának növelésével. Ha a fő változók mérései vagy manipulálásai összekeverednek (vagyis működési vagy eljárási zavarok vannak), akkor előfordulhat, hogy az alcsoport-elemzés nem tár fel problémákat a tanulmányban. Ne feledje azonban, hogy az összehasonlítások számának növelése más problémákat is okozhat (lásd: Több összehasonlítás ).

A szakértői értékelés  olyan folyamat, amely segíthet csökkenteni a zavart akár a vizsgálat előtt, akár az elemzés elvégzése után. A szakértői értékelés a szakterületen belüli szakértői értékelésre támaszkodik, hogy azonosítsa a vizsgálati tervezés és elemzés lehetséges gyengeségeit, beleértve azt is, hogy az eredményeket hogyan befolyásolhatja a zavartság. Hasonlóképpen, a replikáció lehetővé teszi a vizsgálat eredményeinek megbízhatóságának ellenőrzését alternatív vizsgálati feltételek mellett vagy az eredmények elemzésének alternatív megközelítései között (például figyelembe véve az eredeti vizsgálatban nem azonosított esetleges összetévesztést).

A vizsgálat felépítésétől függően többféle módon lehet kizárni vagy ellenőrizni a zavaró változókat [24] :

Mindegyik módszernek megvannak a maga hátrányai:

  1. A legjobb védekezés a hamis pozitív eredmények összezavarása ellen gyakran az, ha lemondanak a rétegződési erőfeszítésekről, és ehelyett egy elég nagy mintán randomizált vizsgálatot végeznek úgy , hogy az összes lehetséges zavaró változó (ismert és ismeretlen) véletlenszerűen oszlik el az összes között. tanulmányi csoportok, ezért nem fog korrelálni az bináris változóval .
  2. Etikai megfontolások: A kettős vak és randomizált, kontrollos vizsgálatok során a résztvevők nincsenek tudatában annak, hogy színlelt kezelésben részesülnek , ami azt jelenti, hogy megtagadhatják tőlük a hatékony kezelést [25] . Fennáll annak a lehetősége, hogy a betegek csak azzal a feltétellel vállalják az invazív műtétet (amely valós egészségügyi kockázatokat hordoz magában), ha kezelésben részesülnek.

Lásd még

Jegyzetek

  1. Pearl, J., (2009). Simpson paradoxona , Confounding and Collapsibility in Causality: Models, Reasoning and Inference (2. kiadás). New York: Cambridge University Press.
  2. VanderWeele, TJ (2013). „A zavaró definíciójáról” . Annals of Statistics . 41 (1): 196-220. arXiv : 1304.0564 . DOI : 10.1214/12-aos1058 . PMID  25544784 .
  3. 1 2 Grönland, S. (1999). „Összetéveszthetőség és összecsukhatóság az oksági következtetésben” . Statisztikai tudomány . 14 (1), 29-46. DOI : 10.1214/ss/1009211805 .
  4. Field-Fote, Edelle. Közvetítők és moderátorok, zavaró tényezők és kovariánsok: A neurorehabilitáció „aktív összetevőit” megvilágító vagy elhomályosító változók feltárása . Journal of Neurologic Physical Therapy, 2019. április, 43. kötet, 2. szám, 83-84. o., doi: 10.1097/NPT.0000000000000275 . Letöltve: 2021. december 8. Az eredetiből archiválva : 2021. december 8..
  5. Adrian E. Bauman, PhD, James F. Sallis, PhD, David A. Dzewaltowski, PhD, Neville Owen, PhD. A fizikai aktivitásra gyakorolt ​​hatások jobb megértése felé: a meghatározók, a korrelátumok, az ok-okozati változók, a közvetítők, a moderátorok és a zavaró tényezők szerepe . American Journal of Preventive Medicine, 2002, 23. kötet, 2S szám .
  6. David P. MacKinnon. A közvetítő, zavaró és ütköztető hatások egyesítése . prevenciós tudomány. 22. kötet, 1185–1193. oldal (2021) . Letöltve: 2021. december 9. Az eredetiből archiválva : 2021. december 9..
  7. 1 2 Pearl, J., (1993). "Aspects of Graphical Models Connected With Causality", In Proceedings of the 49. Session of the International Statistical Science Institute, pp. 391-401.
  8. Pearl, J. (2009). Oksági diagramok és az oksági hatások azonosítása az oksági összefüggésben: modellek, érvelés és következtetés (2. kiadás). New York, NY, USA: Cambridge University Press.
  9. Lee, P. H. (2014). „Ki kell alkalmazkodnunk egy zavaró tényezőhöz, ha az empirikus és elméleti kritériumok ellentmondó eredményeket adnak? Szimulációs tanulmány”. sci rep . 4 : 6085. Bibcode : 2014NatSR...4E6085L . doi : 10.1038/ srep06085 . PMID 25124526 . 
  10. Shpitser, I. (2008). „Az ok-okozati hierarchia teljes azonosítási módszerei”. The Journal of Machine Learning Research . 9 , 1941-1979.
  11. Morabia, A (2011). „Az összezavarás modern epidemiológiai koncepciójának története” (PDF) . Journal of Epidemiology and Community Health . 65 (4): 297-300. DOI : 10.1136/jech.2010.112565 . PMID  20696848 . Archivált (PDF) az eredetiből ekkor: 2021-12-05 . Letöltve: 2021-12-05 . Elavult használt paraméter |deadlink=( súgó )
  12. Fisher, R. A. (1935). A kísérletek tervezése (114-145. o.).
  13. Vandenbroucke, JP (2004). "A felfedezés története". Soz Praventivmed . 47 (4): 216-224. DOI : 10.1007/BF01326402 . PMID  12415925 .
  14. Kish, L (1959). „Néhány statisztikai probléma a kutatástervezésben”. Am Sociol . 26 (3): 328-338. DOI : 10.2307/2089381 .
  15. Grönland, S. (1986). „Azonosíthatóság, felcserélhetőség és járványügyi zavar” . International Journal of Epidemiology . 15 (3): 413-419. DOI : 10.1093/ije/15.3.413 . PMID  3771081 .
  16. Neyman, J., K. Iwaskiewics és St. Kolodziejczyk (1935). Statisztikai problémák a mezőgazdasági kísérletezésben (beszélgetéssel). Suppl J Roy Statist Soc Ser B 2 107-180.
  17. Rubin, D. B. (1974). „A kezelések okozati hatásainak becslése randomizált és nem randomizált vizsgálatokban” . Journal of Educational Psychology . 66 (5): 688-701. DOI : 10.1037/h0037350 .
  18. Pearl, J., (2009). Ok-okozati összefüggés: modellek, érvelés és következtetés (2. kiadás). New York, NY, USA: Cambridge University Press.
  19. Johnston, S.C. (2001). „A zavaró tényezők azonosítása jelzés alapján vakon jövőbeli felülvizsgálaton keresztül.” American Journal of Epidemiology . 154 (3): 276-284. DOI : 10.1093/aje/154.3.276 . PMID  11479193 .
  20. 1 2 Pelham, Brett. Pszichológiai kutatások végzése. - 2006. - ISBN 978-0-534-53294-9 .
  21. Steg, L. Alkalmazott szociálpszichológia: Társadalmi problémák megértése és kezelése / L. Steg, A. P. Buunk. – 2008.
  22. Tjønneland, Anne (1999. január). „Borfogyasztás és étrend 48763 dán férfiból és nőből álló véletlenszerű mintán ” Az American Journal of Clinical Nutrition . 69 (1): 49-54. DOI : 10.1093/ajcn/69.1.49 . PMID  9925122 .
  23. Axelson, O. (1989). „A dohányzás zavarása a foglalkozási epidemiológiában” . British Journal of Industrial Medicine . 46 (8): 505-07. DOI : 10.1136/oem.46.8.505 . PMID2673334  . _
  24. Mayrent, Sherry L. Epidemiology in Medicine . - Lippincott Williams & Wilkins , 1987. - ISBN 978-0-316-35636-7 .
  25. Emanuel, Ezekiel J (2001. szeptember 20.). „A placebo-kontrollos kísérletek etikája – középút” . New England Journal of Medicine . 345 (12): 915-9. doi : 10.1056/ név200109203451211 . PMID 11565527 . 

Irodalom

Linkek