Többszörös összehasonlítás, többszörösség, többszörös tesztelés problémakorrekciója [ 1] egy módja annak , hogy kiküszöböljük a többszörös összehasonlítás hatását [2] , amely akkor jelentkezik, ha statisztikai következtetések családját kell felépíteni. A statisztikai hipotézisek tesztelése során a főhipotézis (H 0 ) elvetésekor hiba is előfordulhat (a hipotézis téves elutasítása, első típusú hiba ). Egy ilyen esemény valószínűségét egy kis előre kiválasztott érték korlátozza - a szignifikancia szint (általában ). Ekkor a következtetések megalkotásakor annak a valószínűségnek a felső becslése, hogy legalább az egyik hibás lesz, egyenlő -val , ami még kicsikre is kellően nagy (pl. esetén egyenlő -vel ). Ennek a hatásnak a kiküszöbölésére számos megközelítést fejlesztettek ki [3] .
A többszörös összehasonlítás problémájának első említésének tekinthetjük Antoine Augustine Cournot okfejtését az Exposition de La Theorie Des Chances Et Des Probabilites (1843) című művében, miszerint ha egy populációt minél több csoportra osztunk, előbb-utóbb létrejön egy csoport, amely jelentősen eltér a többitől.aggregátumok. Ekkor a problémát megoldhatatlannak tekintették [4] .
Bonferroni munkája (Teoria statistica delle classi e calcolo delle probabilità, 1936) után az 1950-es években John Tukey és Henry Scheffe munkássága kapcsán feltámadt a többszörös tesztelés problémája iránti érdeklődés . A későbbi munka a korrekciók erejének növelésére irányult. Így 1979-ben egy erősebb Holm-Bonferroni korrekciót fejlesztettek ki. 1995-ben Benjamini és Hochberg cikkével megkezdődött a munka az FDR-en (false rejection rate of hypotheses), amely lehetővé tette számos hipotézis tesztelését [4] .
1996-ban Izraelben tartották az első konferenciát a többszörös hipotézis teszteléséről , majd ezt követően kétévente tartják világszerte [5] .
A nullhipotézis igaz | A nullhipotézis hamis | Teljes | |
---|---|---|---|
Elfogadjuk a hipotézist | |||
Elutasítjuk a hipotézist | |||
Teljes |
Túl sok próbálkozás esetén megnő annak a valószínűsége, hogy hamis pozitív eredményt kapunk ( az első típusú elkövetett hibák számának növekedése ). A probléma az, hogy olyan módszert válasszunk, amely lehetővé teszi a hipotézisek téves elutasítását és hamis elfogadását . Ehhez egy másik szabályt kell választani a hipotézisek elutasítására. A többszörös hipotézis tesztelésének problémájához nagyszámú mennyiség létezik, amely általánosítja az első típusú hiba definícióját. A leghíresebbek a következők:
A fenti intézkedések mindegyikének megvan a maga módja a szignifikanciaküszöb szigorításának.
A statisztikai hipotézisek tesztelésekor figyelembe vett, első típusú hibát általánosító mérőszámok egyike. Az érték legalább egy I. típusú hiba elkövetésének valószínűsége [6] . Definíció szerint: [6] . Az FWER rögzített szignifikanciaszintű szabályozása azt jelenti, hogy a [6] egyenlőtlenség teljesül .
Számos módszer létezik az FWER vezérlésére.
Bonferroni módosításA Bonferroni korrekciós módszer kimondja, hogy a hamis pozitív eredmények csökkentése érdekében el kell vetni azokat a hipotéziseket, amelyeknél a [8] [9] kritérium szerint p-érték van . Ez a módosítás lehetővé teszi, hogy megszerezzék , mert
A Boole - egyenlőtlenség azt jelenti, hogy az események véges vagy megszámlálható halmaza esetén annak a valószínűsége, hogy legalább az egyik bekövetkezik, nem nagyobb, mint az egyes események valószínűségeinek összege. Így ha minden egyes tesztet a szignifikancia szinten tesztelünk , ahol a figyelembe vett hipotézisek száma, akkor a hipotézisek teljes családjára a szignifikancia szint a következő szinten van rögzítve :
,
ahol az elutasított igaz hipotézisek száma [10] .
JegyzetekA Bonferroni-korrekció alkalmazása miatti növekedéssel a statisztikai eljárás ereje meredeken csökken - csökken a hibás hipotézisek elutasításának esélye [7] .
Holm-módszer (Holm-Bonferroni korrekció)A Holm-féle módszer ( Holm-Bonferroni korrekció ) egységesen erősebb, mint a Bonferroni-korrekció, és megoldja a teljesítménycsökkenés problémáját a hipotézisek számának növekedésével [11] . Felülről lefelé módszer [12] .
Legyen - , a legkisebbtől a legnagyobbig rendezve. - releváns hipotézisek. Holm eljárását a következőképpen definiáljuk [12] [13] .
Az eljárás előírja [12] . Egységesen erősebb, mint a Bonferroni-módszer [11] .
PéldaFontolja meg 4 hipotézis tesztelését . Legyen ezek p-értékei: 0,01; 0,04; 0,03 és 0,005. Rendezzük őket növekvő sorrendbe: 1) 0,005; 2) 0,01; 3) 0,03; 4) 0,04. A következő egyenlőtlenségeket kell ellenőrizni:
A hipotézisek szignifikanciaszintjét a következőképpen állítjuk be: . [14] A módszer FWER -t eredményez , feltéve, hogy a statisztikusok függetlenek, vagy a „pozitív függőségi” tulajdonság [15] [16] teljesül :
, [16]
Állítsunk össze p-értékek variációs sorozatát: , ahol a megfelelő hipotézisek vannak. Az eljárás így néz ki:
leszálló eljárás. A hipotézisek szignifikanciaszintjei a következők [17] :
Szignifikancia szinten szabályozza az FWER-t, ha a statisztikák függetlenek a sokaságban. Ha a statisztika független a sokaságban, lehetetlen olyan eljárást felépíteni, amely a Shidak-Holm módszernél erősebb szinten szabályozza az FWER-t. Összességében kevéssé különbözik Holm módszerétől [17] .
Ez az érték az elutasított hipotézisek közötti hibák arányának matematikai elvárása.
Határozza meg a hibásan elutasított hipotézisek számának arányát az összes elutasított hipotézishez képest : . Tehát FDR:
at [7] .
Az FDR szintszabályozása a következőket jelenti:
[7] .
Benjamini-Hochberg módszerEz egy alulról felfelé építkező eljárás, amelynek jelentősége a következő [7] :
.
Legyenek a szignifikanciaszintek , a legkisebbtől a legnagyobbig rendezve. - releváns hipotézisek. A Benjamini-Hochberg eljárást a következőképpen határozzuk meg.
Ha a statisztikák függetlenek, ez a módszer [7] szinten szabályozza az FDR-t .
Számos tanulmányban, például a genomika területén , több ezer vagy még sokkal több hipotézist kell tesztelni. A genetikai asszociációs vizsgálatok területén az eredmények reprodukálhatatlanságának problémája van: az egyik vizsgálatban kiemelten szignifikáns eredmény a következőben nem ismétlődik meg. Ennek oka többek között a többszöri tesztelés következményei [18] .
A tudomány különböző területein a többszörös teszteléshez való hozzáállás nem egyértelmű. Van olyan vélemény, hogy nem szükséges korrekciót használni többszörös összehasonlításhoz, ha alapos okkal feltételezhető, hogy az eredmények igazak lesznek [19] . Azt is állítják, hogy a többszörös teszteléshez való igazítás nem hatékony módszer az empirikus kutatás elvégzésére , mivel a hamis pozitívumok ellenőrzésével nagyszámú hamis negatív eredményhez vezet. Másrészről azonban azt állítják, hogy a mérési módszerek és az információs technológia fejlődése elősegítette a feltáró elemzéshez szükséges nagy adatkészletek megjelenését , ami számos hipotézis teszteléséhez vezetett anélkül, hogy először feltételeztük volna, hogy a legtöbb igaz. Ez pedig nagyszámú hamis pozitív eredményt jelent, ha nem hajtják végre a többszörös vizsgálat korrekcióját.
Nagy léptékű tesztelésnél, ha pontos eredményeket akarunk elérni, az FWER a legjobb, azonban ha a vizsgálat feltáró jellegű, és jelentős eredményeket egy független vizsgálatban tesztelnek, az FDR-t részesítjük előnyben [7] [20] [21] . Az FDR, amelyet a hamis pozitívak várható arányaként határoznak meg az összes pozitív (szignifikáns) között, lehetővé teszi a további vizsgálatok során figyelembe vehető „pozitív jelöltek” halmazának meghatározását [22] .
Azt a gyakorlatot, hogy sok kiigazítatlan összehasonlítást végeznek annak reményében, hogy valami értelmeset találnak, akár tudatosan alkalmazzák, akár nem, néha "p-hacking"-nek nevezik [23] [24] .
A többszörös összehasonlítás problémája a biológiában mindenütt jelen van az omics adatok [20] [25] [26] elemzésében, mivel sok változót egyidejűleg elemeznek. Így a genomszintű asszociációs vizsgálatok és a differenciális génexpresszió - analízis során több százezer-millió hipotézist tesztelnek egyszerre. A legtöbb esetben a Bonferroni-korrekciót vagy a GWAS általánosan elfogadott p-érték küszöbét [27] alkalmazzák, azonban ez a vizsgálat teljesítményének csökkenését eredményezi, és ezzel együtt megnő a hamis negatív eredmények kockázata. A Bonferroni-korrekciónak az elvégzett összehasonlítások függetlenségére vonatkozó feltevése is sérül, mivel kapcsolati egyensúlyhiány áll fenn , amikor az SNP -kombinációk gyakorisága eltér a kapcsolat hiányában várttól, így felmerül a kérdés, hogy hány valós független. összehasonlításokat végeznek. Meghatározható a független összehasonlítások száma olyan feltételek mellett, mint a főkomponensek száma, amelyek együttesen többet takarnak, mint a vizsgált adatok szórása, majd a szinten statisztikai szignifikanciát biztosító p-küszöbértéket újra számítjuk: következik:
[28] [29]
Ezenkívül permutációs teszteket [28] [30] , például Rank product használnak a többszörös összehasonlítás problémájának megoldására . A permutációs tesztek feltételezése, hogy ha az összehasonlított minták ugyanabból a sokaságból származnak, akkor a minták közötti elemcsere nem vezethet jelentős változáshoz a tesztstatisztikában. A permutációs tesztek hozzávetőleges általános algoritmusa a következő [30] :
A permutációs tesztek alkalmazásakor a szignifikanciaszint vagy a teszt p-értékeinek tényleges korrekciója nem szükséges. A permutációs tesztek nem érzékenyek a minta kiegyensúlyozatlanságára, ami hasznos a biológiai adatok elemzésében [31] .