A Pearson-féle illeszkedési teszt vagy jó illeszkedési teszt (khi-négyzet) egy nem paraméteres módszer, amely lehetővé teszi a tényleges (a vizsgálat eredményeként feltárt) kimenetelszám közötti különbségek jelentőségének felmérését, ill. az egyes kategóriákba tartozó minta minőségi jellemzői és a nullhipotézis igaza esetén a vizsgált csoportokban várható elméleti szám. Egyszerűbben fogalmazva, a módszer lehetővé teszi két vagy több relatív mutató (gyakoriság, részesedés) közötti különbségek statisztikai szignifikanciájának értékelését.
Ez a leggyakrabban használt kritérium annak a hipotézisnek a tesztelésére , hogy a megfigyelt mintanagyság valamilyen elméleti eloszlási törvényhez tartozik .
A kontingenciatáblázatok elemzésének khi-négyzet kritériumát a matematikai statisztika megalapítója, Karl Pearson angol tudós dolgozta ki és javasolta 1900-ban .
A kritérium az űrlap egyszerű hipotéziseinek tesztelésére használható
hol van az elméleti törvény paramétereinek ismert vektora, és az alak komplex hipotéziseinek tesztelésekor
amikor egy skaláris vagy vektoreloszlási paraméter becslését számítják ki ugyanazon a mintán.
A hipotézisek típuskritériumokkal történő tesztelésének eljárása magában foglalja a megfigyelések csoportosítását. A valószínűségi változó definíciós tartományát határpontok nem metsző intervallumokra osztják
ahol egy valószínűségi változó definíciós tartományának alsó korlátja; - felső él.
Az adott partíciónak megfelelően kiszámításra kerül a th intervallumba eső mintaértékek száma és az intervallumba esés valószínűsége
eloszlásfüggvényű elméleti törvénynek megfelelő
Ahol
ésEgy egyszerű hipotézis tesztelésekor mind a törvény formája, mind az összes paramétere ismert (a skaláris vagy vektorparaméter ismert ).
A típus illeszkedési tesztjeiben használt statisztikák a -tól való eltérések mérésén alapulnak .
Az illeszkedési statisztika Pearson jóságát a reláció határozza meg
Egy egyszerű hipotézis tesztelése esetén a határértékben ez a statisztika engedelmeskedik egy -szabadságfokozatú -eloszlásnak , ha a tesztelt hipotézis igaz . Az -eloszlás sűrűségét , amely a gamma eloszlás speciális esete, a képlet írja le
A tesztelt hipotézist a statisztika nagy értékei esetén elvetjük, ha a mintából számított statisztika értéke nagyobb, mint a kritikus érték
vagy az elért szignifikanciaszint ( p - érték ) kisebb, mint az adott szignifikanciaszint (az adott 1. típusú hiba valószínűsége ) .
Komplex hipotézisek tesztelésekor, ha a törvény paramétereit ugyanarra a mintára a statisztika minimalizálása vagy csoportosított minta esetén a maximum likelihood módszerrel becsüljük meg , akkor a statisztika , ha a tesztelt hipotézis igaz, egy -eloszlásnak engedelmeskedik szabadsági fok, ahol a mintából becsült paraméterek száma.
Ha a paramétereket az eredeti csoportosítatlan mintából becsüljük, akkor a statisztika eloszlása nem lesz -eloszlás [1] . Ezenkívül a statisztika eloszlása, ha a hipotézis igaz , a csoportosítás módszerétől függ, vagyis attól, hogy a definíciós tartományt hogyan osztják fel intervallumokra [2] .
A csoportosítatlan minta paramétereinek maximális valószínűségi módszerének becslésekor használhat módosított kritériumokat, például [3] [4] [5] [6] .
Az illeszkedési kritériumok alkalmazásakor általában nem állítanak fel egymással versengő hipotéziseket: a minta egy adott törvényhez tartozik, és versengő hipotézisként bármely más törvényt figyelembe vesznek. Természetesen a kritérium különböző módon képes megkülönböztetni a megfelelő törvénytől, a hozzá közeli vagy távoli törvényeket. Ha megadunk egy versengő hipotézist és a neki megfelelő versengő törvényt , akkor már kétféle hibáról beszélhetünk: nem csak az 1. típusú hibáról (a tesztelés alatt álló hipotézis elvetéséről, ha igaz), és annak valószínűségéről. erről a hibáról , hanem egy 2. típusú hibáról (nem elutasítás a méltányosság alatt ) és ennek a hiba valószínűségéről is .
A kritérium erejét a versengő hipotézishez képest az érték jellemzi . Minél jobban felismeri a kritérium egy pár versengő hipotézist , és annál nagyobb a teljesítménye.
A Pearson-féle illeszkedési teszt ereje jelentősen függ a csoportosítás módszerétől [7] [8] és a választott intervallumszámtól [8] [9] .
Aszimptotikusan optimális csoportosítás esetén, amely maximalizálja a Fisher információs mátrix különböző funkcióit a csoportosított adatok felett (minimalizálja a csoportosítással kapcsolatos veszteségeket), a Pearson-féle illeszkedési tesztnek van maximális ereje a „(nagyon) közeli” versengő hipotézisekhez képest . 10] [8] [9] .
Egyszerű hipotézisek tesztelésekor és aszimptotikusan optimális csoportosítás használatakor a Pearson-féle illeszkedési teszt előnyt jelent a nem paraméteres illeszkedési tesztekkel szemben. Komplex hipotézisek tesztelésekor a nemparaméteres kritériumok ereje nő, és nincs ilyen előny [11] [12] . Bármely versengő hipotézispár (versenyző törvény) esetén azonban az intervallumok számának és a valószínűségi változó definíciós tartományának intervallumokra való felosztásának módszerével maximalizálható a kritérium teljesítménye [13] .