Pearson alkalmassági teszt

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. november 9-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A Pearson-féle illeszkedési teszt vagy jó illeszkedési teszt (khi-négyzet)  egy nem paraméteres módszer, amely lehetővé teszi a tényleges (a vizsgálat eredményeként feltárt) kimenetelszám közötti különbségek jelentőségének felmérését, ill. az egyes kategóriákba tartozó minta minőségi jellemzői és a nullhipotézis igaza esetén a vizsgált csoportokban várható elméleti szám. Egyszerűbben fogalmazva, a módszer lehetővé teszi két vagy több relatív mutató (gyakoriság, részesedés) közötti különbségek statisztikai szignifikanciájának értékelését.

Ez a leggyakrabban használt kritérium annak a hipotézisnek a tesztelésére , hogy a megfigyelt mintanagyság valamilyen elméleti eloszlási törvényhez tartozik .

A kontingenciatáblázatok elemzésének khi-négyzet kritériumát a matematikai statisztika megalapítója, Karl Pearson angol tudós dolgozta ki és javasolta 1900-ban .

A kritérium az űrlap egyszerű hipotéziseinek tesztelésére használható

hol  van az elméleti törvény paramétereinek ismert vektora, és az alak komplex hipotéziseinek tesztelésekor

amikor egy skaláris vagy vektoreloszlási paraméter becslését számítják ki ugyanazon a mintán.

Kritériumstatisztika

A hipotézisek típuskritériumokkal történő tesztelésének eljárása magában foglalja a megfigyelések csoportosítását. A valószínűségi változó definíciós tartományát határpontok nem metsző intervallumokra osztják

ahol  egy valószínűségi változó definíciós tartományának alsó korlátja;  - felső él.

Az adott partíciónak megfelelően kiszámításra kerül a th intervallumba eső mintaértékek száma és az intervallumba esés valószínűsége

eloszlásfüggvényű elméleti törvénynek megfelelő

Ahol

és

Egy egyszerű hipotézis tesztelésekor mind a törvény formája, mind az összes paramétere ismert (a skaláris vagy vektorparaméter ismert ).

A típus illeszkedési tesztjeiben használt statisztikák a -tól való eltérések mérésén alapulnak .

Az illeszkedési statisztika Pearson jóságát a reláció határozza meg

Egy egyszerű hipotézis tesztelése esetén a határértékben ez a statisztika engedelmeskedik egy -szabadságfokozatú -eloszlásnak , ha a tesztelt hipotézis igaz . Az -eloszlás sűrűségét , amely a gamma eloszlás speciális esete, a képlet írja le

A tesztelt hipotézist a statisztika nagy értékei esetén elvetjük, ha a mintából számított statisztika értéke nagyobb, mint a kritikus érték

vagy az elért szignifikanciaszint ( p - érték ) kisebb, mint az adott szignifikanciaszint (az adott 1. típusú hiba valószínűsége ) .

Összetett hipotézisek tesztelése

Komplex hipotézisek tesztelésekor, ha a törvény paramétereit ugyanarra a mintára a statisztika minimalizálása vagy csoportosított minta esetén a maximum likelihood módszerrel becsüljük meg , akkor a statisztika , ha a tesztelt hipotézis igaz, egy -eloszlásnak engedelmeskedik szabadsági fok, ahol  a mintából becsült paraméterek száma.

Ha a paramétereket az eredeti csoportosítatlan mintából becsüljük, akkor a statisztika eloszlása ​​nem lesz -eloszlás [1] . Ezenkívül a statisztika eloszlása, ha a hipotézis igaz , a csoportosítás módszerétől függ, vagyis attól, hogy a definíciós tartományt hogyan osztják fel intervallumokra [2] .

A csoportosítatlan minta paramétereinek maximális valószínűségi módszerének becslésekor használhat módosított kritériumokat, például [3] [4] [5] [6] .

A kritérium erejéről

Az illeszkedési kritériumok alkalmazásakor általában nem állítanak fel egymással versengő hipotéziseket: a minta egy adott törvényhez tartozik, és versengő hipotézisként bármely más törvényt figyelembe vesznek. Természetesen a kritérium különböző módon képes megkülönböztetni a megfelelő törvénytől, a hozzá közeli vagy távoli törvényeket. Ha megadunk egy versengő hipotézist és a neki megfelelő versengő törvényt , akkor már kétféle hibáról beszélhetünk: nem csak az 1. típusú hibáról (a tesztelés alatt álló hipotézis elvetéséről, ha igaz), és annak valószínűségéről. erről a hibáról , hanem egy 2. típusú hibáról (nem elutasítás a méltányosság alatt ) és ennek a hiba valószínűségéről is .

A kritérium erejét a versengő hipotézishez képest az érték jellemzi . Minél jobban felismeri a kritérium egy pár versengő hipotézist , és annál nagyobb a teljesítménye.

A Pearson-féle illeszkedési teszt ereje jelentősen függ a csoportosítás módszerétől [7] [8] és a választott intervallumszámtól [8] [9] .

Aszimptotikusan optimális csoportosítás esetén, amely maximalizálja a Fisher információs mátrix különböző funkcióit a csoportosított adatok felett (minimalizálja a csoportosítással kapcsolatos veszteségeket), a Pearson-féle illeszkedési tesztnek van maximális ereje a „(nagyon) közeli” versengő hipotézisekhez képest . 10] [8] [9] .

Egyszerű hipotézisek tesztelésekor és aszimptotikusan optimális csoportosítás használatakor a Pearson-féle illeszkedési teszt előnyt jelent a nem paraméteres illeszkedési tesztekkel szemben. Komplex hipotézisek tesztelésekor a nemparaméteres kritériumok ereje nő, és nincs ilyen előny [11] [12] . Bármely versengő hipotézispár (versenyző törvény) esetén azonban az intervallumok számának és a valószínűségi változó definíciós tartományának intervallumokra való felosztásának módszerével maximalizálható a kritérium teljesítménye [13] .

Lásd még

Jegyzetek

  1. Chernoff H., Lehmann EL A maximum likelihood becslések használata a jó illeszkedési tesztben  //  The Annals of Mathematical Statistics. - 1954. - 1. évf. 25 . - P. 579-586 .
  2. Lemeshko B. Yu., Postovalov S. N. A Pearson-statisztika korlátozó eloszlásának és a valószínűségi aránynak az adatok csoportosításának módszerétől való függéséről  // Industrial Laboratory. - 1998. - T. 64 , sz. 5 . - S. 56-63 .
  3. Nikulin M.S. Khi-négyzet teszt folyamatos eloszlásokhoz eltolási és skálaparaméterekkel  // Valószínűségelmélet és alkalmazása. - 1973. - T. XVIII , sz. 3 . - S. 583-591 .
  4. Nikulin M.S. A folytonos eloszlások khi-négyzet kritériumáról  // A valószínűség elmélete és alkalmazása. - 1973. - T. XVIII , sz. 3 . - S. 675-676 .
  5. Rao KC, Robson DS Khi-négyzet statisztika az exponenciális családon belüli illeszkedési tesztekhez  //  Commun. stat. - 1974. - 1. évf. 3 . - P. 1139-1153 .
  6. Greenwood PE, Nikulin MS Útmutató a khi-négyzet teszteléséhez  . – New York: John Wiley & Sons, 1996. – 280 p.
  7. Lemeshko B. Yu. A megfigyelések aszimptotikusan optimális csoportosítása az illeszkedési kritériumok alapján  // Gyári laboratórium. - 1998. - T. 64 , sz. 1 . - S. 56-64 .
  8. 1 2 3 R 50.1.033-2001. Javaslatok a szabványosításhoz. Alkalmazott statisztika. Szabályok a kísérleti eloszlás és az elméleti eloszlás egyezésének ellenőrzésére. I. rész Khi-négyzet tesztek . - M . : Szabványok Kiadója, 2006. - 87 p.
  9. 1 2 Lemeshko B. Yu., Chimitova E. V. Az intervallumok számának megválasztásáról a típusegyezési kritériumokban  // Gyári laboratórium. anyagdiagnosztika. - 2003. - T. 69 , sz. 1 . - S. 61-67 .
  10. Denisov V. I., Lemeshko B. Yu. Optimális csoportosítás a kísérleti adatok feldolgozásában // Mérési információs rendszerek. - Novoszibirszk, 1979. - S. 5-14.
  11. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Az illeszkedési tesztek erejének összehasonlító elemzése szorosan versengő hipotézisek mellett. I. Egyszerű hipotézisek tesztelése  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , sz. 2. cikk (34) bekezdése . - S. 96-111 .
  12. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Az illeszkedési tesztek erejének összehasonlító elemzése közeli alternatívákkal. II. Összetett hipotézisek tesztelése  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , sz. 4. cikk (36) bekezdése . - S. 78-93 .
  13. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N., Chimitova E. V. Statisztikai adatelemzés, modellezés és valószínűségi minták vizsgálata. Számítógépes megközelítés . - Novoszibirszk: NSTU Kiadó, 2011. - 888 p. – (Az NSTU monográfiái). — ISBN 978-5-7782-1590-0 . — 4.9. szakasz.

Irodalom

Lásd még

Linkek