A Kolmogorov -féle illeszkedési teszt célja annak a hipotézisnek a tesztelése, hogy a minta valamilyen eloszlási törvényhez tartozik, vagyis annak ellenőrzésére, hogy az empirikus eloszlás megfelel-e a várt modellnek .
A Szmirnov-féle homogenitási kritérium annak a hipotézisnek a tesztelésére szolgál, hogy két független minta ugyanahhoz az eloszlási törvényhez tartozik, azaz két empirikus eloszlás ugyanazon törvénynek felel meg .
Ezeket a kritériumokat Andrej Nyikolajevics Kolmogorov és Nyikolaj Vasziljevics Szmirnov matematikusokról nevezték el .
A két empirikus eloszlási törvény homogenitásának hipotézisének tesztelésére szolgáló Szmirnov-kritérium az egyik leggyakrabban használt nem paraméteres kritérium .
Ha a kritérium minden számjegyhez külön-külön két eloszlás gyakoriságát hasonlítja össze, akkor itt először az első számjegyre, majd az első és a második számjegy összegére, majd az első, második és harmadik számjegy összegére hasonlítják össze a gyakoriságokat, stb. Így minden alkalommal, amikor a felhalmozott erre a frekvenciatartományra.
Ha a két eloszlás közötti különbség szignifikáns, akkor egy ponton a halmozott gyakoriságok különbsége eléri a kritikus értéket, és az eltérések statisztikailag szignifikánsnak tekinthetők. Ezt a különbséget a kritériumképlet tartalmazza. Minél nagyobb az empirikus érték , annál jelentősebbek a különbségek.
Legyen a mintára épülő tapasztalati eloszlásfüggvény (EDF) a következő:
ahol azt jelzi, hogy a megfigyelés a területre esett -e :
Ellenőrizzük, hogy a minta egy eloszlásfüggvénnyel generált valószínűségi változó -e . Az empirikus eloszlásfüggvény tesztstatisztikája a következőképpen definiálható:
ahol by a függvény felső értéke .
Jelöljük a nullhipotézist úgy, mint azt a hipotézist, hogy a minta engedelmeskedik az eloszlásnak . Ekkor a Kolmogorov-tétel szerint a bevezetett statisztikákra igaz:
Figyelembe vesszük, hogy a kritériumnak van egy jobb oldali kritikus tartománya .
Döntéshozatal a Kolmogorov-kritérium szerint. Ha a statisztika meghaladja az adott szignifikanciaszintű Kolmogorov-eloszlás százalékpontját , akkor a nullhipotézist ( a törvénynek való megfelelésről ) elvetjük. Ellenkező esetben a hipotézist a szinten elfogadjuk . |
Ha elég közel van az 1-hez, akkor a következő képlettel közelíthető:
A teszt aszimptotikus hatványa 1.
Jelöljük most a nullhipotézist úgy, mint azt a hipotézist , hogy a két vizsgált minta a valószínűségi változó azonos eloszlását követi .
Szmirnov tétele. Legyenek független térfogat és valószínűségi változó mintákból összeállított empirikus eloszlásfüggvények . Akkor, ha , akkor , hol . |
Szmirnov tétele lehetővé teszi számunkra, hogy kritériumot alkossunk két minta homogenitásának vizsgálatára.
Döntéshozatal a Szmirnov-kritérium szerint. Ha a statisztika egy adott szignifikanciaszintre meghaladja a Kolmogorov-eloszlás kvantilisét , akkor a nullhipotézist ( a minták homogenitására vonatkozóan) elvetjük. Ellenkező esetben a hipotézist a szinten elfogadjuk . |
A Kolmogorov-kritériumban célszerű a Bolsev-korrekciós statisztikát használni a következő formában . Ezeknek a statisztikáknak az eloszlása már nem függ annyira a minta méretétől. Eloszlásának a mintanagyságtól való függése elhanyagolható -nál .
A klasszikus Kolmogorov-teszt egyszerű hipotézisek tesztelésére szolgál . Ha azt a hipotézist teszteljük, hogy a megfigyelt minta egyezik-e a törvénnyel, amelynek minden paramétere ismert, akkor a Kolmogorov -kritérium eloszlásmentes : nem mindegy, hogy melyik törvénnyel ellenőrzik az egyezést. Ha a tesztelt hipotézis igaz, a Kolmogorov-statisztika korlátozó eloszlása a Kolmogorov-eloszlás .
Minden megváltozik az összetett hipotézisek tesztelésekor , amikor az elemzett minta kiértékeli annak az elméleti törvénynek a paramétereit, amellyel az egyezést ellenőrizzük. Összetett hipotézisek tesztelésekor a disztribúciós szabadság elveszik. Az összetett hipotézisek és a tesztelt hipotézis érvényességének tesztelésekor az illeszkedési tesztek nem-paraméteres jóságának statisztikáinak (és a Kolmogorov-próbának) eloszlása számos tényezőtől függ: a vizsgált hipotézisnek megfelelő megfigyelt törvény típusától; a kiértékelendő paraméter típusáról és a kiértékelendő paraméterek számáról; bizonyos esetekben egy adott paraméterértéken (például gamma- és béta-eloszlások családjainál); a paraméterbecslési módszerből. Az egyszerű és összetett hipotézisek tesztelésekor ugyanazon statisztikák határeloszlásai közötti különbségek olyan jelentősek, hogy semmiképpen sem szabad figyelmen kívül hagyni őket.