A Student-féle t-próba a hipotézisek statisztikai tesztelésére szolgáló módszerek ( statisztikai tesztek ) általános elnevezése a Student-féle eloszláson alapulóan . A t-próba alkalmazásának leggyakoribb esetei két mintában az átlagok egyenlőségének ellenőrzéséhez kapcsolódnak .
A t -statisztikát általában a következő általános elv szerint építjük fel: a számlálóban - egy valószínűségi változó nulla matematikai várakozással (amikor a nullhipotézis teljesül ), a nevezőben pedig - ennek a valószínűségi változónak a minta szórása, amelyet a a variancia torzítatlan becslésének négyzetgyöke .
Ezt a kritériumot William Gosset dolgozta ki a Guinness sör minőségének értékelésére . A céggel szembeni, az üzleti titkok felfedésére vonatkozó kötelezettségekkel kapcsolatban (a Guinness vezetése a statisztikai apparátus ilyen jellegű használatát tekintette munkájuk során), Gosset cikke 1908-ban jelent meg a „Biometrics” folyóiratban „Student” álnéven. Diák).
Ennek a feltételnek az alkalmazásához szükséges, hogy az eredeti adatok normális eloszlásúak legyenek . Független minták kétmintás vizsgálatának alkalmazása esetén is meg kell felelni a varianciaegyenlőség feltételének . Vannak azonban alternatívák a Student-féle t-próbára az egyenlőtlen szórású helyzetekre.
Az a követelmény, hogy az adateloszlás normális legyen, szükséges egy pontos -teszthez. Azonban még más adateloszlásoknál is lehetséges a -statisztika használata. Sok esetben ezeknek a statisztikáknak aszimptotikusan szabványos normál eloszlása van - , így használhatja ennek az eloszlásnak a kvantiliseit . Gyakran azonban még ebben az esetben sem a standard normál eloszlásból, hanem a megfelelő Student-eloszlásból használjuk a kvantiseket, mint az egzakt tesztben. Aszimptotikusan egyenértékűek, azonban kis mintákon a Student-féle eloszlás konfidencia intervallumai szélesebbek és megbízhatóbbak.
Ha ezek a feltételek nem teljesülnek, a mintaátlagok összehasonlításakor a nem- paraméteres statisztika hasonló módszereit kell használni , amelyek közül a leghíresebb a Mann-Whitney U-teszt (kétmintás teszt független mintákhoz), valamint a előjel teszt és a Wilcoxon teszt (függő minták esetén használatos) .
A matematikai elvárás valamilyen ismert értékkel való egyenlőségére vonatkozó nullhipotézis tesztelésére szolgál .
Nyilvánvalóan, ha a nullhipotézis teljesül . Figyelembe véve a megfigyelések feltételezett függetlenségét . Az elfogulatlan varianciabecslés segítségével a következő t-statisztikát kapjuk:
A nullhipotézis szerint ennek a statisztikának az eloszlása: . Ezért, ha a statisztikai érték meghaladja (abszolút értékben) ennek az eloszlásnak a kritikus értékét (adott szignifikancia szinten), a nullhipotézist elvetjük.
Legyen két független minta normális eloszlású valószínűségi változókkal . A valószínűségi változók matematikai elvárásainak egyenlőségére vonatkozó nullhipotézist mintaadatok felhasználásával szükséges tesztelni .
Tekintsük a mintaátlagok közötti különbséget . Nyilvánvalóan, ha a nullhipotézis teljesül, . A minták függetlensége alapján ennek a különbségnek a szórása egyenlő: . Ezután a variancia torzítatlan becslését felhasználva torzítatlan becslést kapunk a mintaátlagok közötti különbség szórására: . Ezért a nullhipotézis tesztelésének t-statisztikája az
Ennek a statisztikának a nullhipotézis érvényessége mellett van egy eloszlása , ahol .
Ha a minta eltéréseit azonosnak tételezzük fel, akkor
Ekkor a t-statisztika:
Ennek a statisztikának van egy eloszlása .
A -kritérium empirikus értékének kiszámításához két függő minta (például ugyanazon teszt két mintája egy időintervallum) közötti különbségekre vonatkozó hipotézis tesztelése során a következő képletet használjuk:
ahol az értékek átlagos eltérése, a különbségek szórása, és n a megfigyelések száma.
Ennek a statisztikának van egy eloszlása .
A t-próba segítségével tetszőleges (egyszeri) lineáris kényszert is tesztelhet a közönséges legkisebb négyzetek módszerével becsült lineáris regresszió paramétereire . Legyen szükséges a hipotézis tesztelése . Nyilvánvalóan, ha a nullhipotézis teljesül . Itt a modellparaméterek torzítatlan LSM-becslésének tulajdonságát használjuk . Ezen kívül, . Az ismeretlen variancia helyett elfogulatlan becslését használva a következő t-statisztikát kapjuk:
Ennek a statisztikának, ha a nullhipotézis teljesül, eloszlása van , tehát ha a statisztika értéke nagyobb, mint a kritikus érték, akkor a lineáris kényszer nullhipotézise elvetődik.
A lineáris kényszer speciális esete annak a hipotézisnek a tesztelése, hogy a regressziós együttható egy bizonyos értékkel egyenlő . Ebben az esetben a megfelelő t-statisztika:
ahol az együtthatóbecslés standard hibája és az együtthatóbecslések kovarianciamátrixának megfelelő átlós elemének négyzetgyöke.
Ha a nullhipotézis igaz, a statisztika eloszlása . Ha a statisztika abszolút értéke nagyobb, mint a kritikus érték, akkor a -tól származó együttható különbsége statisztikailag szignifikáns (nem véletlenszerű), ellenkező esetben jelentéktelen (véletlenszerű, vagyis a valódi együttható valószínűleg egyenlő vagy nagyon közel van a várható értékre ).
A matematikai elvárások egymintás tesztje lecsökkenthető a lineáris regressziós paraméterek lineáris kényszerének tesztelésére. Egymintás tesztben ez egy konstans "regressziója". Ezért a regresszió a vizsgált valószínűségi változó varianciájának mintabecslése, a mátrix a , és a modell „együtthatójának” becslése megegyezik a minta átlagával. Ebből kapjuk az általános esetre fent megadott t-statisztika kifejezést.
Hasonlóképpen kimutatható, hogy egy kétmintás teszt egyenlő mintavarianciákkal szintén lineáris kényszerek tesztelésére redukálódik. Egy kétmintás tesztben ez egy állandó és egy álváltozó "regressziója", amely a (0 vagy 1) értéktől függően egy részmintát azonosít: . A minták matematikai elvárásainak egyenlőségére vonatkozó hipotézis ennek a modellnek a b együtthatójának nullával való egyenlőségére vonatkozó hipotézisként fogalmazható meg. Kimutatható, hogy ennek a hipotézisnek a teszteléséhez a megfelelő t-statisztika megegyezik a kétmintás teszthez megadott t-statisztikával.
Le is redukálható a lineáris kényszer ellenőrzésére különböző varianciák esetén. Ebben az esetben a modellhibák varianciája két értéket vesz fel. Ez alapján a kétmintás teszthez hasonló t-statisztikát is kaphatunk.
A független minták kétmintás tesztjének analógja a Mann-Whitney U-teszt . A függő minták esetében az analógok az előjelteszt és a Wilcoxon T-teszt .
diák. Egy átlag valószínű hibája. // Biometrika. 1908. 6. szám (1). P. 1-25.