Varianciaanalízis

A varianciaanalízis  egy olyan matematikai statisztika módszer, amely a kísérleti adatokban való függőségek megtalálását célozza az átlagértékek különbségeinek szignifikáns vizsgálatával [1] [2] . A t-teszttel ellentétben lehetővé teszi három vagy több csoport átlagának összehasonlítását. R. Fisher által kifejlesztett kísérleti vizsgálatok eredményeinek elemzésére. Az ANOVA (az angol ANalysis Of Variance szóból ) [3] elnevezés is megtalálható a szakirodalomban .  

Az ANOVA típusai

A varianciaanalízis lényege, hogy megvizsgáljuk egy vagy több független változó , általában faktorként emlegetett hatását a függő változóra . A függő változókat az abszolút skála (arányskála) értékei képviselik . A független változók névlegesek (névskála), vagyis a csoporthoz való kötődést tükrözik, és két vagy több értékük is lehet (típus, fokozatosság vagy szint). A két értékű független változó például a nem (nő: , férfi: ) vagy a kezelési csoport típusa (kontroll: , kísérleti: ). Az objektumok független mintáinak megfelelő gradációkat csoportközinek, a függő mintáknak megfelelő gradációkat csoporton belülinek nevezzük.

A változók típusától és számától függően a következők vannak:

Varianciaanalízis matematikai modellje

A diszperzióanalízis matematikai modellje a lineáris alapmodell speciális esete . Használjuk a módszereket több olyan paraméter mérésére, amelyek pontos értéke . Ebben az esetben a különböző mennyiségek különböző módszerekkel történő mérésének eredményei a következőképpen ábrázolhatók:

,

ahol:

Ezután a következő valószínűségi változók varianciái: (ahol:




)

a következőképpen fejeződnek ki:

és megfelel a személyazonosságnak:

A varianciaanalízis eljárás a szisztematikus (csoportok közötti) variancia és a véletlen (csoporton belüli) variancia arányának meghatározásából áll a mért adatokban. A változékonyság mutatójaként a paraméterértékek átlagtól való eltérésének négyzetösszegét használják: ( angolul. Sum of Squares ). Megmutatható, hogy a teljes négyzetösszeg felbomlik egy csoportközi négyzetösszegre és egy csoporton belüli négyzetösszegre :

Legyen minden paraméter pontos értéke a sokaság átlagával egyenlő matematikai elvárás . Szisztematikus hibák hiányában a csoportátlag és a sokaság átlaga megegyezik: . Ekkor a véletlenszerű mérési hiba a mérési eredmény és a csoportátlag különbsége : . Ha a módszer szisztematikus hatású, akkor ennek a tényezőnek a hatására a szisztematikus hiba a csoportátlag és a sokaság átlagának különbsége : .

Ekkor az egyenlet a következőképpen ábrázolható:

, vagy

.

Akkor

ahol

Következésképpen

A szabadságfokokat hasonló módon bontják fel:

ahol

és a teljes minta mérete, és  a csoportok száma.

Ekkor az egyes részek szórása, amelyet a varianciaanalízis modellben „átlag négyzetként” emlegetnek, vagy (az angol Mean Square szóból ) a négyzetek összegének és a szabadságfokaik számának aránya:

A csoportok közötti és a csoporton belüli varianciák aránya F -eloszlású ( Fischer-eloszlás ), és a ( Fischer-féle F -kritérium ) segítségével határozható meg:

Alapelvek és alkalmazások

A varianciaanalízis kiindulópontjai az

A varianciaanalízis nullhipotézise az átlagértékek egyenlőségére vonatkozó állítás:

A nullhipotézis elutasítása esetén az alternatív hipotézis elfogadásra kerül, miszerint nem minden átlag egyenlő, vagyis legalább két olyan csoport van, amelyek átlagban különböznek egymástól:

Ha három vagy több csoport van, akkor post-hoc t - teszteket vagy kontrasztok módszerét alkalmazzák az átlagok közötti különbségek meghatározására .

Egyirányú varianciaanalízis

A varianciaanalízis legegyszerűbb esete egy egydimenziós egyirányú elemzés két vagy több független csoportra, amikor az összes csoportot egy tulajdonság szerint kombináljuk. Az elemzés során az átlagok egyenlőségére vonatkozó nullhipotézist teszteljük. Két csoport elemzésekor a varianciaanalízis megegyezik a kétmintás Student- féle független minták t -próbájával , az F -statisztika értéke pedig megegyezik a megfelelő t -statisztika négyzetével .

A diszperziók egyenlőségére vonatkozó állítás megerősítésére általában a Levene-próbát használják . Ha a varianciaegyenlőség hipotézisét elvetjük, a fő elemzés nem alkalmazható. Ha az eltérések egyenlőek, akkor a Fisher-féle F -kritériumot használjuk a csoportok közötti és a csoporton belüli variabilitás arányának értékelésére :

Ha az F -statisztika meghaladja a kritikus értéket, akkor a nullhipotézist nem lehet elfogadni (elvetni), és következtetést vonunk le az átlagok egyenlőtlenségére. A két csoport átlagának elemzésekor az eredmények a Fisher-teszt alkalmazása után azonnal értelmezhetők .

Ha három vagy több csoport van, akkor az átlagok páronkénti összehasonlítása szükséges a köztük lévő statisztikailag szignifikáns különbségek azonosításához. Az a priori elemzés magában foglalja a kontrasztok módszerét, amelyben a csoportok közötti négyzetösszeget az egyes kontrasztok négyzetösszegeire osztják:

ahol kontraszt van a két csoport átlaga között, majd Fisher -próbával ellenőrizzük az egyes kontrasztok átlagnégyzetének és a csoporton belüli átlagnégyzet arányát:

Az utólagos elemzés magában foglalja a Bonferroni vagy Scheffe módszerrel végzett post-hoc t teszteket , valamint az átlagkülönbségek összehasonlítását a Tukey-módszerrel. A post-hoc tesztek egyik jellemzője a csoporton belüli átlagnégyzet használata bármely átlagpár értékelésére. A Bonferroni és Scheffe tesztek a legkonzervatívabbak, mivel adott szignifikanciaszinten a legkisebb kritikus régiót használják .

Az átlagok becslése mellett a varianciaanalízis magában foglalja a determinációs együttható meghatározását is , amely megmutatja, hogy a teljes variabilitás mekkora hányadát magyarázza ez a tényező:

Többváltozós varianciaanalízis

, ahol:

Az egyváltozós modelltől eltérően, ahol egy csoportközi négyzetösszeg van, a többváltozós elemzési modell tartalmazza az egyes tényezők négyzetösszegeit külön-külön, és a köztük lévő összes kölcsönhatás négyzetösszegeit. Így a kéttényezős modellben a csoportközi négyzetösszeg a faktor négyzetösszegére, a tényező négyzetösszegére , valamint a tényezők és a tényezők kölcsönhatásának négyzetösszegére bontható :

Ennek megfelelően a háromtényezős modell tartalmazza a faktor négyzetösszegét, a faktor négyzetösszegét, a faktor négyzetösszegét és a tényezők kölcsönhatásának négyzetösszegét és , és és , valamint mindhárom tényező kölcsönhatása :

A szabadsági fokokat hasonló módon bővítjük:

ahol

és a teljes minta térfogata,  a faktor szintjeinek (csoportjainak) száma , és a faktor  szintjeinek (csoportjainak) száma .

Az elemzés több nullhipotézist tesztel :

Minden hipotézist a Fisher-kritérium segítségével tesztelünk:

Az egyetlen tényező befolyására vonatkozó nullhipotézis elutasításakor elfogadjuk azt az állítást, hogy a faktornak van fő hatása ( stb.). A faktorok kölcsönhatására vonatkozó nullhipotézis elvetésekor elfogadjuk azt az állítást, hogy a faktor hatása a faktor különböző szintjein eltérően nyilvánul meg . Általában ebben az esetben az általános elemzés eredményeit érvénytelennek ismerik el, és a faktor hatását a faktor minden szintjén külön ellenőrzik egyirányú varianciaanalízissel vagy t -próbával .

Jegyzetek

  1. Varianciaanalízis . Letöltve: 2011. március 15. Az eredetiből archiválva : 2012. május 23..
  2. Diszperzióanalízis - cikk a Great Soviet Encyclopedia- ból . Bolsev, L.N.. 
  3. A. D. Naszledov. A pszichológiai kutatás matematikai módszerei. Szentpétervár, 2008. ISBN 5-9268-0275-X

Irodalom