Kanonikus korrelációelemzés

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. március 27-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A kanonikus korrelációs elemzés ( CCA ) egy módja annak  , hogy információt szerezzünk keresztkorrelációs mátrixokból . Ha két vektorunk és valószínűségi változónk van, és ezek között korrelációk vannak , akkor a kanonikus korrelációelemzés X és Y azon lineáris kombinációját keresi, amelyiknél a maximális korreláció [1] . T. R. Knapp megfigyelte, hogy "gyakorlatilag az összes általánosan használt parametrikus szignifikancia-teszt a kanonikus korrelációelemzés speciális eseteként kezelhető, amely egy általános eljárás két változóhalmaz közötti kapcsolatok vizsgálatára" [2] . A módszert először Harold Hotelling vezette be 1936-ban [3] .

Definíció

Adott két oszlopvektor és véges második momentumú valószínűségi változók , a keresztkorreláció definiálható olyan mátrixként , amelynek elemei kovariancia . A gyakorlatban a kovarianciamátrixot a és (vagyis egy pár adatmátrixból származó) mintaadatok alapján becsüljük meg .

A kanonikus korrelációs elemzés a ( ) és ( ) vektorokat úgy keresi , hogy a valószínűségi változók maximalizálják a korrelációt . Véletlenszerű változók és a kanonikus változók első párja . Ezután olyan vektorokat keresünk, amelyek maximalizálják ugyanazt a korrelációt azzal a megszorítással, hogy nem korrelálnak az első kanonikus változópárral, ez adja a második kanonikus változópárt . Ez az eljárás akár többször is folytatható.

( a ′ , b ′ ) = argmax a , b korr ⁡ ( a T x , b T Y ) {\displaystyle (a',b')={\underset {a,b}{\operátornév {argmax} }}\operátornév {corr} (a^{T}X,b^{T}Y)}

Számítás

Következtetés

Hagyjuk és . Maximális paraméter

Első lépésben megváltoztatjuk az alapot és meghatározzuk

Akkor van

A Cauchy-Bunyakovsky egyenlőtlenségből azt kapjuk , hogy

Egy egyenlőtlenség akkor válik egyenlővé, ha a és a vektorok kollineárisak . Ezenkívül a maximális korreláció akkor érhető el, ha a sajátvektor a mátrix maximális sajátértékével rendelkezik (lásd Rayleigh-reláció ). A következő párt a következő legnagyobb sajátérték felhasználásával találjuk meg . Az ortogonalitást a korrelációs mátrixok szimmetriája garantálja.

Megoldás

Megoldás:

Ennek megfelelően szintén

A koordináták fordított változtatásával azt kapjuk

A kanonikus változókat az egyenlőségek határozzák meg:

Megvalósítás

A CCA a korrelációs mátrix szinguláris érték dekompozíciójával számítható ki [4] . A kanonikus korreláció szolgáltatásként elérhető a következő rendszerekben [5] .

Hipotézis tesztelés

Minden sor szignifikanciáját a következő módszerrel teszteljük. Mivel a korrelációk rendezve vannak, az az állítás, hogy a sor nulla, azt jelenti, hogy minden további korreláció is nulla. Ha a mintában vannak független megfigyelések, és a becsült korreláció a -re , akkor a -edik sorban a szignifikancia kritériuma a következő lesz:

amely aszimptotikusan eloszlik egy khi - négyzetként nagy szabadságfokkal [6] . Mivel minden korreláció tól -ig nulla, az e pont utáni tagok szorzata irreleváns.

Gyakorlati felhasználás

Kísérleti kontextusban a kanonikus korreláció tipikus használata az, hogy két változókészletet veszünk figyelembe, és megvizsgáljuk, mi a közös a két halmazban [7] . Például a pszichológiai kutatásban elvégezhető két bevett többváltozós személyiségteszt , mint például a Minnesota Multidimensional Personality Inventory (MMPI-2) és a NEO . Ha megvizsgáljuk, hogy az MMPI-2 faktorok hogyan viszonyulnak a NEO faktorokhoz, kiderül, hogy mely jellemzők voltak közösek a két teszt között, és mennyire közösek a változók. Például előfordulhat, hogy az olyan jellemzők, mint az extraverzió vagy a neuroticizmus , a két teszt közös változóinak jelentős részét alkotják.

A kanonikus korrelációelemzés segítségével olyan egyenlőséget is kaphat, amely két változókészletre vonatkozik, például teljesítménymérésekre és magyarázó változók halmazára, vagy egy kimeneti és egy bemeneti halmazra. Egy ilyen modellre korlátozó feltételeket lehet támasztani, hogy elméleti vagy intuitív módon nyilvánvaló követelményeket biztosítsanak. Ezt a modelltípust maximális korrelációs modellnek nevezik [8] .

A kanonikus korreláció eredményeinek megjelenítése általában a kanonikus változópárok két változókészletének együtthatóinak oszlopdiagramján keresztül történik, amely szignifikáns korrelációt mutat. Egyes szerzők azt javasolják, hogy az eredményeket jobb egy heliográfon megjeleníteni, amely egy kördiagram, amelyen sugarakként oszlopok találhatók, amelyek fele az egyik változóhalmazt, a másik fele pedig a második halmazt reprezentálja [9] .

Példák

Legyen nulla matematikai várakozással , azaz. . Ha , azaz és teljes mértékben korrelálnak, akkor például és , tehát az első (csak ebben a példában) kanonikus változópár az és . Ha , azaz és teljesen antikorrelált, akkor és , tehát az első (csak ebben a példában) kanonikus változópár az és . Vegye figyelembe, hogy mindkét esetben , ami azt mutatja, hogy a kanonikus korrelációs elemzés pontosan ugyanúgy működik a korrelált változókkal, mint az antikorrelált változókkal.

Kapcsolat főszögekkel

Tegyük fel, hogy és nulla matematikai elvárásunk van , pl. . Kovariancia mátrixaik és Gram - mátrixoknak tekinthetők belső szorzattal , ill . Ebben az értelmezésben a valószínűségi változókat, a vektor elemeit és a vektor elemeit egy vektortér elemeiként kezeljük a kovariancia által megadott skaláris szorzattal .

A kanonikus változók definíciója, majd ekvivalens a gyökérvektorok meghatározásával a és által átívelt altérpárok esetében, figyelembe véve ezt a skaláris szorzatot . A kanonikus korreláció egyenlő az alterek közötti szög koszinuszával .

Fehérítés és valószínűségi kanonikus korrelációelemzés

A CCA egy speciális fehérítő transzformációnak is tekinthető [10] , ahol a véletlen vektorok és egyidejűleg transzformálódnak oly módon, hogy a fehérített vektorok és a keresztkorrelációs mátrix átlós legyen [11] .

A kanonikus korrelációkat ezután regressziós együtthatókként értelmezzük, amelyek vonatkoznak a , és -re, és lehetnek negatívak. Ha a CCA-t regressziónak tekintjük, akkor lehetőség nyílik egy látens változó generatív valószínűségi modelljének felépítésére a CCA-hoz, a teljes és részleges varianciát reprezentáló nem korrelált látens változókkal.

Lásd még

Jegyzetek

  1. Härdle, Simar, 2007 , p. 321–330.
  2. Knapp, 1978 , p. 410–416.
  3. Hotelling, 1936 , p. 321–377.
  4. Hsu, Kakade, Zhang, 2012 , p. 1460.
  5. Huang, Lee, Hsiao, 2009 , p. 2162.
  6. Mardia, Kent, Bibby, 1979 .
  7. Sieranoja, Sahidullah, Kinnunen, Komulainen, Hadid, 2018 .
  8. Tofallis, 1999 , p. 371–378.
  9. Degani, Shafto, Olson, 2006 , p. 93.
  10. A fehérítő transzformáció a valószínűségi változók vektorát lineáris transzformációval fehér zajmá alakítja
  11. Jendoubi, Strimmer, 2018 .

Irodalom

Linkek