A matematikában egy adott komplex Hermit-mátrix és egy nem nulla vektor esetén a Rayleigh-reláció [1] a következőképpen definiálható [2] [3] :
Valós mátrixok esetén a mátrix hermitikusságának feltétele a szimmetriájára redukálódik , és a vektorok hermitikus konjugációja közönséges transzpozícióvá válik . Vegye figyelembe, hogy minden valós állandó esetén . Emlékezzünk vissza, hogy egy hermitikus (valamint a szimmetrikus valós) mátrixnak valós sajátértékei vannak . Megmutatható, hogy egy mátrix esetében a Rayleigh-hányados akkor éri el minimális értékét (a mátrix legkisebb sajátértéke ), ha egyenlő (a megfelelő sajátvektor). Hasonló módon kimutatható, hogy és . A Rayleigh-relációt a Courant-Fisher minimax tételben használják a sajátértékek összes értékének megszerzésére [4] . A mátrix sajátértékeinek megtalálására szolgáló algoritmusokban is használják, hogy sajátérték-közelítést kapjanak egy sajátvektor-közelítésből. Ugyanis a reláció a Rayleigh-relációval való iterációk alapja [5] [6] .
A Rayleigh-reláció értékkészletét a mátrix numerikus képének [7] [8] nevezzük .
Az A többváltozós statisztikai minta M kovarianciamátrixa (megfigyelések mátrixa) A' A szorzatként ábrázolható [9] [10] . Mivel egy szimmetrikus valós mátrix, M -nek nemnegatív sajátértékei és ortogonális (vagy ortogonálisra redukálható) sajátvektorai vannak.
Először is, hogy a sajátértékek nem negatívak:
Másodszor pedig, hogy a sajátvektorok egymásra merőlegesek:
(ha a sajátértékek eltérőek - azonos értékek esetén ortogonális alapot találhat).Mutassuk meg most, hogy a Rayleigh-arány a legnagyobb sajátértéknek megfelelő vektoron vesz fel egy maximális értéket. Bővítsünk ki egy tetszőleges vektort a v i sajátvektorok alapján :
, hol van x vetülete ráTehát egyenlőség
átírható a következő formában:
Mivel a sajátvektorok ortogonálisak, az utolsó egyenlőség lesz
Az utolsó egyenlőség azt mutatja, hogy a Rayleigh-arány a vektor és az egyes sajátvektorok közötti szögek négyzetes koszinuszainak összege , megszorozva a megfelelő sajátértékkel.
Ha egy vektor maximalizálja , akkor az összes skalárral való szorzásból kapott vektor ( for ) is maximalizálja R -t . Így a probléma lecsökkenthető arra, hogy a feltétel mellett megtaláljuk a maximumot .
Mivel az összes sajátérték nem negatív, a probléma egy konvex függvény maximumának megtalálására redukálódik , és kimutatható, hogy az és pontban érhető el (a sajátértékek csökkenő sorrendben vannak rendezve).
Így a Rayleigh-arány a maximális sajátértéknek megfelelő sajátvektornál éri el a maximumát.
Ugyanez az eredmény érhető el a Lagrange-szorzók használatával . A probléma a függvény kritikus pontjainak megtalálása
,állandó értéken Azaz meg kell találni a függvény kritikus pontjait
hol van a Lagrange-szorzó. A függvény stacionárius pontjaira az egyenlőség
és
Így az M mátrix sajátvektorai a Rayleigh-reláció kritikus pontjai, sajátértékeik pedig a megfelelő stacionárius értékek.
Ez a tulajdonság a főkomponens elemzés és a kanonikus korreláció alapja .
A Sturm-Liouville elmélet a lineáris operátor tanulmányozásából áll
pont termékkel
,ahol a függvények bizonyos meghatározott peremfeltételeket teljesítenek az a és b pontokban . A Rayleigh-reláció itt a formát ölti
Néha ezt az arányt ekvivalens formában ábrázolják a részekkel történő integrációval [11] :
Valós szimmetrikus pozitív határozott mátrixok és nullától eltérő vektorok párja esetén az általánosított Rayleigh-relációt a következőképpen definiáljuk:
Az általánosított Rayleigh-reláció transzformációval redukálható Rayleigh -relációra , ahol a Cholesky- mátrix dekompozíciója .