Rayleigh-reláció

A matematikában egy adott komplex Hermit-mátrix és egy nem nulla vektor esetén a Rayleigh-reláció [1] a következőképpen definiálható [2] [3] :

Valós mátrixok esetén a mátrix hermitikusságának feltétele a szimmetriájára redukálódik , és a vektorok hermitikus konjugációja közönséges transzpozícióvá válik . Vegye figyelembe, hogy minden valós állandó esetén . Emlékezzünk vissza, hogy egy hermitikus (valamint a szimmetrikus valós) mátrixnak valós sajátértékei vannak . Megmutatható, hogy egy mátrix esetében a Rayleigh-hányados akkor éri el minimális értékét (a mátrix legkisebb sajátértéke ), ha egyenlő (a megfelelő sajátvektor). Hasonló módon kimutatható, hogy és . A Rayleigh-relációt a Courant-Fisher minimax tételben használják a sajátértékek összes értékének megszerzésére [4] . A mátrix sajátértékeinek megtalálására szolgáló algoritmusokban is használják, hogy sajátérték-közelítést kapjanak egy sajátvektor-közelítésből. Ugyanis a reláció a Rayleigh-relációval való iterációk alapja [5] [6] .

A Rayleigh-reláció értékkészletét a mátrix numerikus képének [7] [8] nevezzük .

A kovarianciamátrixok speciális esete

Az A többváltozós statisztikai minta M kovarianciamátrixa (megfigyelések mátrixa) A' A szorzatként ábrázolható [9] [10] . Mivel egy szimmetrikus valós mátrix, M -nek nemnegatív sajátértékei és ortogonális (vagy ortogonálisra redukálható) sajátvektorai vannak.

Először is, hogy a sajátértékek nem negatívak:

Másodszor pedig, hogy a sajátvektorok egymásra merőlegesek:

(ha a sajátértékek eltérőek - azonos értékek esetén ortogonális alapot találhat).

Mutassuk meg most, hogy a Rayleigh-arány a legnagyobb sajátértéknek megfelelő vektoron vesz fel egy maximális értéket. Bővítsünk ki egy tetszőleges vektort a v i sajátvektorok alapján :

, hol van x vetülete rá

Tehát egyenlőség

átírható a következő formában:

Mivel a sajátvektorok ortogonálisak, az utolsó egyenlőség lesz

Az utolsó egyenlőség azt mutatja, hogy a Rayleigh-arány a vektor és az egyes sajátvektorok közötti szögek négyzetes koszinuszainak összege , megszorozva a megfelelő sajátértékkel.

Ha egy vektor maximalizálja , akkor az összes skalárral való szorzásból kapott vektor ( for ) is maximalizálja R -t . Így a probléma lecsökkenthető arra, hogy a feltétel mellett megtaláljuk a maximumot .

Mivel az összes sajátérték nem negatív, a probléma egy konvex függvény maximumának megtalálására redukálódik , és kimutatható, hogy az és pontban érhető el (a sajátértékek csökkenő sorrendben vannak rendezve).

Így a Rayleigh-arány a maximális sajátértéknek megfelelő sajátvektornál éri el a maximumát.

Ugyanez az eredmény a Lagrange-szorzók használatával

Ugyanez az eredmény érhető el a Lagrange-szorzók használatával . A probléma a függvény kritikus pontjainak megtalálása

,

állandó értéken Azaz meg kell találni a függvény kritikus pontjait

hol van a Lagrange-szorzó. A függvény stacionárius pontjaira az egyenlőség

és

Így az M mátrix sajátvektorai a Rayleigh-reláció kritikus pontjai, sajátértékeik pedig a megfelelő stacionárius értékek.

Ez a tulajdonság a főkomponens elemzés és a kanonikus korreláció alapja .

Használata a Sturm-Liouville elméletben

A Sturm-Liouville elmélet a lineáris operátor tanulmányozásából áll

pont termékkel

,

ahol a függvények bizonyos meghatározott peremfeltételeket teljesítenek az a és b pontokban . A Rayleigh-reláció itt a formát ölti

Néha ezt az arányt ekvivalens formában ábrázolják a részekkel történő integrációval [11] :

Általánosítás

Valós szimmetrikus pozitív határozott mátrixok és nullától eltérő vektorok párja esetén az általánosított Rayleigh-relációt a következőképpen definiáljuk:

Az általánosított Rayleigh-reláció transzformációval redukálható Rayleigh -relációra , ahol a Cholesky- mátrix dekompozíciója .

Lásd még

Jegyzetek

  1. Rayleigh-Ritz relációként is ismert, Walter Ritzről és Lord Rayleighről nevezték el .
  2. Horn, R. A. és C. A. Johnson. 1985. Mátrixelemzés . Cambridge University Press. pp. 176–180.
  3. Parlet BN A szimmetrikus sajátérték probléma , SIAM, Klasszikusok az alkalmazott matematikában, 1998
  4. Beckenbach, 1965 , §26 Fischer minimax tétele.
  5. Parlett, 1983 , §4.6 Iterációk a Rayleigh-relációval, p. 87).
  6. Verbitsky, 2000 , §4.3 Fordított iterációk, p. 115.
  7. Gevorgyan .
  8. Prasolov, 2008 , 2.2 A kernel és az operátor képe. Tényezőtér., p. 114.
  9. Korshunov, 2008 , Bevezetés.
  10. ACTA, 2005 .
  11. Haberman, 1987 .

Irodalom