Mátrix spektrális lebontása

A mátrix spektrális vagy sajátvektorokon alapuló felbontása egy négyzetes mátrix három mátrix szorzata , ahol az a mátrix, amelynek oszlopai a mátrix sajátvektorai , egy átlós mátrix a megfelelő sajátértékekkel a főátlón a mátrix mátrix inverze . $A$ $A=V\Lambda V^{{-1}}$ $V$ $A$ $\lambda$ $V^{{-1}}$ $V$

Csak azok a mátrixok ábrázolhatók ebben az alakban, amelyek teljes sajátvektor-készlettel, azaz n lineárisan független sajátvektorból állnak, ahol n a mátrix sorrendje . $A$

A spektrális dekompozíció felhasználható a mátrix sajátértékeinek és sajátvektorainak megkeresésére, lineáris egyenletrendszerek megoldására, mátrix invertálására, mátrix determinánsának megtalálására és mátrixok analitikai függvényeinek kiszámítására.

A sajátvektorok és a mátrix sajátértékek elmélete

Egy nem nulla N dimenziós vektor egy négyzetmátrix sajátvektora, ha kielégíti a lineáris egyenletet $\mathbf{v}$ $N \x N$ $\mathbf {A}$

\mathbf {A} \mathbf {v} =\lambda \mathbf {v}

ahol a mátrix sajátértékének nevezett és a sajátvektornak megfelelő skalár . Vagyis a sajátvektorok azok a vektorok, amelyeket a lineáris transzformáció csak meghosszabbít vagy rövidít, a sajátérték pedig a hosszváltozási tényező. A fenti egyenletet sajátérték-egyenletnek vagy sajátérték-problémának nevezzük . $\lambda$ $\mathbf{v}$ $\mathbf {A}$

A fenti egyenlet egy homogén lineáris egyenletrendszernek tekinthető

(\mathbf {A} -\lambda \mathbf {E} )\,\mathbf {v} =0

ahol egy skaláris paraméter és egy homogén lineáris egyenletrendszer nemtriviális megoldása. Egy homogén lineáris egyenletrendszer nem triviális megoldásai csak akkor léteznek, ha a rendszer mátrixának determinánsa nulla, azaz. $\lambda$ $\mathbf{v}$

p\left(\lambda \right)=\det \left(\mathbf {A} -\lambda \mathbf {E} \right)=0.

A polinomot a mátrix karakterisztikus polinomjának, a fenti egyenletet pedig karakterisztikus egyenletnek nevezzük . A karakterisztikus egyenlet a változó N- edrendű polinomegyenlete . Ennek az egyenletnek különböző gyökerei vannak, ahol . A megoldások, vagyis a sajátértékek halmazát a mátrix spektrumának nevezzük [1] [2] [3] . $p(\lambda )$ $\lambda$ ${\displaystyle N_{\lambda ))$ $1\leqslant N_{\lambda }\leqslant N$ $\mathbf {A}$

Tényezőzzük a karakterisztikus polinomot : $p(\lambda )$

p\left(\lambda \right)=\left(\lambda -\lambda _{1}\right)^{n_{1}}\left(\lambda -\lambda _{2}\right) ^{n_{2}}\cdots \left(\lambda -\lambda _{N_{\lambda }}\right)^{n_{N_{\lambda }}}=0.

Az n i természetes számot a sajátérték algebrai többszörösének nevezzük . Ha a skalármező algebrailag zárt , akkor az algebrai multiplicitások összege N : $\lambda _{i}$

\sum \limits _{i=1}^{N_{\lambda }}{n_{i}}=N.

Minden sajátértékhez külön egyenletet kell megoldani a sajátvektorokra: $\lambda _{i}$

\left(\mathbf {A} -\lambda _{i}\mathbf {E} \right)\mathbf {v} =0.

Minden ilyen egyenletre létezik lineárisan független megoldás. Az m i megoldások lineáris kombinációi a sajátértékhez társított sajátvektorok . Az m i egész számot az érték geometriai multiplicitásának nevezzük . Előfordulhat, hogy az algebrai multiplicitás és a geometriai multiplicitás nem esik egybe, de mindig . A lineárisan független sajátvektorok teljes száma a geometriai multiplicitások összegzésével számítható ki ${\displaystyle 1\leqslant m_{i}\leqslant n_{i))$ $\lambda _{i}$ $\lambda _{i}$ $n_{i}$ $m_i$ ${\displaystyle m_{i}\leqslant n_{i))$ ${\displaystyle N_{\mathbf {v} ))$

\sum \limits _{i=1}^{N_{\lambda }}{m_{i}}=N_{\mathbf {v} }.

A sajátvektorok sajátértékekkel indexelhetők egy kettős index segítségével, amely az i - edik sajátérték j -edik sajátvektorát jelenti . Az egyszerűbb indexelés egyetlen indexet használ, ahol . ${\displaystyle \mathbf {v} _{ij))$ ${\displaystyle \mathbf {v} _{k))$ ${\displaystyle k=1,2,\dots ,N_{\mathbf {v} ))$

Mátrixbontás sajátvektorok segítségével

Legyen négyzetes mátrix n lineárisan független q i ( ) sajátvektorral . Utána lehet bomlani $\mathbf {A}$ $n\szer n$ $i = 1, \pontok, n$ $\mathbf {A}$

{\displaystyle \mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1))

ahol egy négyzetes mátrix, amelynek i -edik oszlopa a mátrix sajátvektora , és egy átlós mátrix , amelynek átlós elemei a megfelelő sajátértékek, . Figyeljük meg, hogy csak az átlósítható mátrixok bonthatók így fel. Például egy eltolási mátrix nem diagonalizálható. ${\mathbf {Q}}$ $n\szer n$ $q_{i}$ $\mathbf {A}$ $\lambda$ ${\displaystyle \Lambda _{ii}=\lambda _{i))$ $\left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]$

Általában a q i sajátvektorok normalizáltak , de ez nem szükséges, n sajátvektorból álló v i nem normalizált halmaz is használható mátrixoszlopként . ${\mathbf {Q}}$

A dekompozíciót a sajátvektorok alapvető tulajdonságából kaphatjuk meg:

{\begin{aligned}\mathbf {A} \mathbf {v} &=\lambda \mathbf {v} \\\mathbf {A} \mathbf {Q} &=\mathbf {Q} \mathbf { \Lambda } \\\mathbf {A} &=\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}.\end{igazított))

Példa

Valódi mátrix $2\times 2$ $\mathbf {A}$

\mathbf {A} ={\begin{bmatrix}1&0\\1&3\\\end{bmatrix}}

nem szinguláris mátrixszal való szorzással átlós alakra redukálható $\mathbf {B}$

\mathbf {B} ={\begin{bmatrix}a&b\\c&d\end{bmatrix}}\in \mathbb {R} ^{2\times 2}.

Akkor

{\begin{bmatrix}a&b\\c&d\end{bmatrix}}^{-1}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d \end{bmatrix}}={\begin{bmatrix}x&0\\0&y\end{bmatrix}},

valami valódi átlós mátrixhoz . $\left[{\begin{smallmatrix}x&0\\0&y\end{smallmatrix}}\right]$

A bal oldali egyenlőség mindkét oldalát megszorozva -vel, a következőt kapjuk: $\mathbf {B}$

{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d\end{bmatrix}}={\begin{bmatrix}a&b\\c&d\end{bmatrix }}{\begin{bmatrix}x&0\\0&y\end{bmátrix}}.

A fenti egyenlőség két egyenletrendszerre bontható :

{\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}={\begin{bmatrix}ax\ \cx\end{bmatrix}}\\{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}={\begin{bmatrix}by \\dy\end{bmatrix}}\end{cases}}.

Az x és y sajátértékek kivétele :

{\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=x{\begin{bmatrix}a \\c\end{bmatrix}}\\{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=y{\begin{bmatrix }} }b\\d\end{bmatrix}}\end{cases}}

Kapunk

{\overrightarrow {a}}={\begin{bmatrix}a\\c\end{bmatrix}},\quad {\overrightarrow {b}}={\begin{bmatrix}b\\d\end {bmátrix}},

amely két vektoregyenletet ad:

{\begin{cases}A{\overrightarrow {a}}=x{\overrightarrow {a}}\\A{\overrightarrow {b}}=y{\overrightarrow {b}}\end{cases} }

Ez utóbbi rendszer egyetlen vektoregyenlettel ábrázolható, amely két sajátérték megoldását tartalmazza:

\mathbf {A} \mathbf {u} =\lambda \mathbf {u}

ahol a két x és y sajátértéket jelöli , valamint a és a vektorokat . $\lambda$ $\mathbf {u}$ ${\overrightarrow {a}}$ ${\overrightarrow {b))$

Bal oldalra lépve és kiszedve kapunk $\lambda \mathbf {u}$ $\mathbf {u}$

(\mathbf {A} -\lambda \mathbf {E} )\mathbf {u} =\mathbf {0}

Mivel a mátrix nem degenerált, fontos, hogy a vektor ne legyen nulla. Ezért, $\mathbf {B}$ $\mathbf {u}$

\det(\mathbf {A} -\lambda \mathbf {E} )=0

Akkor

(1-\lambda )(3-\lambda )=0

megadja nekünk a mátrix sajátérték-megoldásait, mint vagy , és a mátrixbontásból kapott diagonális mátrix ekkor . $\mathbf {A}$ $\lambda=1$ $\lambda=3$ $\mathbf {A}$ $\left[{\begin{smallmatrix}1&0\\0&3\end{smallmatrix}}\right]$

Ha a megoldásokat visszahelyettesítjük a fenti egyenletrendszerbe, azt kapjuk

{\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=1{\begin{bmatrix}a \\c\end{bmatrix}}\\{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=3{\begin{bmátrix }} }b\\d\end{bmatrix}}\end{cases}}

Az egyenleteket megoldva azt kapjuk

a=-2c\quad {\text{u}}\quad b=0,\qquad c,d\in \mathbb {R} .

Ekkor a mátrix faktorizálásához szükséges mátrix az $\mathbf {B}$ $\mathbf {A}$

\mathbf {B} ={\begin{bmatrix}-2c&0\\c&d\end{bmatrix)),\qquad c,d\in \mathbb {R} ,

Azaz:

{\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}^{-1}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}-2c&0\ \c&d\end{bmatrix}}={\begin{bmatrix}1&0\\0&3\end{bmatrix}},\qquad c,d\in \mathbb {R}

Mátrix inverzió sajátvektor kiterjesztéssel

Legyen a mátrixnak spektrális dekompozíciója, és a mátrix egyik sajátértéke sem egyenlő nullával. Ebben az esetben a mátrix nem szinguláris , és az inverz mátrixát a képlet határozza meg $\mathbf {A}$ $\mathbf {A}$

{\displaystyle \mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1))

Ha a mátrix szimmetrikus mátrix , akkor a mátrix garantáltan ortogonális , azaz . És mivel a mátrix átlós , akkor az inverze könnyen kiszámítható: $\mathbf {A}$ ${\mathbf {Q}}$ ${\displaystyle \mathbf {Q} ^{-1}=\mathbf {Q} ^{\mathrm {T} ))$ $\lambda$

{\displaystyle \left[\Lambda ^{-1}\right]_{ii}={\frac {1}{\lambda _{i))))

Gyakorlati érték [4]

Ha egy valós adatokkal mért mátrixon sajátvektor-bontást alkalmazunk , akkor az inverz mátrix rosszabb lehet , ha az összes sajátértéket változatlan formában használjuk. A lényeg az, hogy amikor a sajátértékek viszonylag kicsivé válnak, az inverzeik hozzájárulása az inverz mátrixhoz nagy. Ezek a nullához közeli értékek vagy a mérőrendszer "zaj" túlzottan befolyásolják és zavarhatják az inverziós megoldást.

Két enyhítési lehetőséget javasoltak: a kis vagy nulla sajátértékek elvetését, és a legkisebb megbízható érték másolását kisebbekre.

Az első mérséklési lehetőség hasonló az eredeti mátrix ritkításához, amelyben eltávolítják a jelentéktelennek tekintett elemeket. Ha azonban a megoldási folyamatról kiderül, hogy közel van a zajszinthez, a visszaállítás eltávolíthatja a kívánt megoldást befolyásoló összetevőket.

A második mérséklési lehetőség a sajátértéket másolja, így a kisebb értékek kevésbé befolyásolják az inverzió eredményét, de mégis hozzájárulnak ahhoz, hogy a zajszinthez közeli megoldások is megtalálhatók legyenek.

Megbízható sajátérték található, ha feltételezzük, hogy a sajátértékek rendkívül közel állnak egymáshoz, és az alacsony érték jól reprezentálja a mérési zajt (amely a legtöbb rendszernél alacsonynak tekinthető).

Ha a sajátértékek nagyság szerint vannak rendezve, megbízható sajátértéket találhatunk a rendezett sajátértékek laplaciánusának minimalizálásával [5] :

\min \left|\nabla ^{2}\lambda _{\mathrm {s} }\right|

ahol a sajátértékek s - vel vannak jelölve a rendezés jelölésére (angolból rendezve). A minimum helye a legkisebb megbízható sajátérték. Mérőrendszerekben ennek a megbízható sajátértéknek a négyzetgyöke a rendszer többi összetevőjéhez viszonyított átlagos zaj.

Funkcionális kalkulus

Legyen a négyzetmátrixnak egy dekompozíciója . Ezután a mátrix természetes hatványra emelését egy egyszerű képlettel számítjuk ki: $\mathbf {A}$ ${\displaystyle \mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1))$

\mathbf {A} ^{n}=\left(\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\right)^{n}=\underbrace {\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\cdot \ldots \cdot \mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1))_{n }=\mathbf {Q} \mathbf {\Lambda } ^{n}\mathbf {Q} ^{-1},

itt a termékek törlésre kerülnek a köztes kifejezésben . A természetes hatványra emelés művelete lehetővé teszi különböző függvények definiálását mátrixok felett, amelyeket hatványsorok formájában fejezünk ki. Legyen a függvénynek egy hatványsoros kiterjesztése $\mathbf {Q} ^{-1}\mathbf {Q}$ $f(x)$

A mátrix sajátértékek szerinti bontása lehetővé teszi a hatványsor gyors kiszámítását a mátrixból. Legyen f ( x ) adott hatványsorral

f(x)=a_{0}+a_{1}x+a_{2}x^{2}+\cdots

A mátrix hatványának fenti képletével összhangban a mátrix hatványsorai a képlet segítségével számíthatók ki

{\displaystyle f\left(\mathbf {A} \right)=\mathbf {Q} f\left(\mathbf {\Lambda } \right)\mathbf {Q} ^{-1))

ahol a diagonális mátrix függvénye , amely nagyon könnyen kiszámítható: $f\left(\mathbf {\Lambda } \right)$ $\lambda$

\left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)

Ebben az esetben a mátrix átlón kívüli elemei nullával egyenlőek. Vagyis egy átlós mátrix is. Ennek eredményeként a függvény mátrixból történő kiszámítása lecsökkent egy függvény egyszerű kiszámítására az egyes sajátértékekből. $f(\Lambda )$ $f(\Lambda )$

Hasonló technika általánosabban működik a holomorf funkcionális kalkulusban is, a képlet felhasználásával

{\displaystyle \mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1))

negatív kitevőt tartalmazó mátrixokból hatványsorokat lehet számítani. Itt is azt használják, hogy . $\left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)$

Példák

Egy mátrix négyzetgyöke:

{\sqrt {\mathbf {A} }}=\mathbf {Q} {\sqrt {\mathbf {\Lambda } }}\mathbf {Q} ^{-1}.

Tegyük négyzet alakúra, és győződjünk meg a helyességéről:

\mathbf {Q} {\sqrt {\mathbf {\Lambda } }}\mathbf {Q} ^{-1}\mathbf {Q} {\sqrt {\mathbf {\Lambda } }}\mathbf { Q} ^{-1}=\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}=\mathbf {A} .

A mátrix kitevőjét hasonló módon határozzuk meg : $\exp {\mathbf {A} }$

\exp {\mathbf {A} }=\mathbf {Q} \exp {\mathbf {\Lambda } }\mathbf {Q} ^{-1}.

Speciális mátrixok bontása

Normál mátrixok

Egy összetett négyzetmátrix akkor és csak akkor normális (ami azt jelenti, hogy hol van a Hermitian konjugátum ) akkor és csak akkor, ha felbontható $\mathbf {A}$ ${\displaystyle \mathbf {A} ^{\ast }\mathbf {A} =\mathbf {AA} ^{\ast ))$ ${\displaystyle \mathbf {A} ^{\ast ))$

{\displaystyle \mathbf {A} =\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*))

ahol unitárius (ami azt jelenti, hogy ) , és egy átlós mátrix [6] . A mátrix oszlopai ortonormális bázist alkotnak , és a mátrix sajátvektorai a megfelelő sajátértékekkel . $\mathbf {U}$ ${\displaystyle \mathbf {U} ^{\ast }=\mathbf {U} ^{-1))$ $\mathbf {\Lambda } =diag(\lambda _{1},\dots ,\lambda _{n})$ ${\displaystyle \mathbf {u} _{1},\dots ,\mathbf {u} _{n))$ $\mathbf {U}$ $\mathbf {A}$ ${\displaystyle \lambda _{1},\dots ,\lambda _{n))$

Ha a mátrixok osztálya hermitikus mátrixokra korlátozódik ( ), akkor csak valós értékei vannak. Ha a mátrixok osztálya unitárius mátrixokra korlátozódik, akkor minden érték a komplex egységkörön, azaz . $\mathbf {A}$ ${\displaystyle \mathbf {A} =\mathbf {A} ^{\ast ))$ $\lambda$ $\mathbf {A}$ $\lambda$ $|\lambda _{i}|=1$

Valós szimmetrikus mátrixok

Bármely valós szimmetrikus mátrix esetében a sajátértékek valósak, és a sajátvektorok megválaszthatók valósnak és ortonormálisnak . Így egy valós szimmetrikus mátrix bontható fel $n\szer n$ $\mathbf {A}$

\mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{\mathsf {T))

ahol egy ortogonális mátrix, amelynek oszlopai a mátrix sajátvektorai , és egy átlós mátrix, amelynek az átlón lévő értékei megegyeznek a mátrix sajátértékeivel [7] . ${\mathbf {Q}}$ $\mathbf {A}$ $\lambda$ $\mathbf {A}$

Hasznos tények

Hasznos tények a sajátértékekről

A sajátértékek szorzata egyenlő a mátrix determinánsával $\mathbf {A}$ $\det \left(\mathbf {A} \right)=\prod \limits _{i=1}^{N_{\lambda }}{\lambda _{i}^{n_{i}}}$ Vegyük észre, hogy minden sajátértéket n i hatványra emelünk , ami egy algebrai multiplicitás.
A sajátértékek összege megegyezik a mátrix nyomvonalával $\mathbf {A}$ $\operatorname {tr} \left(\mathbf {A} \right)=\sum \limits _{i=1}^{N_{\lambda }}{{n_{i}}\lambda _{i }}$ Megjegyezzük, hogy minden sajátértéket megszorozunk n i -vel , ez egy algebrai multiplicitással.
Ha a mátrixnak vannak sajátértékei, és invertálható , akkor a mátrix sajátértékei egyszerűen . $\mathbf {A}$ $\lambda _{i}$ $\mathbf {A}$ ${\displaystyle \mathbf {A} ^{-1))$ ${\displaystyle \lambda _{i}^{-1))$
Ha a mátrixnak vannak sajátértékei , akkor a mátrix sajátértékei egyszerűen egyenlők bármely f holomorf függvényre . $\mathbf {A}$ $\lambda _{i}$ $f(\mathbf {A} )$ $f(\lambda _{i})$

Hasznos tények a sajátvektorokról

Ha a mátrix hermitikus és teljes rangú, akkor a sajátvektor bázis választható úgy, hogy kölcsönösen ortogonális legyen . A sajátértékek valódiak. $\mathbf {A}$
A mátrix sajátvektorai megegyeznek a mátrix sajátvektoraival . ${\displaystyle \mathbf {A} ^{-1))$ $\mathbf {A}$
A sajátvektorok egy állandó tényezőig vannak definiálva. Vagyis ha , akkor is egy sajátvektor bármely c ≠ 0 skalárhoz . Konkrétan, és (bármelyik esetén ) szintén sajátvektorok. $\mathbf {Av} =\lambda \mathbf {v}$ $c\mathbf {v}$ $-\mathbf {v}$ $e^{i\theta }\mathbf {v}$ $\theta$
Degenerált sajátértékek esetén (egy sajátérték többször is megjelenik) a sajátvektorok további forgási szabadságfokkal rendelkeznek, azaz az azonos sajátértékű sajátvektorok bármely lineáris (ortonormális) kombinációja maga is sajátvektor.

Hasznos tények a sajátvektor-bontásról

Egy mátrix akkor és csak akkor bontható fel sajátvektorok segítségével, ha a lineárisan független sajátvektorok száma megegyezik a sajátvektor dimenziójával: $\mathbf {A}$ ${\displaystyle N_{\mathbf {v} ))$ $N_{\mathbf {v} }=N\,$
Ha nincs több gyöke, azaz ha , akkor felbontható. $p(\lambda )$ $N_{\lambda }=N,$ $\mathbf {A}$
A "mátrix felbontható" állításból nem következik , hogy van inverze. $\mathbf {A}$ $\mathbf {A}$
A "mátrixnak van inverze" állításból nem következik , hogy sajátvektorok segítségével felbontható. Az ellenpélda a mátrix , amely egy invertálható hibamátrix [ . $\mathbf {A}$ $\mathbf {A}$ $\left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]$

Hasznos tények az inverz mátrixról

A mátrix akkor és csak akkor invertálható $\mathbf {A}$ $\lambda _{i}\neq 0\quad \forall \,i$
Ha és , az inverz mátrixot az egyenlőség adja $\lambda _{i}\neq 0$ $N_{\mathbf {v} }=N$ ${\displaystyle \mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1))$

Numerikus számítások

Sajátértékek numerikus számítása

Tegyük fel, hogy ki kell számítani egy adott mátrix sajátértékeit. Ha a mátrix méretei kicsik, a sajátértékek szimbolikusan kiszámíthatók a karakterisztikus polinom segítségével . Ez azonban gyakran nem lehetséges nagy mátrixok esetén, ilyenkor numerikus módszereket használnak .

A gyakorlatban a nagy mátrixok sajátértékeit nem a karakterisztikus polinom segítségével számítják ki. Egy polinom számítása önmagában idő- és időigényessé válik, a nagyfokú polinom pontos (szimbolikus) gyökét pedig nehéz kiszámítani és kifejezni – ez következik Ábel gyökökben lévő egyenletek megoldhatatlanságáról szóló tételéből, hogy a nagyfokú (5 és magasabb) polinomok gyökei általában nem lehetnek, az n- edik fokú gyökökből származó kifejezésekként jelennek meg. Emiatt a sajátvektorok és sajátértékek megtalálására szolgáló általános algoritmusok iteratív módon működnek .

Vannak iteratív numerikus algoritmusok a polinomok gyökeinek közelítésére, mint például a Newton-módszer , de általában nem praktikus karakterisztikus polinomot létrehozni, majd ezeket a módszereket alkalmazni. Ennek egyik oka az, hogy a karakterisztikus polinom együtthatóiban előforduló kis kerekítési hibák nagy hibákhoz vezethetnek a sajátértékekben és a sajátvektorokban – a gyökök az együtthatók rendkívül rosszul kondicionált függvényei [8] .

Egy egyszerű és pontos iteratív módszer a hatványmódszer – kiválasztunk egy véletlen vektort , és kiszámítjuk az egységvektorok sorozatát. $\mathbf{v}$

{\frac {\mathbf {A} \mathbf {v} }{\left\|\mathbf {A} \mathbf {v} \right\|}},{\frac {\mathbf {A} ^ {2}\mathbf {v} }{\left\|\mathbf {A} ^{2}\mathbf {v} \right\|}},{\frac {\mathbf {A} ^{3}\mathbf {v} }{\left\|\mathbf {A} ^{3}\mathbf {v} \right\|}},\ldots

Ez a sorozat szinte mindig a legnagyobb sajátértéknek megfelelő sajátvektorhoz konvergál, feltéve, hogy az ennek a sajátvektornak megfelelő vektor a sajátvektorok alapján nullától eltérő komponenst tartalmaz (és feltéve, hogy csak egy legnagyobb sajátérték van). Ez az egyszerű algoritmus hasznos néhány gyakorlati alkalmazásban. A Google például ennek segítségével számítja ki a dokumentumok link -rangsorát a keresőmotorjában [9] . Ezenkívül a hatványmódszer sok más összetett algoritmus kiindulópontja. Például, ha nem csak a sorozat utolsó vektorát tárolja, hanem a sorozat összes vektorának lineáris terjedelmét nézi , akkor jobb (gyorsabb konvergáló) közelítést kaphat a sajátvektorról, és ez az ötlet Arnoldi alapja. iteráció [8] . A szintén fontos QR-algoritmus szintén egy kissé módosított teljesítménymódszeren alapul [8] . $\mathbf{v}$

Sajátvektorok numerikus számítása

A sajátértékek kiszámítása után a sajátvektorok kiszámíthatók az egyenlet megoldásával

\left(\mathbf {A} -\lambda _{i}\mathbf {E} \right)\mathbf {v} _{i,j}=0

Gauss-eliminációval vagy bármely más mátrixegyenlet megoldási módszerrel .

A nagy mátrixok sajátértékeinek megtalálásának gyakorlati módszereiben azonban a sajátvektorokat általában más módon számítják ki a sajátérték-számítás melléktermékeként. A teljesítménymódszerben például a sajátvektort általában a sajátérték kiszámítása előtt számítják ki (amit általában a Rayleigh-relációnak megfelelően számítanak ki a sajátvektorra vonatkozóan) [8] . A Hermiti mátrix (vagy bármely normál mátrix ) QR-algoritmusában az ortonormális sajátvektorokat mátrixszorzatként kapjuk meg az algoritmus lépéseiből [8] . (Általánosabb mátrixok esetén a QR-algoritmus először egy Schur-felbontást hajt végre, amelyből a sajátvektorok visszahelyettesítéssel nyerhetők [10] ) Hermitiánus mátrixok esetén az oszd meg és győzz sajátérték-kereső algoritmus hatékonyabb, mint a QR-algoritmus, ha sajátvektorokra és sajátértékekre is szükség van [8] . ${\mathbf {Q}}$

További témák

Általánosított sajátterek

Emlékezzünk vissza, hogy egy sajátérték geometriai multiplicitása leírható a kapcsolódó sajáttér, a mátrix magjának dimenziójaként . Az algebrai multiplicitás dimenzióként is felfogható - ez a kapcsolódó általánosított sajáttér dimenziója (1. értelemben), amely a mátrix magja bármely kellően nagy k esetén . Vagyis ez az általánosított sajátvektorok tere (első értelemben), ahol általánosított sajátvektor bármely olyan vektor, amely végül 0 lesz, ha elegendő alkalommal alkalmazzuk. Bármely sajátvektor egy általánosított sajátvektor, ezért bármely sajáttér benne van a hozzá tartozó általánosított sajáttérben. Ez egyszerű bizonyítékot ad arra, hogy a geometriai multiplicitás soha nem haladja meg az algebrai sokszínűséget. $\lambda \mathbf {E} -\mathbf {A}$ ${\displaystyle (\lambda \mathbf {E} -\mathbf {A} )^{k))$ $\lambda \mathbf {E} -\mathbf {A}$

Ez a használat nem tévesztendő össze az alábbiakban ismertetett általánosított sajátérték-problémával .

Konjugált sajátvektor

A konjugált sajátvektor egy olyan vektor, amely lineáris transzformáció után bemegy (a skalárral való szorzásig) a konjugátumába. A skalárt ezután a lineáris transzformáció konjugált sajátértékének nevezzük. A konjugált sajátvektorok és sajátértékek lényegében ugyanazt az információt képviselik, mint a közönséges sajátvektorok és sajátértékek, de más koordinátarendszerek használatakor keletkeznek. A megfelelő egyenlőség lesz

\mathbf {A} \mathbf {v} =\lambda \mathbf {v} ^{*}.

Például a koherens elektromágneses szórás elméletében a lineáris transzformáció a szóró tárgy által végrehajtott cselekvést, a sajátvektorok pedig az elektromágneses hullám polarizációs állapotait reprezentálják. Az optikában a koordinátarendszert a hullám szempontjából határozzák meg, Forward Scattering Alignment néven ( eng. Forward Scattering Alignment , FSA), és közönséges sajátérték-egyenleteket generál, míg a radarban a koordinátarendszert a A radar oldalán visszaszórási illesztésként ( Eng. Back Scattering Alignment , BSA) ismert, és egyenleteket generál a konjugált sajátvektorokhoz. $\mathbf {A}$

A sajátértékek megtalálásának általános problémája

A sajátértékek megtalálásának általános problémája (második értelemben) egy olyan vektor megtalálásának problémája, amely kielégíti az egyenlőséget . $\mathbf{v}$

\mathbf {A} \mathbf {v} =\lambda \mathbf {B} \mathbf {v}

hol és vannak mátrixok. Ha ezt az egyenlőséget néhány esetén kielégíti , akkor a mátrixok általánosított sajátvektorának és (második értelemben), és a mátrixok általánosított sajátértékének nevezzük , és (második értelemben), az általánosított sajátvektornak megfelelően . A lehetséges értékeknek ki kell elégíteniük a következő egyenlőséget $\mathbf {A}$ $\mathbf {B}$ $\mathbf{v}$ $\lambda$ $\mathbf{v}$ $\mathbf {A}$ $\mathbf {B}$ $\lambda$ $\mathbf {A}$ $\mathbf {B}$ $\mathbf{v}$ $\lambda$

\det(\mathbf {A} -\lambda \mathbf {B} )=0.

Ha lehetséges olyan lineárisan független vektorokat találni , hogy bármely , esetén mátrixokat definiáljunk és a következőképpen $n$ ${\displaystyle \{\mathbf {v} _{1},\dots ,\mathbf {v} _{n))$ $i\in \{1,\dots ,n\}$ ${\displaystyle \mathbf {Av} _{i}=\lambda _{i}\mathbf {Bv} _{i))$ ${\mathbf {P}}$ $\mathbf {D}$

P={\begin{pmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{pmatrix}}\ ekvivalens {\begin{pmatrix}(\mathbf {v} _{1})_{1}&\cdots &(\mathbf {v} _{n})_{1}\\\vdots &&\vdots \\ (\mathbf {v} _{1})_{n}&\cdots &(\mathbf {v} _{n})_{n}\end{pmatrix}}

(D)_{ij}={\begin{cases}\lambda _{i},&{\text{if }}i=j\\0,&{\text{egyébként}}\end{ esetek}}

Ekkor a következő egyenlőség áll fenn

{\displaystyle \mathbf {A} =\mathbf {B} \mathbf {P} \mathbf {D} \mathbf {P} ^{-1))

Bizonyíték

\mathbf {A} \mathbf {P} =\mathbf {A} {\begin{pmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{ n}\\|&&|\end{pmatrix}}={\begin{pmatrix}|&&|\\A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\\ |&&|\end{pmatrix}}={\begin{pmatrix}|&&|\\\lambda _{1}B\mathbf {v} _{1}&\cdots &\lambda _{n}B\mathbf {v} _{n}\\|&&|\end{pmatrix}}={\begin{pmatrix}|&&|\\B\mathbf {v} _{1}&\cdots &B\mathbf {v} _ {n}\\|&&|\end{pmatrix}}\mathbf {D} =\mathbf {B} \mathbf {P} \mathbf {D}

És mivel reverzibilis, ezzel az inverzével megszorozzuk, és megkapjuk a kívánt eredményt. ${\mathbf {P}}$

A alakú mátrixok halmazát , ahol egy komplex szám, kötegnek nevezzük . A mátrixok kötege kifejezés egy mátrixpárra is utalhat [11] . $\mathbf {A} -\lambda \mathbf {B}$ $\lambda$ $\mathbf {A} ,\mathbf {B}$

Ha a mátrix invertálható, akkor az eredeti probléma átírható $\mathbf {B}$

\mathbf {B} ^{-1}\mathbf {A} \mathbf {v} =\lambda \mathbf {v}

ami a standard sajátérték probléma. A legtöbb esetben azonban nem kívánatos ennek az inverziónak a végrehajtása, hanem az általánosított sajátérték probléma megoldása. Ez különösen fontos, ha a és mátrixok hermitikusak , mivel ebben az esetben általában nem hermitikus, és a megoldás fontos tulajdonságai már nem jelennek meg. $\mathbf {A}$ $\mathbf {B}$ $\mathbf {B} ^{-1}\mathbf {A}$

Ha mind a és a mátrixok szimmetrikusak és hermitikusak, és pozitív definitív is , akkor a sajátértékek valósak, a és a különböző sajátértékekkel rendelkező sajátvektorok pedig -ortogonálisak ( ) [12] . Ebben az esetben a sajátvektorokat úgy választhatjuk meg, hogy a fent definiált mátrix megfeleljen a feltételeknek $\mathbf {A}$ $\mathbf {B}$ $\mathbf {B}$ $\lambda _{i}$ ${\displaystyle \mathbf {v} _{1))$ ${\displaystyle \mathbf {v} _{2))$ $\mathbf {B}$ $\mathbf {v} _{1}^{\ast }\mathbf {Bv} _{2}=0$ ${\mathbf {P}}$

\mathbf {P} ^{*}\mathbf {B} \mathbf {P} =\mathbf {E}

vagy ,

\mathbf {P} \mathbf {P} ^{*}\mathbf {B} =\mathbf {E}

és van egy alapja az általánosított sajátvektoroknak (ez nem hibamátrix ) [11] . Ezt az esetet néha Hermitian-definiált kévének nevezik [11] .

Lásd még

Jegyzetek

↑ Golub, Van Loan, 1996 , p. 310.
↑ Kreyszig, 1972 , p. 273.
↑ Nering, 1970 , p. 270.
↑ Hayde, Twede, 2002 , p. 355.
↑ Hayde, Twede, 2002 , p. 299.
↑ Horn és Johnson, 1985 , p. 133 2.5.3. tétel.
↑ Horn és Johnson, 1985 , p. 136 2.5.3. tétel Következmény 2.5.11.
↑ 1 2 3 4 5 6 Trefethen, Bau, 1997 .
↑ Ipsen, Wills, 2005 .
↑ Quarteroni, Sacco, Saleri, 2000 , p. tizenöt.
↑ 1 2 3 Bai, Demmel, 2000 .
↑ Parlett, 1998 , p. 345.

Irodalom

Hayde AF, Twede DR Megfigyelések a sajátértékek, a műszerzaj és a detektálási teljesítmény közötti összefüggésről // Képalkotó spektrometria VIII. / Sylvia S. Shen. - 2002. - T. 4816 . - doi : 10.1117/12.453777 . - .
Twede DR, Hayden AF Kovarianciamátrix inverzió kiterjesztési módszerének finomítása és általánosítása regularizációval // Imaging Spectrometry IX .. - 2004. - T. 5159 . - doi : 10.1117/12.506993 . - .
Lloyd N. Trefethen, David Bau. Numerikus lineáris algebra. - "SIAM, 1997. - ISBN 978-0-89871-361-9 .
Alfio Quarteroni, Riccardo Sacco, Fausto Saleri. szakasz 5.8.2 // Numerikus matematika . - "Springer, 2000. - ISBN 978-0-387-98959-4 .
Beresford N. Parlett. A szimmetrikus sajátérték probléma . - Reprint.. - Philadelphia: "Society for Industrial and Applied Mathematics, 1998. - ISBN 978-0-89871-402-9 . - doi : 10,1137/1,9781611971163 .
- Fordította: B. Parlett. Szimmetrikus sajátérték probléma. - Moszkva: Mir, 1983.
Ilse Ipsen, Rebecca M. Wills. A Google PageRank elemzése és számítása // 7th IMACS International Symposium on Iterative Methods in Scientific Computing, Fields Institute, Toronto, Kanada, 2005. május 5–8 . – 2005.
Általánosított hermitiánus sajátérték-problémák // Sablonok algebrai sajátérték-problémák megoldásához: Gyakorlati útmutató / Z. Bai, J. Demmel, J. Dongarra, A. Ruhe, H. Van Der Vorst. - Philadelphia: SIAM, 2000. - ISBN 978-0-89871-471-5 .
Joel N. Franklin. Mátrix elmélet . Dover Publications. — ISBN 978-0-486-41179-8 .
Gene H. Golub, Charles F. Van Loan. Mátrix számítások. — 3. - Baltimore: Johns Hopkins University Press , 1996. - ISBN 978-0-8018-5414-9 .
- Fordította : J. Golub, C. Van Lone. Mátrix számítások. - Moszkva: Mir, 1999. - ISBN 5-03-002406-9 .
Roger A. Horn, Charles R. Johnson. mátrixelemzés. - Cambridge University Press, 1985. - ISBN 978-0-521-38632-6 .
- Fordítás Horn R., Johnson C. Mátrixelemzés. - "Mir", 1989. - ISBN 978-5-458-26504-1 (YOYO Media).

Roger A. Horn, Charles R. Johnson. A mátrixelemzés témái . - Cambridge University Press, 1991. - ISBN 978-0-521-46713-1 .
Erwin Kreyszig. Haladó mérnöki matematika . — 3. - New York: Wiley , 1972. - ISBN 978-0-471-50728-4 .
Evar D. Nering. Lineáris algebra és mátrixelmélet. — 2. – New York: Wiley , 1970.
Strang G. Bevezetés a lineáris algebrába. — 3. - Wellesley-Cambridge Press, 1998. - ISBN 978-0-9614088-5-5 .

Linkek

A Spectral Decomposition interaktív programja és oktatóanyaga .

Vektorok és mátrixok

Vektorok

Alapfogalmak	Vektor a geometriában Alap Ortogonális alap Vektor koordináták Kollinearitás Ortogonalitás Lineáris függőség Oszlopköz
A vektorok fajtái	Egységvektor Axiális vektor izotróp vektor Normál Kollinearitás Nulla vektor Sugár vektor Sajátvektor
Műveletek vektorokon	Skaláris szorzat vektor termék vegyes termék Pszeudoszkaláris termék Kettős kereszttermék
Tértípusok	vektor tér affin tér Euklideszi tér Pszeudoeuklideszi tér Normált tér Minkowski tér

mátrixok

Alapfogalmak	Mátrixszorzás Transzponált mátrix Hermitikus konjugált mátrix Szimmetrikus mátrix inverz mátrix Sajátérték Mátrix karakterisztikus polinomja
Speciális mátrixok	Identitásmátrix Nulla mátrix Átlós mátrix lambda mátrix
Mátrix dekompozíciók	LU bomlás Cholesky-bomlás QR-bontás LUP bomlás szinguláris érték felbontás Mátrix spektrális lebontása

Egyéb