A lineáris algebrában egy A négyzetmátrixot diagonalizálhatónak mondunk , ha hasonló egy átlós mátrixhoz , vagyis ha létezik olyan P nem szinguláris mátrix , amelyre P −1 AP diagonális mátrix. Ha V egy véges dimenziós vektortér , akkor a T : V → V lineáris leképezést diagonalizálhatónak mondjuk , ha V -ben létezik olyan rendezett bázis , amelyre T átlós mátrixként ábrázolja. A diagonalizálás a megfelelő átlós mátrix megtalálásának folyamata egy diagonalizálható mátrixhoz vagy lineáris leképezéshez. [1] A nem diagonalizálható négyzetmátrixot hibásnak nevezzük .
A diagonalizálható mátrixok és leképezések azért érdekesek, mert az átlós mátrixokkal könnyű dolgozni: a sajátértékek és a vektorok ismertek, a hatványozás az átlós elemek hatványra emelésével történik, a determináns pedig az átlós elemek szorzata. Geometriai szempontból az átlósítható mátrix egy nem egyenletes skálázás: minden irányban a nyújtás általában eltérő együtthatóval történik az átlón lévő számtól függően.
A diagonalizálható leképezésekkel és mátrixokkal kapcsolatos alapvető tényt a következő állítások fejezik ki.
Egy mátrix vagy lineáris leképezés akkor és csak akkor diagonalizálható egy F mező felett , ha a minimális polinom az F mező feletti lineáris tényezők szorzata . Más szóval, egy mátrix akkor és csak akkor diagonalizálható, ha a minimális polinom minden osztója lineáris.
A következő feltétel (elegendő, de nem szükséges) gyakran hasznos.
Legyen A mátrix F felett . Ha A diagonalizálható, akkor A bármely hatványa átlózható. Ha A invertálható, F algebrailag zárt, A n átlózható valamilyen n -re, amely nem többszöröse az F karakterisztikának , akkor A diagonalizálható.
C felett szinte minden mátrix átlósítható. Pontosabban, az n × n komplex mátrixok halmaza , amelyek nem diagonalizálhatók C felett, ha C n × n részhalmazának tekintjük , Lebesgue-mértéke nulla . Azt is mondhatjuk, hogy a diagonalizálható mátrixok egy sűrű részhalmazt alkotnak a Zariski topológia keretein belül : ennek a részhalmaznak a kiegészítése abban a halmazban van, amelyben a karakterisztikus polinom diszkriminánsa eltűnik, vagyis a hiperfelületen. R esetében nem ez a helyzet .
A Jordan-Chevalley dekompozíció az operátort a diagonalizálható és a nilpotens részek összegeként ábrázolja. Ezért egy mátrix akkor és csak akkor diagonalizálható, ha a nilpotens rész nulla. Más szóval, egy mátrix átlósítható, ha a Jordan-forma minden blokkjában nincs nilpotens rész.
Ha az A mátrix diagonalizálható, azaz
akkor
P -t blokkmátrixként írjuk fel oszlopvektorokkal
akkor a fenti egyenlet átírható így
A P oszlopvektorai A jobb oldali sajátvektorai , a megfelelő átlós elemek pedig a sajátértékek. P invertálhatósága azt is jelenti, hogy a sajátvektorok lineárisan függetlenek és bázist képeznek F n -ben . Ez szükséges és elégséges feltétele a diagonalizálhatóságnak. A P −1 sorvektorok A bal oldali sajátvektorai .
Ha A egy hermitikus mátrix , akkor meg lehet választani A sajátvektorait úgy , hogy azok ortogonális bázist képezzenek C n -ben . Ilyen feltételek mellett P egységes mátrix lesz , és P -1 egyenlő P hermitikus konjugátumával .
A gyakorlatban a mátrixok diagonalizálása számítógépen történik. Számos algoritmus létezik, amelyek lehetővé teszik ennek a folyamatnak a végrehajtását.
A mátrixok halmazát együttesen diagonalizálhatónak mondjuk, ha létezik olyan egyedi P invertálható mátrix , amely szerint P −1 AP egy átlós mátrix a halmaz minden A -jához. A következő tétel az együttesen átlózható mátrixokat jellemzi: a mátrixhalmaz akkor és csak akkor átlózható ingázási mátrixok halmaza, ha együttesen átlózható. [2]
Az összes n × n mátrix halmaza , amely C felett diagonalizálható n > 1 esetén, együttesen nem diagonalizálható. Például mátrixok
átlósíthatók, de nem együttesen, mivel nem ingáznak.
Egy halmaz akkor és csak akkor áll normálmátrixok ingázóból , ha egy unitárius mátrix együttesen diagonalizálja, azaz létezik olyan U unitárius mátrix , hogy U*AU átlós a halmaz bármely A mátrixára.
Általánosságban elmondható, hogy a forgatási mátrix nem diagonalizálható a valós számok felett, de az összes forgatási mátrix átlózható a komplex számok területén. Még akkor is, ha a mátrix nem diagonalizálható, lehetséges a "lehető legjobb formára" redukálni, és ugyanolyan tulajdonságokkal rendelkező mátrixot létrehozni, amely a főátlón sajátértékeket, a fenti átlón pedig egyeseket vagy nullákat tartalmaz. azaz Jordan normál formában .
Egyes mátrixok nem diagonalizálhatók egyik mezőre sem, köztük nem nulla nilpotens mátrixok is megadhatók . Ez akkor történik, ha a sajátérték algebrai és geometriai multiplicitása nem egyezik. Fontolgat
Ez a mátrix nem diagonalizálható: nincs olyan U mátrix , amelynek U −1 CU diagonális mátrixa lenne. C -nek egy sajátértéke (nulla) van a 2. algebrai multiplicitással és 1. geometriai multiplicitással.
Néhány valós mátrix nem diagonalizálható valós számok fölé. Tekintsük a mátrixot
A B mátrixnak nincsenek valós sajátértékei, így nincs olyan valós Q mátrix , amelyre Q −1 BQ átlós. De a komplex számok mezején átlózhatjuk B -t . Ha figyelembe vesszük
akkor Q −1 BQ átlós.
Vegye figyelembe, hogy a fenti példák azt mutatják, hogy az átlózható mátrixok összege nem mindig diagonalizálható.
Tekintsük a mátrixot
Ennek a mátrixnak sajátértékei vannak
A egy 3x3-as mátrix 3 különálló sajátértékkel; ezért átlósítható. Figyeljük meg, hogy ha egy n × n mátrixnak pontosan n különálló sajátértéke van, akkor átlósítható.
A sajátértékek A diagonalizált formában jelennek meg , tehát a sajátértékek megtalálásakor az A mátrix átlósodik . Sajátvektorok használhatók A diagonalizálására .
Az A sajátvektorai
Ez ellenőrizhető
Legyen P olyan mátrix, amelyben az adott sajátvektorok az oszlopok.
Vegyük észre, hogy a P oszlopai között nincs megkülönböztetett sorrend ; a P sajátvektorok sorrendjének megváltoztatása csak az A átlós alakban változtatja meg a sajátértékek sorrendjét . [3]
A P mátrix átlósítja A -t, ami könnyen belátható:
Ez abból a tényből következik, hogy bármilyen szabványos alapon ,
ahol kihasználtuk, hogy mi a k-edik oszlopa , tehát . Vegye figyelembe, hogy a sajátértékek az átlós mátrixban jelentek meg.
A diagonalizálás segítségével hatékonyan számítható ki az A mátrix hatványa, ha a mátrix diagonalizálható. Vegyük ezt
ahol egy átlós mátrix. Majd a mátrixok szorzatának asszociativitásával
Az utolsó szorzat könnyen kiszámítható, mert tartalmazza az átlós mátrix hatványait. Ez a megközelítés általánosítható a mátrix kitevőjére és más mátrixfüggvényekre , mivel hatványsorként ábrázolhatók.
Tekintsük a következő mátrixot:
Az M különböző hatványainak kiszámítása egy érdekes mintához vezet:
Ez a jelenség M diagonalizálásával magyarázható . Szükségünk van egy R 2 bázisra, amely M sajátvektorokból áll . Az egyik alap az
ahol e i R n standard bázisát jelöli . A bázis fordított változását a kifejezések adják meg
A számítások azt mutatják
Ezért a és b sajátértékek, amelyek megfelelnek u -nak és v -nek . A mátrixszorzat linearitásával megkapjuk
Visszatérve a standard alapra, azt kapjuk
A fent leírt relációk mátrix alakja a következővel rendelkezik
ami megmagyarázza az előbb említett mintát.
A kvantummechanikában és a kvantumkémiában a mátrixdiagonalizáció az egyik leggyakrabban használt eljárás a számításokban. Ennek fő oka az, hogy az időtől független Schrödinger -egyenlet sajátérték-egyenlet, és szinte minden fizikai alkalmazásban végtelen dimenziós ( Hilbert ) térben. Közelítő megközelítésekben a Hilbert-teret egy véges dimenziós tér váltja fel, amely után a Schrödinger-egyenlet újrafogalmazható egy valós szimmetrikus (vagy komplex hermitiánus) mátrix sajátértékeinek megtalálásának problémájaként. Ez a megközelítés a variációs elven alapul .