Diagonalisoitava matriisi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 22. marraskuuta 2021 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Lineaarisessa algebrassa neliömatriisin A sanotaan olevan diagonalisoitavissa , jos se on samanlainen kuin diagonaalimatriisi , eli jos on olemassa ei- singulaarinen matriisi P siten, että P −1 AP on diagonaalimatriisi. Jos V on äärellinen vektoriavaruus , niin lineaarisen kuvauksen T : V → V sanotaan olevan diagonalisoitavissa , jos V :ssä on järjestetty kanta siten , että T esitetään diagonaalimatriisina. Diagonalisointi on prosessi, jossa etsitään vastaava diagonaalimatriisi diagonalisoitavalle matriisille tai lineaariselle matriisille. [1] Neliömatriisia, jota ei voida diagonalisoida, kutsutaan vialliseksi .

Diagonalisoitavat matriisit ja mappaukset ovat mielenkiintoisia, koska diagonaalimatriiseilla on helppo työskennellä: ominaisarvot ja vektorit tunnetaan, eksponentiointi tehdään nostamalla diagonaaliset alkiot potenssiin ja determinantti on diagonaalielementtien tulo. Geometrialta katsottuna diagonalisoitava matriisi on epätasainen skaalaus: joka suunnassa venytys tapahtuu yleensä eri kertoimella diagonaalin numerosta riippuen.

Ominaisuudet

Perusfakta diagonalisoitavista kartoituksista ja matriiseista ilmaistaan seuraavissa väitteissä.

Kentän F n × n matriisi A on diagonalisoitavissa silloin ja vain , jos ominaisaliavaruuksien dimensioiden summa on yhtä suuri kuin n , mikä on totta, jos ja vain jos on olemassa kanta Fn , joka koostuu ominaisvektoreista A. Jos tällainen kanta löytyy, voidaan luoda matriisi P , jossa sarakkeet ovat kantavektoreita ja P −1 AP on diagonaalimatriisi. Tämän matriisin diagonaalin arvot ovat A :n ominaisarvoja .
Lineaarinen kuvaus T : V → V on diagonalisoitavissa silloin ja vain, jos sen ominaisavaruuksien dimensioiden summa on yhtä suuri kuin dim( V ), mikä on totta silloin ja vain, jos on olemassa kanta V , joka koostuu T :n ominaisvektoreista . Tämän perusteella T esitetään diagonaalimatriisina. Tällaisen matriisin diagonaaliset elementit ovat yhtä suuria kuin T :n ominaisarvot .

Matriisi tai lineaarinen kuvaus on diagonalisoitavissa kentän F yli silloin ja vain, jos minimipolynomi on kentän F lineaaristen tekijöiden tulo. Toisin sanoen matriisi on diagonalisoitavissa, jos ja vain jos kaikki minimaalisen polynomin jakajat ovat lineaarisia.

Seuraava ehto (riittävä, mutta ei välttämätön) on usein hyödyllinen.

n × n matriisi A on diagonalisoitavissa kentän F yli, jos sillä on n erillistä ominaisarvoa F :ssä , eli jos sen ominaispolynomilla on n erillistä juurta F :ssä ; päinvastoin ei ehkä ole totta. Harkitse matriisia

{\begin{bmatrix}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatrix)),

joilla on ominaisarvot 1, 2, 2 (kaikki eivät ole erillisiä) ja jotka voidaan pelkistää diagonaalimuotoon (matriisi on samanlainen kuin A )

{\begin{bmatrix}1&0&0\\0&2&0\\0&0&2\end{bmatrix));

siirtymämatriisi toiseen kantaan P :

{\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.

Siten käänteinen ei välttämättä päde, jos A :n ominaisaliavaruuden ulottuvuus on suurempi kuin 1. Tässä esimerkissä ominaisarvon 2 ominaisaliavaruuden A :n ominaisaliavaruus on ulottuvuus 2.

Lineaarinen kuvaus T : V → V n = dim( V ) on diagonalisoitavissa, jos sillä on n erillistä ominaisarvoa, eli jos ominaispolynomilla on n erillistä juurta F :ssä .

Olkoon A matriisi F :n päällä . Jos A on diagonalisoitavissa, mikä tahansa A:n potenssi on diagonalisoitavissa. Jos A on käännettävä, F on algebrallisesti suljettu, A n on diagonalisoitavissa jollekin n :lle , joka ei ole ominaisuuden F kerrannainen , niin A on diagonalisoitavissa.

C :n yläpuolella melkein mikä tahansa matriisi on diagonalisoitavissa. Tarkemmin sanottuna joukolla n × n kompleksista matriisia , jotka eivät ole diagonalisoitavissa C :n yli, kun sitä pidetään C : n n × n osajoukona , Lebesguen mitta on nolla . Voidaan myös sanoa, että diagonalisoitavat matriisit muodostavat tiheän osajoukon Zariski-topologian puitteissa : tämän osajoukon komplementti on joukossa, jossa karakteristisen polynomin diskriminantti katoaa, eli hyperpinnalla. Näin ei ole R :n kohdalla .

Jordan-Chevalley-hajotelma edustaa operaattoria diagonalisoitavien ja nilpotenttien osien summana . Siksi matriisi on diagonalisoitavissa silloin ja vain, jos nilpotentti osa on nolla. Toisin sanoen matriisi on diagonalisoitava, jos jokaisessa Jordan-muodon lohkossa ei ole nilpotenttia osaa.

Diagonalisointi

Jos matriisi A voidaan diagonalisoida, eli

P^{-1}AP={\begin{pmatrix}\lambda _{1}\\&\lambda _{2}\\&&\ddots \\&&&\lambda _{n}\end{pmatrix }},

sitten

AP=P{\begin{pmatrix}\lambda _{1}\\&\lambda _{2}\\&&\ddots \\&&&\lambda _{n}\end{pmatrix)).

Kirjoitamme P lohkomatriisina sarakevektoreilla _ ${\vec {\alpha }}_{i}$

P={\begin{pmatrix}{\vec {\alpha }}_{1}&{\vec {\alpha }}_{2}&\cdots &{\vec {\alpha }}_{ n}\end{pmatrix}},

niin yllä oleva yhtälö voidaan kirjoittaa uudelleen muotoon

A{\vec {\alpha }}_{i}=\lambda _{i}{\vec {\alpha }}_{i}\qquad (i=1,2,\cdots ,n).

P :n sarakevektorit ovat A : n oikeat ominaisvektorit , vastaavat diagonaalielementit ovat ominaisarvot. P :n käänteisyys viittaa myös siihen, että ominaisvektorit ovat lineaarisesti riippumattomia ja muodostavat kantan F n :ssä . Tämä on välttämätön ja riittävä ehto diagonalisoitavuudelle. Rivivektorit P −1 ovat A :n vasemmanpuoleisia ominaisvektoreita .

Jos A on hermiittinen matriisi , niin A :n ominaisvektorit voidaan valita siten, että ne muodostavat ortogonaalisen kannan C n :ssä . Näissä olosuhteissa P on unitaarinen matriisi ja P -1 on yhtä suuri kuin P : n hermiittinen konjugaatti .

Käytännössä matriisien diagonalisointi suoritetaan tietokoneella. On olemassa useita algoritmeja , jotka mahdollistavat tämän prosessin suorittamisen.

Matriisijoukon diagonalisointi

Matriisijoukon sanotaan olevan yhdessä diagonalisoitavissa, jos on olemassa ainutlaatuinen käännettävä matriisi P siten, että P −1 AP on diagonaalimatriisi jokaiselle joukon A :lle. Seuraava lause kuvaa yhteisesti diagonalisoitavia matriiseja: matriisijoukko on joukko diagonalisoitavia työmatkamatriiseja silloin ja vain, jos se on yhdessä diagonalisoitavissa. [2]

Kaikkien n × n matriisien joukko, jotka voidaan diagonalisoida C : n yli, kun n > 1, ei ole yhdessä diagonalisoitavissa. Esimerkiksi matriisit

{\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{and}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}

ovat diagonalisoitavissa, mutta eivät yhdessä, koska ne eivät liiku.

Joukko koostuu kommutoitavista normaalimatriiseista silloin ja vain, jos se on diagonalisoitu yhdessä unitaarimatriisilla, eli on olemassa unitaarinen matriisi U siten, että U*AU on diagonaalinen mille tahansa joukon matriisille A.

Esimerkkejä

Diagonalisoitavat matriisit

Involuutioita voidaan diagonalisoida reaalilukujen yli (ja minkä tahansa kentän yli, jonka ominaiskäyrä ei ole yhtä suuri kuin 2), ja ±1 sijaitsevat diagonaalissa.
Äärillisen järjestyksen endomorfismit ovat diagonalisoitavissa C :n (tai muun algebrallisesti suljetun kentän yli, eikä kentän ominaisuus ole endomorfismin järjestyksen jakaja), yksikön juuret sijaitsevat diagonaalissa . Minimipolynomi on erotettavissa , koska ykseyden juuret ovat erilliset.
Projektorit ovat diagonalisoitavia, ja diagonaalissa on 1 ja 0.
Todelliset symmetriset matriisit ovat diagonalisoitavissa ortogonaalisilla matriiseilla. Tarkastellaan reaalimatriisia A , Q T AQ on diagonaalinen jollekin ortogonaaliselle matriisille Q . Yleisemmin matriisit ovat diagonalisoitavissa unitaarisilla matriiseilla, jos ja vain jos ne ovat normaaleja. Reaalisen symmetrisen matriisin A = A T tapauksessa AA T = A T A . Esimerkkejä normaalimatriiseista ovat todelliset symmetriset (tai vinosymmetriset ) matriisit ja hermiittiset matriisit .

Ei-diagonalisoitavat matriisit

Yleensä rotaatiomatriisi ei ole diagonalisoitavissa reaalilukujen yli, mutta kaikki rotaatiomatriisit ovat diagonalisoitavissa kompleksilukukentän yli. Vaikka matriisi ei ole diagonalisoitavissa, on mahdollista pienentää se "parhaaseen mahdolliseen muotoon" ja luoda matriisi, jolla on samat ominaisuudet ja joka sisältää ominaisarvot päälävistäjällä ja ykkösiä tai nollia yllä olevassa diagonaalissa, eli Jordanin normaali muoto .

Jotkut matriisit eivät ole diagonalisoitavissa minkään kentän yli, niiden joukossa voidaan määrittää nollasta poikkeavia nilpotentteja matriiseja . Tämä tapahtuu, jos ominaisarvon algebrallinen ja geometrinen monikertaisuus eivät täsmää. Harkitse

C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.

Tätä matriisia ei voida diagonalisoida: ei ole olemassa matriisia U , jolle U −1 CU on diagonaalimatriisi. C :llä on yksi algebrallisen moninkertaisuuden 2 ja geometrisen monikertaisuuden 1 ominaisarvo (nolla).

Joitakin reaalimatriiseja ei voida diagonalisoida reaalilukujen yli. Harkitse matriisia

B={\begin{bmatrix}0&1\\-1&0\end{bmatrix}}.

Matriisilla B ei ole todellisia ominaisarvoja, joten ei ole olemassa todellista matriisia Q , jolle Q −1 BQ on diagonaali. Mutta kompleksilukujen kentän yli voimme diagonalisoida B . Jos ajatellaan

Q={\begin{bmatrix}1&{\textrm {i}}\\{\textrm {i}}&1\end{bmatrix}}),

silloin Q −1 BQ on diagonaali.

Huomaa, että yllä olevat esimerkit osoittavat, että diagonalisoitavien matriisien summa ei aina ole diagonalisoitavissa.

Kuinka diagonalisoida matriisi

Harkitse matriisia

A={\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{bmatrix}}.

Tällä matriisilla on ominaisarvot

\lambda _{1}=3,\quad \lambda _{2}=2,\quad \lambda _{3}=1.

A on 3x3 matriisi, jossa on 3 erillistä ominaisarvoa; joten se on diagonalisoitavissa. Huomaa, että jos n × n matriisilla on täsmälleen n erillistä ominaisarvoa, se on diagonalisoitavissa.

Ominaisarvot näkyvät diagonalisoidussa muodossa A , joten ominaisarvoja löydettäessä matriisi A diagonalisoidaan. Omavektoreita voidaan käyttää diagonalisoimaan A.

A :n ominaisvektorit ovat

v_{1}={\begin{bmatrix}-1\\-1\\2\end{bmatrix)),\quad v_{2}={\begin{bmatrix}0\\0\\1 \end{bmatrix}},\quad v_{3}={\begin{bmatrix}-1\\0\\2\end{bmatrix}}.

Sen voi tarkistaa $Av_{k}=\lambda _{k}v_{k}.$

Olkoon P matriisi, jossa annetut ominaisvektorit ovat sarakkeita.

P={\begin{bmatrix}-1&0&-1\\-1&0&0\\2&1&2\end{bmatrix}}.

Huomaa, että P :n sarakkeilla ei ole erillistä järjestystä ; Ominaisuusvektorien järjestyksen muuttaminen P :ssä muuttaa vain ominaisarvojen järjestystä diagonaalimuodossa A . [3]

Matriisi P diagonalisoi A :n , mikä on helppo nähdä:

P^{-1}AP={\begin{bmatrix}-1&1&0\\2&0&1\\-1&1&0\end{bmatrix}}{\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{ bmatrix}}{\begin{bmatrix}-1&0&-1\\0&0&-1\\2&1&2\end{bmatrix}}={\begin{bmatrix}3&0&0\\0&2&0\\0&0&1\end{bmatrix}}.

Tämä seuraa siitä tosiasiasta , että millä tahansa vakioperusteella $e_{1},e_{2},e_{3}$

P^{-1}APe_{k}=P^{-1}Av_{k}=P^{-1}\lambda _{k}v_{k}=\lambda _{k}e_{ k},

jossa olemme hyödyntäneet mitä on k:s sarake , joten . Huomaa, että ominaisarvot ilmestyivät diagonaalimatriisiin. $Pe_{k}=v_{k}$ $P$ ${\displaystyle P^{-1}v_{k}=e_{k))$ $\lambda_k$

Sovellus

Diagonalisoinnilla voidaan laskea tehokkaasti matriisin A tehot, jos matriisi on diagonalisoitavissa. Otetaan se

P^{-1}AP=D\Rightarrow PP^{-1}APP^{-1}=PDP^{-1}\Rightarrow A=PDP^{-1},

missä on diagonaalimatriisi. Sitten matriisien tulon assosiatiivisuuden perusteella $D$

{\begin{aligned}A^{k}&=(PDP^{-1})^{k}=(PDP^{-1})\cdot (PDP^{-1})\cdots ( PDP^{-1})\\&=PD(P^{-1}P)D(P^{-1}P)\cdots (P^{-1}P)DP^{-1}\\ &=PD^{k}P^{-1}\end{aligned}}.

Viimeinen tulo on helppo laskea, koska se sisältää diagonaalimatriisin potenssit. Tämä lähestymistapa voidaan yleistää matriisieksponenttiin ja muihin matriisifunktioihin , koska ne voidaan esittää potenssisarjoina.

Sovelluksen erikoistapaus

Harkitse seuraavaa matriisia:

M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.

M :n eri potenssien laskeminen johtaa mielenkiintoiseen malliin:

M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix)),\quad M^{ 3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix)),\quad M^{4}={\begin {bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots

Tämä ilmiö voidaan selittää käyttämällä M :n diagonalisointia . Tarvitsemme kantan R 2 , joka koostuu ominaisvektoreista M . Yksi perusteista on

\mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix} 1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2},

missä e i on Rn : n standardikanta . Perusteen käänteinen muutos saadaan lausekkeilla

\mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .

Laskelmat sen osoittavat

M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .

Siksi a ja b ovat ominaisarvoja, jotka vastaavat u :ta ja v :tä . Matriisitulon lineaarisuuden perusteella saamme

M^{n}\mathbf {u} =a^{n}\,\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\,\mathbf { v} .

Palatessamme standardipohjaan, saamme sen

M^{n}\mathbf {e} _{1}=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1},

M^{n}\mathbf {e} _{2}=M^{n}(\mathbf {v} -\mathbf {u} )=b^{n}\mathbf {v} -a^ {n}\mathbf {u} =(b^{n}-a^{n})\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.

Edellä kuvattujen relaatioiden matriisimuodolla on muoto

M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix)),

mikä selittää edellä mainitun kaavan.

Sovellukset kvanttimekaniikassa

Kvanttimekaniikassa ja kvanttikemiassa matriisidiagonalisointi on yksi eniten käytetyistä menetelmistä laskelmissa . Pääsyynä on se, että ajasta riippumaton Schrödinger -yhtälö on ominaisarvoyhtälö ja lähes kaikissa fysikaalisissa sovelluksissa äärettömän ulottuvuuden ( Hilbert ) avaruudessa. Likimääräisissä lähestymistavoissa Hilbert-avaruus korvataan äärellisulotteisella avaruudella, jonka jälkeen Schrödingerin yhtälö voidaan muotoilla uudelleen ongelmaksi löytää todellisen symmetrisen (tai kompleksisen hermiittisen) matriisin ominaisarvot. Tämä lähestymistapa perustuu variaatioperiaatteeseen .

Muistiinpanot

↑ Horn & Johnson 1985
↑ Horn & Johnson 1985, s. 51–53
↑ Anton, H.; Rorres, C. Elementary Lineaar Algebra (Applications Version) (englanniksi) . – 8. - John Wiley & Sons , 2000. - ISBN 978-0-471-17052-5 .

Horn, Roger A.; Johnson, Charles R. Matriisianalyysi (määrittämätön) . - Cambridge University Press , 1985. - ISBN 978-0-521-38632-6 .