Lineaarisessa algebrassa neliömatriisin A sanotaan olevan diagonalisoitavissa , jos se on samanlainen kuin diagonaalimatriisi , eli jos on olemassa ei- singulaarinen matriisi P siten, että P −1 AP on diagonaalimatriisi. Jos V on äärellinen vektoriavaruus , niin lineaarisen kuvauksen T : V → V sanotaan olevan diagonalisoitavissa , jos V :ssä on järjestetty kanta siten , että T esitetään diagonaalimatriisina. Diagonalisointi on prosessi, jossa etsitään vastaava diagonaalimatriisi diagonalisoitavalle matriisille tai lineaariselle matriisille. [1] Neliömatriisia, jota ei voida diagonalisoida, kutsutaan vialliseksi .
Diagonalisoitavat matriisit ja mappaukset ovat mielenkiintoisia, koska diagonaalimatriiseilla on helppo työskennellä: ominaisarvot ja vektorit tunnetaan, eksponentiointi tehdään nostamalla diagonaaliset alkiot potenssiin ja determinantti on diagonaalielementtien tulo. Geometrialta katsottuna diagonalisoitava matriisi on epätasainen skaalaus: joka suunnassa venytys tapahtuu yleensä eri kertoimella diagonaalin numerosta riippuen.
Perusfakta diagonalisoitavista kartoituksista ja matriiseista ilmaistaan seuraavissa väitteissä.
Matriisi tai lineaarinen kuvaus on diagonalisoitavissa kentän F yli silloin ja vain, jos minimipolynomi on kentän F lineaaristen tekijöiden tulo. Toisin sanoen matriisi on diagonalisoitavissa, jos ja vain jos kaikki minimaalisen polynomin jakajat ovat lineaarisia.
Seuraava ehto (riittävä, mutta ei välttämätön) on usein hyödyllinen.
Olkoon A matriisi F :n päällä . Jos A on diagonalisoitavissa, mikä tahansa A:n potenssi on diagonalisoitavissa. Jos A on käännettävä, F on algebrallisesti suljettu, A n on diagonalisoitavissa jollekin n :lle , joka ei ole ominaisuuden F kerrannainen , niin A on diagonalisoitavissa.
C :n yläpuolella melkein mikä tahansa matriisi on diagonalisoitavissa. Tarkemmin sanottuna joukolla n × n kompleksista matriisia , jotka eivät ole diagonalisoitavissa C :n yli, kun sitä pidetään C : n n × n osajoukona , Lebesguen mitta on nolla . Voidaan myös sanoa, että diagonalisoitavat matriisit muodostavat tiheän osajoukon Zariski-topologian puitteissa : tämän osajoukon komplementti on joukossa, jossa karakteristisen polynomin diskriminantti katoaa, eli hyperpinnalla. Näin ei ole R :n kohdalla .
Jordan-Chevalley-hajotelma edustaa operaattoria diagonalisoitavien ja nilpotenttien osien summana . Siksi matriisi on diagonalisoitavissa silloin ja vain, jos nilpotentti osa on nolla. Toisin sanoen matriisi on diagonalisoitava, jos jokaisessa Jordan-muodon lohkossa ei ole nilpotenttia osaa.
Jos matriisi A voidaan diagonalisoida, eli
sitten
Kirjoitamme P lohkomatriisina sarakevektoreilla _
niin yllä oleva yhtälö voidaan kirjoittaa uudelleen muotoon
P :n sarakevektorit ovat A : n oikeat ominaisvektorit , vastaavat diagonaalielementit ovat ominaisarvot. P :n käänteisyys viittaa myös siihen, että ominaisvektorit ovat lineaarisesti riippumattomia ja muodostavat kantan F n :ssä . Tämä on välttämätön ja riittävä ehto diagonalisoitavuudelle. Rivivektorit P −1 ovat A :n vasemmanpuoleisia ominaisvektoreita .
Jos A on hermiittinen matriisi , niin A :n ominaisvektorit voidaan valita siten, että ne muodostavat ortogonaalisen kannan C n :ssä . Näissä olosuhteissa P on unitaarinen matriisi ja P -1 on yhtä suuri kuin P : n hermiittinen konjugaatti .
Käytännössä matriisien diagonalisointi suoritetaan tietokoneella. On olemassa useita algoritmeja , jotka mahdollistavat tämän prosessin suorittamisen.
Matriisijoukon sanotaan olevan yhdessä diagonalisoitavissa, jos on olemassa ainutlaatuinen käännettävä matriisi P siten, että P −1 AP on diagonaalimatriisi jokaiselle joukon A :lle. Seuraava lause kuvaa yhteisesti diagonalisoitavia matriiseja: matriisijoukko on joukko diagonalisoitavia työmatkamatriiseja silloin ja vain, jos se on yhdessä diagonalisoitavissa. [2]
Kaikkien n × n matriisien joukko, jotka voidaan diagonalisoida C : n yli, kun n > 1, ei ole yhdessä diagonalisoitavissa. Esimerkiksi matriisit
ovat diagonalisoitavissa, mutta eivät yhdessä, koska ne eivät liiku.
Joukko koostuu kommutoitavista normaalimatriiseista silloin ja vain, jos se on diagonalisoitu yhdessä unitaarimatriisilla, eli on olemassa unitaarinen matriisi U siten, että U*AU on diagonaalinen mille tahansa joukon matriisille A.
Yleensä rotaatiomatriisi ei ole diagonalisoitavissa reaalilukujen yli, mutta kaikki rotaatiomatriisit ovat diagonalisoitavissa kompleksilukukentän yli. Vaikka matriisi ei ole diagonalisoitavissa, on mahdollista pienentää se "parhaaseen mahdolliseen muotoon" ja luoda matriisi, jolla on samat ominaisuudet ja joka sisältää ominaisarvot päälävistäjällä ja ykkösiä tai nollia yllä olevassa diagonaalissa, eli Jordanin normaali muoto .
Jotkut matriisit eivät ole diagonalisoitavissa minkään kentän yli, niiden joukossa voidaan määrittää nollasta poikkeavia nilpotentteja matriiseja . Tämä tapahtuu, jos ominaisarvon algebrallinen ja geometrinen monikertaisuus eivät täsmää. Harkitse
Tätä matriisia ei voida diagonalisoida: ei ole olemassa matriisia U , jolle U −1 CU on diagonaalimatriisi. C :llä on yksi algebrallisen moninkertaisuuden 2 ja geometrisen monikertaisuuden 1 ominaisarvo (nolla).
Joitakin reaalimatriiseja ei voida diagonalisoida reaalilukujen yli. Harkitse matriisia
Matriisilla B ei ole todellisia ominaisarvoja, joten ei ole olemassa todellista matriisia Q , jolle Q −1 BQ on diagonaali. Mutta kompleksilukujen kentän yli voimme diagonalisoida B . Jos ajatellaan
silloin Q −1 BQ on diagonaali.
Huomaa, että yllä olevat esimerkit osoittavat, että diagonalisoitavien matriisien summa ei aina ole diagonalisoitavissa.
Harkitse matriisia
Tällä matriisilla on ominaisarvot
A on 3x3 matriisi, jossa on 3 erillistä ominaisarvoa; joten se on diagonalisoitavissa. Huomaa, että jos n × n matriisilla on täsmälleen n erillistä ominaisarvoa, se on diagonalisoitavissa.
Ominaisarvot näkyvät diagonalisoidussa muodossa A , joten ominaisarvoja löydettäessä matriisi A diagonalisoidaan. Omavektoreita voidaan käyttää diagonalisoimaan A.
A :n ominaisvektorit ovat
Sen voi tarkistaa
Olkoon P matriisi, jossa annetut ominaisvektorit ovat sarakkeita.
Huomaa, että P :n sarakkeilla ei ole erillistä järjestystä ; Ominaisuusvektorien järjestyksen muuttaminen P :ssä muuttaa vain ominaisarvojen järjestystä diagonaalimuodossa A . [3]
Matriisi P diagonalisoi A :n , mikä on helppo nähdä:
Tämä seuraa siitä tosiasiasta , että millä tahansa vakioperusteella
jossa olemme hyödyntäneet mitä on k:s sarake , joten . Huomaa, että ominaisarvot ilmestyivät diagonaalimatriisiin.
Diagonalisoinnilla voidaan laskea tehokkaasti matriisin A tehot, jos matriisi on diagonalisoitavissa. Otetaan se
missä on diagonaalimatriisi. Sitten matriisien tulon assosiatiivisuuden perusteella
Viimeinen tulo on helppo laskea, koska se sisältää diagonaalimatriisin potenssit. Tämä lähestymistapa voidaan yleistää matriisieksponenttiin ja muihin matriisifunktioihin , koska ne voidaan esittää potenssisarjoina.
Harkitse seuraavaa matriisia:
M :n eri potenssien laskeminen johtaa mielenkiintoiseen malliin:
Tämä ilmiö voidaan selittää käyttämällä M :n diagonalisointia . Tarvitsemme kantan R 2 , joka koostuu ominaisvektoreista M . Yksi perusteista on
missä e i on Rn : n standardikanta . Perusteen käänteinen muutos saadaan lausekkeilla
Laskelmat sen osoittavat
Siksi a ja b ovat ominaisarvoja, jotka vastaavat u :ta ja v :tä . Matriisitulon lineaarisuuden perusteella saamme
Palatessamme standardipohjaan, saamme sen
Edellä kuvattujen relaatioiden matriisimuodolla on muoto
mikä selittää edellä mainitun kaavan.
Kvanttimekaniikassa ja kvanttikemiassa matriisidiagonalisointi on yksi eniten käytetyistä menetelmistä laskelmissa . Pääsyynä on se, että ajasta riippumaton Schrödinger -yhtälö on ominaisarvoyhtälö ja lähes kaikissa fysikaalisissa sovelluksissa äärettömän ulottuvuuden ( Hilbert ) avaruudessa. Likimääräisissä lähestymistavoissa Hilbert-avaruus korvataan äärellisulotteisella avaruudella, jonka jälkeen Schrödingerin yhtälö voidaan muotoilla uudelleen ongelmaksi löytää todellisen symmetrisen (tai kompleksisen hermiittisen) matriisin ominaisarvot. Tämä lähestymistapa perustuu variaatioperiaatteeseen .