Pseudo-inverse matriisi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 19. heinäkuuta 2021 tarkistetusta versiosta . tarkastukset vaativat 2 muokkausta .

Pseudo-inversiomatriisi on yleistys käänteismatriisin  käsitteestä lineaarisessa algebrassa . Matriisin pseudo-inversio on merkitty .

Fredholm esitteli pseudoinversioiden integroivien operaattorien käsitteen ensimmäisen kerran vuonna 1903 . Tunnetuin on Moore-Penrose-pseudomuunnos, jonka Eliakim Moore [1] kuvasivat itsenäisesti vuonna 1920 ja Roger Penrose [2] vuonna 1955 ; väitettä, että pseudoinversio matriisi on olemassa ja on ainutlaatuinen mille tahansa matriisille reaali- ja kompleksilukujen yli, kutsutaan Mooren-Penrosen lauseeksi .

Yleistetty inversio onpseudoinversio, joka täyttää tiukemmat ehdot .  Pseudoinversio voidaan ymmärtää parhaan approksimaatiotehtävän ratkaisuna ( pienimmän neliösumman menetelmällä rajoittavalla regularisointivariantilla ) vastaavalle lineaariyhtälöjärjestelmälle . Pseudo-inversio matriisi voidaan laskea käyttämällä matriisin singulaariarvojakelua .

Määritelmä

kutsutaan pseudo-inversiomatriisiksi matriisille, jos se täyttää seuraavat kriteerit:

  1. ;
  2. ( on heikko inversio kertovassa puoliryhmässä);
  3. (tämä tarkoittaa, että  se on hermiittinen matriisi );
  4. (  on myös hermiittinen matriisi).

Tässä  on Hermitian konjugaattimatriisi M ( matriiseille reaalilukukentän yli ).

On olemassa vastaava tapa määrittää pseudo-inversio matriisi käänteisrajan suhteen ( Tihonov-regulaatio ):

,

missä  on identiteettimatriisi. Tämä raja on olemassa, vaikka sitä ei olisi määritelty.

Ominaisuudet

Erikoistilaisuudet

Jos matriisin sarakkeet ovat lineaarisesti riippuvaisia , matriisi on käännettävä. Tässä tapauksessa pseudo-inverse matriisi saadaan kaavalla:

.

Jos sarakkeet ovat lineaarisesti riippumattomia (mikä pätee neliömäisille ei-singulaarisille matriiseille), niin pseudoinversio on sama kuin inversio:

.

Jos ja ovat sellaisia, että tuote on määritelty ja:

sitten

.

Pseudo-kääntöä voidaan soveltaa sekä skalaareihin että vektoreihin. Tämä tarkoittaa, että niitä käsitellään sopivan ulottuvuuden matriiseina. Skalaarin pseudo-inversio  on nolla, jos se  on nolla, ja käänteisarvo muuten:

Nollavektorin pseudoinversio on transponoitu nollavektori. Nollasta poikkeavan vektorin pseudoinversio on konjugaattitransponoitu vektori jaettuna sen pituuden neliöllä:

Sen todistamiseksi riittää, kun varmistetaan, että nämä suureet täyttävät pseudoinverssien määritelmän.

Alkuperä

Jos se on olemassa, niin tasa-arvosta:

pitäisi

joka synnyttää pseudo-käännöksen käsitteen

.

Laskenta

Antaa olla  sijoitus matriisin koon . Sitten voidaan esittää muodossa , jossa B  on kokomatriisi lineaarisesti riippumattomilla sarakkeilla ja  kokomatriisi lineaarisesti riippumattomilla riveillä. Sitten:

.

Jos sillä on täysrivin arvo, eli , voidaan valita identiteettimatriisi ja kaava pienennetään arvoon . Vastaavasti, jos on koko sarakkeen sijoitus, eli , niin .

Yksinkertaisin laskennallinen tapa saada pseudo-inversio matriisi on käyttää singulaariarvojakelua .

Jos  on singulaariarvon hajotelma , niin . Diagonaalimatriisille , kuten , pseudoinversio saadaan siitä korvaamalla jokainen diagonaalin nollasta poikkeava elementti sen käänteisfunktiolla.

On olemassa optimoituja lähestymistapoja pseudoinverssin laskemiseen lohkomatriiseille.

Joskus laskelmien määrää pseudoinversiomatriisin löytämiseksi voidaan pienentää, jos jonkin samanlaisen matriisin pseudoinversio tunnetaan. Erityisesti, jos samanlainen matriisi eroaa alkuperäisestä yksittäin muutetun, lisätyn tai poistetun sarakkeen tai rivin osalta, on olemassa kumulatiivisia algoritmeja, jotka voivat käyttää matriisien välistä suhdetta.

Sovellus

Pseudoinversio liittyy läheisesti pienimmän neliösumman menetelmään (LSM) lineaariyhtälöjärjestelmälle [3] .

Tässä menetelmässä annetun järjestelmän ratkaisuongelma korvataan epäsuhdan neliöllisen euklidisen normin minimointiongelmalla . Käytännössä LSM:ää käytetään yleensä silloin, kun alkuperäinen järjestelmä on epäjohdonmukainen, mutta alla tarkastellaan tapausta, jolloin tämä järjestelmä on yhteensopiva.

Epähomogeenisen järjestelmän yleinen ratkaisu voidaan esittää epähomogeenisen järjestelmän tietyn ratkaisun ja vastaavan homogeenisen järjestelmän yleisen ratkaisun summana .

Lemma: Jos on olemassa, niin yleinen ratkaisu on aina esitettävissä epähomogeenisen järjestelmän pseudoinversion ratkaisun ja homogeenisen järjestelmän ratkaisun summana:

Todiste:

.

Tässä vektori on mielivaltainen (mittaan asti). Kahdella muulla termillä on pseudo-inversiomatriisi . Kirjoittamalla se uudelleen muotoon , tuomme lausekkeen muotoon:

Ensimmäinen termi on pseudokäänteinen ratkaisu. Pienimmän neliösumman menetelmässä on , joka antaa residuaalin minimieuklidisen normin . Seuraava termi antaa ratkaisun homogeeniseen järjestelmään , koska  on projektiooperaattori operaattorin kuvaan ja vastaavasti  projektiooperaattori operaattorin ytimeen .

Kirjallisuus

  1.   E. H. Moore: Yleisen algebrallisen matriisin käänteisluvusta. Bulletin of the American Mathematical Society 26, 394-395 (1920) 7.pdf
  2.   Roger Penrose: Matriisien yleinen käänteisfunktio. Proceedings of the Cambridge Philosophical Society 51, 406-413 (1955)
  3.   Roger Penrose: Lineaaristen matriisiyhtälöiden parhaalla likimääräisellä ratkaisulla. Proceedings of the Cambridge Philosophical Society 52, 17-19 (1956)
  4.   Albert A.: Regressio, pseudoinversio ja rekursiivinen estimointi. käännös englannista. Moskova, "Nauka", 224 s. (1977)
  5.   Beklemishev D.V.: ​​Lineaarisen algebran lisäluvut. Moskova, tiede. (1983)