Levenberg-Marquardt-algoritmi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 29. elokuuta 2019 tarkistetusta versiosta . tarkastukset vaativat 6 muokkausta .

Levenberg-Marquardt-algoritmi on  optimointimenetelmä, jonka tarkoituksena on ratkaista pienimmän neliösumman tehtäviä . Se on vaihtoehto Newtonin menetelmälle . Voidaan nähdä jälkimmäisen yhdistelmänä gradienttilaskeutumisen kanssa tai luottamusalueen menetelmänä [1] (Marquard, s. 492). Algoritmin muotoilivat itsenäisesti Levenberg ( 1944 ) ja Marquardt ( 1963 ).

Ongelman selvitys

Olkoon muodon pienimmän neliösumman tehtävä:

Tälle ongelmalle on ominaista erityinen gradientti ja Hessenin matriisi :

missä  on vektorifunktion Jacobi-matriisi ,  on sen komponentin Hessen-matriisi .

Sitten Gauss-Newton-menetelmän mukaan, olettaen, että termin yli on hallitseva rooli (eli jos normi on merkittävästi pienempi kuin matriisin maksimiominaisarvo ), seuraava suunta määritetään järjestelmästä:

Algoritmi

Levenberg-Marquardt-hakusuunta määritetään järjestelmästä:

jossa  on jokin ei-negatiivinen vakio, joka on spesifinen kullekin vaiheelle,  on identiteettimatriisi.

Valinta voidaan tehdä tekemällä siitä riittävä monotoniseen laskeutumiseen jäännösfunktiota pitkin , eli nostamalla parametria, kunnes ehto saavutetaan . Parametri voidaan myös asettaa koevaiheiden tuloksena saavutettujen funktion todellisten muutosten ja näiden muutosten odotettujen arvojen välisen suhteen perusteella interpoloinnin aikana . Fletcher rakensi samanlaisen menettelyn.

Voidaan myös osoittaa, että se täyttää ehdon:

missä  on parametriin .

Yhdistelmä gradienttilaskua ja Gauss-Newton-menetelmää

On helppo nähdä, että , algoritmi degeneroituu Gauss-Newton-menetelmäksi ja riittävän suurelle , suunta poikkeaa hieman jyrkimmän laskeutumisen suunnasta. Siten parametrin oikealla valinnalla saavutetaan monotoninen vähennys minimoituun toimintoon. Epätasa -arvoa voidaan aina toteuttaa valitsemalla riittävän suuri. Tässä tapauksessa ensimmäiseen termiin sisältyvät tiedot kaarevuudesta kuitenkin menetetään ja kaikki gradienttilaskeutumismenetelmän haitat tulevat näkyviin : paikoissa, joissa on loiva kaltevuus, antigradientti on pieni ja paikoissa, joissa on kaltevuus. jyrkkä rinne, se on suuri, kun taas ensimmäisessä tapauksessa on toivottavaa ottaa suuria askeleita ja toisessa - pieniä. Joten toisaalta, jos pinnalla on pitkä ja kapea syvennys, jonka määrittelee jäännösfunktio , niin syvennyksen pohjaa pitkin gradientin komponentit ovat pieniä ja seiniä kohti suuria, kun taas se on toivottavaa kulkea rotkon pohjaa pitkin. Marquardt ehdotti menetelmää kaarevuutta koskevien tietojen huomioon ottamiseksi. Hän huomasi, että jos korvaamme identiteettimatriisin Hessenin matriisin diagonaalilla, voimme saavuttaa askeleen kasvun loivilla osuuksilla ja laskun jyrkkiä laskuja pitkin:

Luottamusvälimenetelmä

Kun tarkastellaan Levenberg-Marquardt-algoritmia luottamusvälien menetelmänä, heuristiikkaa käyttäen valitaan intervalli , jolle funktion approksimaatio rakennetaan :

Tässä tapauksessa vaihe määräytyy minimointiongelman perusteella :

Muistiinpanot

  1. B. T. Polyak. Newtonin menetelmä ja sen rooli optimoinnissa ja laskennallisessa matematiikassa  // Proceedings of Institute of System Analysis of the Russian Sciences Academy. - 2006. - T. 28 . — S. 44–62 . Arkistoitu alkuperäisestä 24. lokakuuta 2018.

Kirjallisuus

Linkit