Levenberg-Marquardt-algoritmi on optimointimenetelmä, jonka tarkoituksena on ratkaista pienimmän neliösumman tehtäviä . Se on vaihtoehto Newtonin menetelmälle . Voidaan nähdä jälkimmäisen yhdistelmänä gradienttilaskeutumisen kanssa tai luottamusalueen menetelmänä [1] (Marquard, s. 492). Algoritmin muotoilivat itsenäisesti Levenberg ( 1944 ) ja Marquardt ( 1963 ).
Olkoon muodon pienimmän neliösumman tehtävä:
Tälle ongelmalle on ominaista erityinen gradientti ja Hessenin matriisi :
missä on vektorifunktion Jacobi-matriisi , on sen komponentin Hessen-matriisi .
Sitten Gauss-Newton-menetelmän mukaan, olettaen, että termin yli on hallitseva rooli (eli jos normi on merkittävästi pienempi kuin matriisin maksimiominaisarvo ), seuraava suunta määritetään järjestelmästä:
Levenberg-Marquardt-hakusuunta määritetään järjestelmästä:
jossa on jokin ei-negatiivinen vakio, joka on spesifinen kullekin vaiheelle, on identiteettimatriisi.
Valinta voidaan tehdä tekemällä siitä riittävä monotoniseen laskeutumiseen jäännösfunktiota pitkin , eli nostamalla parametria, kunnes ehto saavutetaan . Parametri voidaan myös asettaa koevaiheiden tuloksena saavutettujen funktion todellisten muutosten ja näiden muutosten odotettujen arvojen välisen suhteen perusteella interpoloinnin aikana . Fletcher rakensi samanlaisen menettelyn.
Voidaan myös osoittaa, että se täyttää ehdon:
missä on parametriin .
On helppo nähdä, että , algoritmi degeneroituu Gauss-Newton-menetelmäksi ja riittävän suurelle , suunta poikkeaa hieman jyrkimmän laskeutumisen suunnasta. Siten parametrin oikealla valinnalla saavutetaan monotoninen vähennys minimoituun toimintoon. Epätasa -arvoa voidaan aina toteuttaa valitsemalla riittävän suuri. Tässä tapauksessa ensimmäiseen termiin sisältyvät tiedot kaarevuudesta kuitenkin menetetään ja kaikki gradienttilaskeutumismenetelmän haitat tulevat näkyviin : paikoissa, joissa on loiva kaltevuus, antigradientti on pieni ja paikoissa, joissa on kaltevuus. jyrkkä rinne, se on suuri, kun taas ensimmäisessä tapauksessa on toivottavaa ottaa suuria askeleita ja toisessa - pieniä. Joten toisaalta, jos pinnalla on pitkä ja kapea syvennys, jonka määrittelee jäännösfunktio , niin syvennyksen pohjaa pitkin gradientin komponentit ovat pieniä ja seiniä kohti suuria, kun taas se on toivottavaa kulkea rotkon pohjaa pitkin. Marquardt ehdotti menetelmää kaarevuutta koskevien tietojen huomioon ottamiseksi. Hän huomasi, että jos korvaamme identiteettimatriisin Hessenin matriisin diagonaalilla, voimme saavuttaa askeleen kasvun loivilla osuuksilla ja laskun jyrkkiä laskuja pitkin:
Kun tarkastellaan Levenberg-Marquardt-algoritmia luottamusvälien menetelmänä, heuristiikkaa käyttäen valitaan intervalli , jolle funktion approksimaatio rakennetaan :
Tässä tapauksessa vaihe määräytyy minimointiongelman perusteella :
Optimointimenetelmät _ | |
---|---|
Yksiulotteinen |
|
Nolla järjestys | |
Ensimmäinen tilaus | |
toinen tilaus | |
Stokastinen | |
Lineaariset ohjelmointimenetelmät _ | |
Epälineaariset ohjelmointimenetelmät |