Kvasi-Newtonilaiset menetelmät

Kvasinewtonilaiset menetelmät ovat optimointimenetelmiä , jotka perustuvat gradientin muutoksen havaintojen perusteella kerättyyn tiedon keräämiseen tavoitefunktion kaarevuudesta , mikä eroaa olennaisesti Newtonin menetelmistä . Kvasi-Newtonin menetelmien luokka eliminoi Hessenin matriisin eksplisiittisen muodostumisen ja korvaa sen jollain approksimaatiolla.

Kuvaus

Laajennetaan alkuperäisen funktion gradienttia Taylor-sarjassa algoritmin seuraavan askeleen potenssien seuraavan approksimaatiopisteen läheisyydessä :

Tällöin Hessenin matriisin estimaatin tulee tyydyttää yhtäläisyys:

,

missä

tätä ehtoa kutsutaan kvasi-newtonilaiseksi .

Jokaisessa iteraatiossa seuraava hakusuunta määritetään painikkeella ja matriisi päivitetään äskettäin saaduilla kaarevuustiedoilla:

,

jossa on matriisi, joka luonnehtii seuraavassa vaiheessa käyttöönotettua korjausta.

Identiteettimatriisia käytetään alustavana approksimaationa , joten ensimmäinen suunta osuu täsmälleen jyrkimmän laskusuunnan kanssa .

Single Rank Muutos

Algoritmin yksi askel antaa tietoa kaarevuudesta yhdessä suunnassa, joten matriisin sijoitusta pidetään pienenä ja jopa yhtenäisenä:

missä ja ovat jotkin vektorit.

Sitten kvasi-Newtonin ehto saa muodon:

Olettaen, että edellinen matriisi seuraavassa vaiheessa ei täytä kvasi-Newtonin ehtoa (eli ero oikealla puolella ei ole nolla) ja että vektori ei ole ortogonaalinen kohtaan , saadaan lauseke ja :

Hessenin matriisin symmetriasta johtuen vektori on otettu kollineaariseksi :

Tuloksena olevaa yhtälöä kutsutaan ykköstason symmetriseksi kaavaksi .

Sijoita kaksi muutosta

Yksi tapa rakentaa toisen asteen korjauksia on muodostaa konvergentti matriisien sarja . Ota alkuarvoksi , laske kaavalla:

Sitten se on symmetrisoitu:

Tuloksena oleva matriisi ei kuitenkaan enää täytä kvasi-Newtonin ehtoa. Tämän korjaamiseksi toimenpide toistetaan. Tämän seurauksena -: nnessa vaiheessa:

Tämän sarjan raja on:

Kun valitset erilaisia ​​(ei-ortogonaalisia ), saadaan erilaisia ​​kaavoja matriisin uudelleenlaskentaa varten :

,

missä

On helppo tarkistaa, että se on ortogonaalinen . Näin ollen termin lisääminen ei riko kvasi-Newtonin ehtoa eikä symmetriaehtoa. Siksi tehtiin useita teoreettisia tutkimuksia, joissa viimeinen termi skaalattiin parhaan likiarvon saamiseksi. Tämän seurauksena omaksuttiin näkemys, että paras vaihtoehto on se, joka vastaa viimeisen lukukauden täydellistä poissaoloa. Tämä muunnosvaihtoehto tunnetaan Broyden-Fletcher-Goldfarb-Shanno- kaavana (BFGS) :

Kirjallisuus