Suurimman todennäköisyyden menetelmä

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 19. tammikuuta 2021 tarkistetusta versiosta . tarkastukset vaativat 4 muokkausta .

Maksimitodennäköisyysmenetelmä tai maksimitodennäköisyysmenetelmä (MMP, ML, MLE - englanti m maximum l ikelihood e stimation ) matemaattisessa tilastossa on menetelmä  tuntemattoman parametrin estimoimiseksi todennäköisyysfunktion maksimoimalla [1] . Perustuu olettamukseen, että kaikki tilastollista otosta koskevat tiedot sisältyvät todennäköisyysfunktioon.  

R. Fischer analysoi, suositteli ja suositteli maksimitodennäköisyyden menetelmää suuresti suosituksiksi vuosina 1912-1922 (vaikka Gauss , Laplace ja muut olivat käyttäneet sitä aiemmin).

Maksimitodennäköisyyden estimointi on suosittu tilastollinen tekniikka, jota käytetään tilastollisen mallin luomiseen tiedoista ja mallin parametrien arvioinnin antamiseen.

Maksimitodennäköisyysmenetelmä vastaa monia tilastoalalla tunnettuja estimointimenetelmiä. Esimerkiksi olet kiinnostunut sellaisesta antropometrisesta parametrista kuin Venäjän asukkaiden korkeus. Oletetaan, että sinulla on tietoja tietyn määrän ihmisiä, ei koko väestön kasvusta. Lisäksi kasvun oletetaan olevan normaalisti jakautunut suure, jonka varianssi ja keskiarvo ovat tuntemattomia . Otoksen kasvun keskiarvo ja varianssi ovat suurin todennäköisyys koko populaation keskiarvoon ja varianssiin.

Kiinteälle tietojoukolle ja perustodennäköisyysmallille saamme maksimitodennäköisyysmenetelmällä mallin parametrien arvot, jotka tekevät datasta "lähempänä" todellista. Maksimitodennäköisyyden estimointi tarjoaa ainutlaatuisen ja helpon tavan määrittää ratkaisut normaalijakauman tapauksessa.

Maksimitodennäköisyyden estimointimenetelmää sovelletaan useisiin tilastollisiin malleihin, mukaan lukien:

Metodin olemus

Olkoon näyte jakaumasta , jossa  ovat tuntemattomat parametrit. Antaa olla  todennäköisyysfunktio , jossa . Piste-arvio

kutsutaan parametrin maksimitodennäköisyysarvioksi . Siten suurin todennäköisyysarvio on se, joka maksimoi todennäköisyysfunktion kiinteälle näytteenottototeutukselle.

Usein käytetään log-likelihood- funktiota todennäköisyysfunktion sijaan . Koska funktio kasvaa monotonisesti koko määritelmäalueen yli, minkä tahansa funktion maksimi on funktion maksimi ja päinvastoin. Tällä tavalla,

,

Jos todennäköisyysfunktio on differentioituva, niin ääripään välttämätön ehto on sen gradientin yhtäläisyys nollaan :

Riittävä äärimmäinen ehto voidaan formuloida Hessenin negatiiviseksi definiteetiksi  , toisen derivaatan matriisin:

Tärkeä maksimitodennäköisyysmenetelmän estimaattien ominaisuuksien arvioimiseksi on ns. informaatiomatriisi , joka on määritelmän mukaan sama:

Optimaalisessa pisteessä informaatiomatriisi osuu miinusmerkillä otettuna Hessenin odotukseen:

Ominaisuudet

missä  on asymptoottinen informaatiomatriisi.

Asymptoottinen tehokkuus tarkoittaa, että asymptoottinen kovarianssimatriisi on alaraja kaikille yhdenmukaisille asymptoottisesti normaaleille estimaattoreille.

missä on otoskoon  todennäköisyysfunktio

Esimerkkejä

Viimeinen yhtäläisyys voidaan kirjoittaa uudelleen seuraavasti:

jossa , mikä osoittaa, että todennäköisyysfunktio saavuttaa maksiminsa kohdassa . Tällä tavalla

.

Tällainen arvio on puolueellinen: , mistä

.

Löytääksemme sen maksimiarvon, rinnastamme osittaiset derivaatat nollaan :

missä

 on näytteen keskiarvo , ja  on otosvarianssi .

Käyttötapa [2]

Kokeilun käsittely

Oletetaan, että mittaamme jonkin määrän . Yhden mittauksen jälkeen saimme sen arvon virheellä : . Kirjoitetaan todennäköisyystiheys, että arvo ottaa arvon :

.

Oletetaan nyt, että olemme tehneet useita tällaisia ​​mittauksia ja saaneet . Todennäköisyystiheys, että määrä saa arvot , on:

.

Tätä funktiota kutsutaan todennäköisyysfunktioksi. Mitatun arvon todennäköisin arvo määräytyy todennäköisyysfunktion maksimin mukaan. Kätevämpi on log-likelihood-toiminto:

.

Erota log-todennäköisyysfunktio suhteessa :

.

Yhdistä ja hanki arvoa :

.

Cramer muotoili seuraavan lauseen:

Lause: Ei ole olemassa muuta menetelmää kokeen tulosten käsittelyyn, joka antaisi paremman approksimation totuudelle kuin maksimitodennäköisyysmenetelmä.

Mittausvirheet

Oletetaan, että olemme tehneet sarjan mittauksia ja saaneet sarjan arvoja , on luonnollista kirjoittaa, että tällä jakaumalla on Gaussin muoto :

.

Kirjoitetaan logaritminen todennäköisyysfunktio: .

Otetaan ensimmäinen johdannainen:

.

Jos , niin . Ota nyt toinen johdannainen:

, missä

.

Tätä kutsutaan ensimmäiseksi taikakaavaksi [2] .

Ehdollinen suurimman todennäköisyyden menetelmä

Regressiomalleissa käytetään ehdollista maksimitodennäköisyyden menetelmää (Conditional ML) . Menetelmän ydin on, että ei käytetä kaikkien muuttujien (riippuvien ja regressorien) täyttä yhteisjakaumaa, vaan vain riippuvan muuttujan ehdollista jakaumaa tekijöiden mukaan, eli itse asiassa regressiomallin satunnaisvirheiden jakaumaa. . Kokonaistodennäköisyysfunktio on "ehdollisen todennäköisyysfunktion" ja tekijöiden jakautumistiheyden tulos. Ehdollinen MMP vastaa MMP:n täysversiota siinä tapauksessa, että tekijöiden jakautuminen ei millään tavalla riipu arvioiduista parametreista. Tätä ehtoa rikotaan usein aikasarjamalleissa, kuten autoregressiivisessä mallissa . Tässä tapauksessa regressorit ovat riippuvan muuttujan menneitä arvoja, mikä tarkoittaa, että niiden arvot noudattavat myös samaa AR-mallia, eli regressorien jakautuminen riippuu arvioiduista parametreista. Tällaisissa tapauksissa ehdollisen ja täyden suurimman todennäköisyyden menetelmän soveltamisen tulokset eroavat.

Katso myös

Muistiinpanot

  1. Fisher  - 1912 matemaattinen tietosanakirja, Moskova: Neuvostoliiton tietosanakirja, 1988.
  2. ↑ 1 2 A.P. Onuchin. Ydinfysiikan kokeelliset menetelmät. - Novosibirsk: Novosibirskin valtion teknillinen yliopisto, 2010. - S. 297-303. — 336 s. — ISBN 978-5-7782-1232-9 .

Kirjallisuus