Maksimitodennäköisyysmenetelmä tai maksimitodennäköisyysmenetelmä (MMP, ML, MLE - englanti m maximum l ikelihood e stimation ) matemaattisessa tilastossa on menetelmä tuntemattoman parametrin estimoimiseksi todennäköisyysfunktion maksimoimalla [1] . Perustuu olettamukseen, että kaikki tilastollista otosta koskevat tiedot sisältyvät todennäköisyysfunktioon.
R. Fischer analysoi, suositteli ja suositteli maksimitodennäköisyyden menetelmää suuresti suosituksiksi vuosina 1912-1922 (vaikka Gauss , Laplace ja muut olivat käyttäneet sitä aiemmin).
Maksimitodennäköisyyden estimointi on suosittu tilastollinen tekniikka, jota käytetään tilastollisen mallin luomiseen tiedoista ja mallin parametrien arvioinnin antamiseen.
Maksimitodennäköisyysmenetelmä vastaa monia tilastoalalla tunnettuja estimointimenetelmiä. Esimerkiksi olet kiinnostunut sellaisesta antropometrisesta parametrista kuin Venäjän asukkaiden korkeus. Oletetaan, että sinulla on tietoja tietyn määrän ihmisiä, ei koko väestön kasvusta. Lisäksi kasvun oletetaan olevan normaalisti jakautunut suure, jonka varianssi ja keskiarvo ovat tuntemattomia . Otoksen kasvun keskiarvo ja varianssi ovat suurin todennäköisyys koko populaation keskiarvoon ja varianssiin.
Kiinteälle tietojoukolle ja perustodennäköisyysmallille saamme maksimitodennäköisyysmenetelmällä mallin parametrien arvot, jotka tekevät datasta "lähempänä" todellista. Maksimitodennäköisyyden estimointi tarjoaa ainutlaatuisen ja helpon tavan määrittää ratkaisut normaalijakauman tapauksessa.
Maksimitodennäköisyyden estimointimenetelmää sovelletaan useisiin tilastollisiin malleihin, mukaan lukien:
Olkoon näyte jakaumasta , jossa ovat tuntemattomat parametrit. Antaa olla todennäköisyysfunktio , jossa . Piste-arvio
kutsutaan parametrin maksimitodennäköisyysarvioksi . Siten suurin todennäköisyysarvio on se, joka maksimoi todennäköisyysfunktion kiinteälle näytteenottototeutukselle.
Usein käytetään log-likelihood- funktiota todennäköisyysfunktion sijaan . Koska funktio kasvaa monotonisesti koko määritelmäalueen yli, minkä tahansa funktion maksimi on funktion maksimi ja päinvastoin. Tällä tavalla,
,Jos todennäköisyysfunktio on differentioituva, niin ääripään välttämätön ehto on sen gradientin yhtäläisyys nollaan :
Riittävä äärimmäinen ehto voidaan formuloida Hessenin negatiiviseksi definiteetiksi , toisen derivaatan matriisin:
Tärkeä maksimitodennäköisyysmenetelmän estimaattien ominaisuuksien arvioimiseksi on ns. informaatiomatriisi , joka on määritelmän mukaan sama:
Optimaalisessa pisteessä informaatiomatriisi osuu miinusmerkillä otettuna Hessenin odotukseen:
missä on asymptoottinen informaatiomatriisi.
Asymptoottinen tehokkuus tarkoittaa, että asymptoottinen kovarianssimatriisi on alaraja kaikille yhdenmukaisille asymptoottisesti normaaleille estimaattoreille.
Viimeinen yhtäläisyys voidaan kirjoittaa uudelleen seuraavasti:
jossa , mikä osoittaa, että todennäköisyysfunktio saavuttaa maksiminsa kohdassa . Tällä tavalla
.Tällainen arvio on puolueellinen: , mistä
Löytääksemme sen maksimiarvon, rinnastamme osittaiset derivaatat nollaan :
missä
on näytteen keskiarvo , ja on otosvarianssi .Oletetaan, että mittaamme jonkin määrän . Yhden mittauksen jälkeen saimme sen arvon virheellä : . Kirjoitetaan todennäköisyystiheys, että arvo ottaa arvon :
.
Oletetaan nyt, että olemme tehneet useita tällaisia mittauksia ja saaneet . Todennäköisyystiheys, että määrä saa arvot , on:
.
Tätä funktiota kutsutaan todennäköisyysfunktioksi. Mitatun arvon todennäköisin arvo määräytyy todennäköisyysfunktion maksimin mukaan. Kätevämpi on log-likelihood-toiminto:
.
Erota log-todennäköisyysfunktio suhteessa :
.
Yhdistä ja hanki arvoa :
.
Cramer muotoili seuraavan lauseen:
Lause: Ei ole olemassa muuta menetelmää kokeen tulosten käsittelyyn, joka antaisi paremman approksimation totuudelle kuin maksimitodennäköisyysmenetelmä.
Oletetaan, että olemme tehneet sarjan mittauksia ja saaneet sarjan arvoja , on luonnollista kirjoittaa, että tällä jakaumalla on Gaussin muoto :
.
Kirjoitetaan logaritminen todennäköisyysfunktio: .
Otetaan ensimmäinen johdannainen:
.
Jos , niin . Ota nyt toinen johdannainen:
, missä
.
Tätä kutsutaan ensimmäiseksi taikakaavaksi [2] .
Regressiomalleissa käytetään ehdollista maksimitodennäköisyyden menetelmää (Conditional ML) . Menetelmän ydin on, että ei käytetä kaikkien muuttujien (riippuvien ja regressorien) täyttä yhteisjakaumaa, vaan vain riippuvan muuttujan ehdollista jakaumaa tekijöiden mukaan, eli itse asiassa regressiomallin satunnaisvirheiden jakaumaa. . Kokonaistodennäköisyysfunktio on "ehdollisen todennäköisyysfunktion" ja tekijöiden jakautumistiheyden tulos. Ehdollinen MMP vastaa MMP:n täysversiota siinä tapauksessa, että tekijöiden jakautuminen ei millään tavalla riipu arvioiduista parametreista. Tätä ehtoa rikotaan usein aikasarjamalleissa, kuten autoregressiivisessä mallissa . Tässä tapauksessa regressorit ovat riippuvan muuttujan menneitä arvoja, mikä tarkoittaa, että niiden arvot noudattavat myös samaa AR-mallia, eli regressorien jakautuminen riippuu arvioiduista parametreista. Tällaisissa tapauksissa ehdollisen ja täyden suurimman todennäköisyyden menetelmän soveltamisen tulokset eroavat.
Sanakirjat ja tietosanakirjat |
---|