Markovin ketju Monte Carlo

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 13.5.2021 tarkistetusta versiosta . tarkastukset vaativat 2 muokkausta .

Tilastoissa Markov - ketjun Monte Carlo -menetelmät (eng. MCMC) ovat  luokka näytteenottoalgoritmeja , jotka mallintavat todennäköisyysjakaumaa . Rakentamalla Markovin ketju , jonka tasapainotilana on kohdejakauma, voidaan saada saman jakautumisen omaava näyte kirjoittamalla ketjun tilat muistiin. Mitä enemmän vaiheita käytetään, sitä lähempänä otosjakauma on kohdetta. Piirien rakentamiseen käytetään erilaisia ​​algoritmeja, esimerkiksi Metropolis-Hastings-algoritmia.

Sovellusalueet

MCMC:itä käytettiin alun perin ratkaisemaan useita integraaleja numeerisesti , kuten Bayesin tilastoissa , laskennallisessa fysiikassa [1] , laskennallisessa biologiassa [2] ja laskennallisessa lingvistiikassa [3] [4] .

MCMC:n viimeaikainen kehitys on mahdollistanut laskelmien suorittamisen suurissa hierarkkisissa malleissa , jotka vaativat satojen ja tuhansien muuttujien integroinnin [5] .

Harvinaisten tapahtumien simuloinnissa MCMC-menetelmiä käytetään luomaan näytteitä, jotka vähitellen täyttävät harvinaisen vian alueen.

Yleinen määritelmä

Monte Carlo - menetelmät Markov - ketjuilla luovat näytteitä valitun jatkuvan satunnaismuuttujan perusteella , jonka jakautumistiheysfunktio tunnetaan . Näitä näytteitä voidaan käyttää arvioimaan kyseisen suuren integraali keskiarvon tai varianssin avulla .

Käytännössä yleensä rakennetaan piirien sarja, joka alkaa joukosta mielivaltaisia ​​pisteitä, jotka ovat riittävän kaukana toisistaan. Nämä ketjut ovat stokastisia "kävely"-prosesseja, joissa liikkeet tapahtuvat satunnaisesti, algoritmin mukaan. Tämä algoritmi etsii alueita, joilla on suurin integraaliarvo, ja määrittää niille suurimmat todennäköisyydet.

Monte Carlon satunnaiskävelymenetelmät ovat yksi satunnaissimulaatiotyypeistä ( Monte Carlo -menetelmät ). Huomaa , että Monte Carlo - menetelmissä käytetyt integrandin satunnaisotokset ovat tilastollisesti riippumattomia . MCMC:ssä ne korreloidaan automaattisesti . Näytteiden korrelaatio johtaa siihen, että keskiarvojen virhettä arvioitaessa on käytettävä Markovin ketjujen keskirajalausetta .

Nämä algoritmit luovat Markovin ketjuja, joiden tasapainojakauma on verrannollinen annettuun funktioon.

Korrelaation lasku

MCMC-menetelmät ratkaisevat moniulotteisia ongelmia paremmin kuin Monte Carlo -algoritmit, mutta dimensioiden määrän kasvaessa ne alkavat kärsiä myös " ulottuvuuksien kirouksesta ". Suuren todennäköisyyden alueet pyrkivät venymään ja katoamaan kasvavaan tilaan, jolla on vain vähän vaikutusta integraalin arvoon. Tämä ongelma voidaan ratkaista vähentämällä kävelyaskelta, jotta se ei mene suuren todennäköisyyden alueen ulkopuolelle. Tällainen ratkaisu on kuitenkin melko pitkä (tarkan tuloksen saavuttaminen vaatii monia vaiheita) ja johtaa korkeaan autokorrelaatioon. Kehittyneemmät algoritmit, kuten Hamiltonin Monte Carlo- ja Wang-Landau-algoritmit , käyttävät erilaisia ​​tapoja vähentää autokorrelaatiota pitämällä vaellusprosessia alueilla, joilla on suurin vaikutus integraalin arvoon. Nämä algoritmit ovat paljon monimutkaisempia sekä teorian, johon ne luottavat, että sovelluksen kannalta, mutta ne konvergoivat nopeammin.

Esimerkkejä

Satunnainen kävely

Vuorovaikutteisten hiukkasten menetelmät

Vuorovaikutteiset MSMS-metodologiat ovat luokka keskimääräisiä hiukkasmenetelmiä, joilla saadaan näytteitä näennäissatunnaisista luvuista todennäköisyysjakaumien sarjasta, jossa näytteenoton monimutkaisuus kasvaa [13] .

Nämä todennäköisyysmallit sisältävät:

Yleensä mistä tahansa MCMC-näytteenottimesta voidaan tehdä interaktiivisia. Näitä puolestaan ​​voidaan käyttää tapana ajaa säännöllisten näytteenottolaitteiden sarja rinnakkain. Esimerkiksi interaktiiviset simulointihehkutusalgoritmit perustuvat itsenäisiin Metropolis-Hastingsin liikkeisiin, jotka vuorovaikuttavat peräkkäin valikoivan uudelleennäytteenottomekanismin kanssa. Toisin kuin klassisissa MCMC-menetelmissä, tässä interaktiivisten näytteenottolaitteiden tarkkuusparametri riippuu vain niiden lukumäärästä. Vuorovaikutteiset hiukkasmenetelmät kuuluvat Feynman-Katzin hiukkasmallien luokkaan [14] [15] , jota kutsutaan Bayesin päättelyteoriassa ja signaalinkäsittelyssä myös "peräkkäisiksi Monte Carloksi" tai "hiukkassuodatusmenetelmiksi" [16] . Vuorovaikutteiset MSMS-menetelmät voidaan ymmärtää myös geneettisen hiukkasalgoritmin sykleinä, joissa on mutaatioita klassisten MSMS-mutaatioiden muodossa.

Markov Chain Quasi-Monte Carlo (MCQMC) [17] [18]

Pienten eroavaisuuksien käytöllä satunnaislukujen sijasta yksinkertaisessa riippumattomassa Monte Carlo -näytteenotossa on selviä etuja [19] . Tällaista korvaamista käytetään kvasi-Monte Carlo ( QMC ) -menetelmässä [20] . Coxma-Hlavka-epäyhtälön mukaan tässä menetelmässä integrointivirhe on paljon pienempi kuin otostettaessa riippumattomia identtisesti jakautuneita satunnaismuuttujia (IID). Tämä mahdollistaa sekä estimointivirheen että konvergenssiajan pienentämisen suuruusluokkaa.

Array-RQMC-menetelmä ottaa käyttöön QMC-pohjaisen Markov-ketjumallinnuksen simuloimalla ketjuja samanaikaisesti. Kussakin vaiheessa näiden tilojen empiirinen jakauma antaa tarkemman approksimation jakautumisfunktiolle kuin käytettäessä MCMC:tä [21] . Empiirisissa kokeissa keskimääräisen tilafunktion varianssin konvergenssilla on joskus luokkaa tai jopa nopeampi nopeus kuin Monte Carlon menetelmässä [22] .

Lähentyminen

Markov-ketjun rakentaminen vaadituilla ominaisuuksilla ei yleensä ole vaikeaa. On vaikeampi määrittää, kuinka monta askelta tarvitaan konvergoimaan stationaariseen jakaumaan, jossa on hyväksyttävä virhe [23] . Hyvällä ketjulla on sekoitusominaisuus: kiinteä jakelu saavutetaan nopeasti mihin tahansa aloitusasentoon. Klassinen empiirinen menetelmä konvergenssin saavuttamiseksi on ajaa useita itsenäisesti mallinnettuja Markov-ketjuja ja tarkistaa, että varianssit ketjun ulkopuolella ja sisällä ovat suunnilleen yhtä suuret [23] [24] .

Tyypillisesti MCMC-näytteenotto voi vain arvioida kohdejakaumaa, koska lähtöpaikalla on aina jäännösvaikutus. Monimutkaisemmat MCMC-pohjaiset algoritmit, kuten kytkentä menneisyydestä, voivat vastaanottaa tarkkoja näytteitä, mikä vaikuttaa laskelmien määrään ja käytettyyn aikaan.

Monet Monte Carlon satunnaiskävelymenetelmät liikkuvat pienin askelin, alkaen tasapainojakaumasta, jolla ei ole taipumusta polttaa yhteen suuntaan. Näitä menetelmiä on helppo soveltaa ja analysoida, mutta koko tilan tutkiminen kävelyllä vie kauan (vaeltaminen palaa usein jo läpikäydyille alueille).

Muita konvergenssinäkökohtia sisältyy Markovin ketjujen keskirajalauseeseen, katso [25] , jossa käsitellään Metropolis-Hastings-algoritmin konvergenssiin ja stationaarisuuteen liittyvää teoriaa.

Ohjelmisto

Ohjelmisto MSMS-näytteenottoa varten:

Muistiinpanot

Lainaukset

  1. Kasim, M.F.; Bott, A.F.A.; Tzeferacos, P.; lammas, DQ; Gregori, G.; Vinko, SM Kenttien haku protoniradiografiasta ilman lähdeprofiileja  (englanniksi)  // Physical Review E  : journal. - 2019. - syyskuu ( osa 100 ). - doi : 10.1103/PhysRevE.100.033208 . - arXiv : 1905.12934 .
  2. Gupta, Ankur; Rawlings, James B. Parametrien arviointimenetelmien vertailu stokastisissa kemiallisissa kineettisissa malleissa: Esimerkkejä järjestelmäbiologiasta  //  AIChE Journal : Journal. - 2014. - huhtikuu ( osa 60 , nro 4 ). - s. 1253-1268 . - doi : 10.1002/aic.14409 . — PMID 27429455 .
  3. Katso Gill 2008.
  4. Katso Robert & Casella 2004.
  5. Banerjee, Sudipto; Carlin, Bradley P.; Gelfand, Alan P. Hierarchical Modeling and Analysis for Spatial Data  . — Toiseksi. - CRC Press , 2014. - P. xix. — ISBN 978-1-4398-1917-3 .
  6. Gilks, WR; Wild, P. Adaptive Rejection Sampling for Gibbs Sampling  //  Journal of the Royal Statistical Society. C-sarja (soveltuvat tilastot) : päiväkirja. - 1992. - 1. tammikuuta ( osa 41 , nro 2 ) . - s. 337-348 . - doi : 10.2307/2347565 . — .
  7. Gilks, WR; Parasta, NG; Tan, KKC Adaptive Rejection Metropolis Sampling sisällä Gibbs Sampling  //  Journal of the Royal Statistical Society. C-sarja (soveltuvat tilastot) : päiväkirja. - 1995. - 1. tammikuuta ( nide 44 , nro 4 ). - s. 455-472 . - doi : 10.2307/2986138 . — .
  8. Martino, L.; Lue, J.; Luengo, D. Riippumaton kaksinkertaisesti mukautuva hylkäys Metropolis-näytteenotto Gibbs-näytteenotossa  // IEEE  Transactions on Signal Processing : päiväkirja. - 2015. - 1. kesäkuuta ( nide 63 , nro 12 ). - s. 3123-3138 . — ISSN 1053-587X . - doi : 10.1109/TSP.2015.2420537 . - . - arXiv : 1205.5494 .
  9. Katso Stramer 1999.
  10. Liu, Jun S.; Liang, Faming; Wong, Wing Hung. Multiple-Try Method and Local Optimization in Metropolis Sampling  //  Journal of the American Statistical Association  : Journal. - 2000. - 1. maaliskuuta ( nide 95 , nro 449 ). - s. 121-134 . — ISSN 0162-1459 . - doi : 10.1080/01621459.2000.10473908 .
  11. Martino, Luca; Lue, Jesse. Useiden kokeilevien Metropolis-järjestelmien suunnittelun joustavuudesta  //  Computational Statistics : päiväkirja. - 2013. - 11. heinäkuuta ( nide 28 , nro 6 ). - P. 2797-2823 . — ISSN 0943-4062 . - doi : 10.1007/s00180-013-0429-2 . - arXiv : 1201.0646 .
  12. Katso Green 1995.
  13. Del Moral, Pierre. Keskimääräinen kenttäsimulaatio Monte Carlo -integraatiolle  . - Chapman & Hall/CRC Press, 2013. - S. 626. . - Monografiat tilastoista ja sovelletusta todennäköisyydestä.
  14. Del Moral, Pierre. Feynman-Kacin kaava. Genealogiset ja vuorovaikuttavat hiukkasten  approksimaatiot . - Springer, 2004. - s. 575. . - "Sarja: Todennäköisyys ja sovellukset".
  15. Del Moral, Pierre; Miclo, Laurent. Séminaire de Probabilités XXXIV / Jacques Azéma, Michel Ledoux, Michel Émery, Marc Yor. - 2000. - T. 1729. - S. 1-145. — (Matematiikan luentomuistiinpanot). — ISBN 978-3-540-67314-9 . - doi : 10.1007/bfb0103798 .
  16. Del Moral, Pierre. Peräkkäiset Monte Carlon näytteenottimet - P. Del Moral - A. Doucet - A. Jasra - 2006 - Royal Statistical Societyn lehti: B-sarja (tilastollinen metodologia) - Wiley Online Library  (englanniksi)  // Royal Statistical Societyn lehti. Sarja B (tilastollinen metodologia) : päiväkirja. - 2006. - Voi. 68 , no. 3 . - s. 411-436 . doi : 10.1111 / j.1467-9868.2006.00553.x . - arXiv : cond-mat/0212648 .
  17. Chen, S.; Dick, Joseph; Owen, Art B. Markov-ketjun kvasi-Monte Carlon johdonmukaisuus jatkuvilla tilaavaruuksilla  (englanniksi)  // Annals of Statistics : päiväkirja. - 2011. - Voi. 39 , ei. 2 . - s. 673-701 . - doi : 10.1214/10-AOS831 .
  18. Tribble, Seth D. (2007). Markovin ketju Monte Carlo -algoritmit, joissa käytetään täysin tasaisesti jakautuneita ajojaksoja (diss.). Stanfordin yliopisto. Malli: ProQuest .
  19. Papageorgiou, Anargyros; Traub, JF Voittaa Monte Carlon // Riski. - 1996. - T. 9 , nro 6 . - S. 63-65 .
  20. Sobol, Ilya M. Kvasi-Monte Carlo -integraatioista // Mathematics and Computers in Simulation. - 1998. - T. 47 , nro 2 . - S. 103-112 . - doi : 10.1016/s0378-4754(98)00096-2 .
  21. L'Ecuyer, P.; Lecot, C.; Tuffin, B. Satunnaistettu kvasi-Monte Carlo -simulaatiomenetelmä Markovin  ketjuille  // Operaatiotutkimus : päiväkirja. - 2008. - Voi. 56 , nro. 4 . - s. 958-975 . doi : 10.1287 / opre.1080.0556 .
  22. L'Ecuyer, P.; Munger, D.; Lecot, C.; Tuffin, B. Array-RQMC:n lajittelumenetelmät ja lähentymisnopeudet: Jotkut empiiriset vertailut  //  Mathematics and Computers in Simulation : Journal. - 2018. - Vol. 143 . - s. 191-201 . - doi : 10.1016/j.matcom.2016.07.010 .
  23. 1 2 Gelman, A.; Rubin, DB Päätelmä iteratiivisesta simulaatiosta useiden sekvenssien avulla (keskustelun kanssa  )  // Tilastotiede : päiväkirja. - 1992. - Voi. 7 , ei. 4 . - s. 457-511 . - doi : 10.1214/ss/1177011136 . - .
  24. Cowles, M.K.; Carlin, BP Markov-ketju Monte Carlon konvergenssidiagnostiikka: vertaileva katsaus  //  Journal of the American Statistical Association  : Journal. - 1996. - Voi. 91 , ei. 434 . - s. 883-904 . - doi : 10.1080/01621459.1996.10476956 .
  25. Hill, SD; Spall, JC Stationarity and Convergence of the Metropoli-Hastings Algorithm: Insights into Theoretical Aspects  //  IEEE Control Systems Magazine : aikakauslehti. - 2019. - Vol. 39 , ei. 1 . - s. 56-67 . - doi : 10.1109/MCS.2018.2876959 .
  26. Azad, A; Pavlopoulos, G.A.; Ouzounis, CA; Kyrpides, N.C.; Buluç, A. HipMCL: Markovin klusterointialgoritmin tehokas rinnakkaistoteutus suuria verkkoja varten  //  Nucleic Acids Research : päiväkirja. - 2018. - 6. huhtikuuta ( nide 46 , nro 6 ). -P.e33 . _ doi : 10.1093 / nar/gkx1313 . — PMID 29315405 .

Lähteet

Kirjallisuus

Linkit