Näytteenotto on matemaattisessa tilastossa yleistetty nimitys menetelmille, joilla ohjataan alkuperäistä otosta tunnetulla mallinnustavoitteella, joka mahdollistaa stationaarisen ergodisen satunnaisprosessin parhaan tilastollisen mallin rakenteellisen parametrisen tunnistamisen.
Otantamenetelmän tieteellinen uutuus piilee siinä, että se on tehokas tekniikka näytteen tilastollisten ominaisuuksien ja mallinnuksen tarkoituksen loogiseen semanttiseen yhdistämiseen. Samalla otanta lisää kriteeriavaruuden ulottuvuutta ja toimii samalla keinona ratkaista Pareto-optimaalisuuden ongelma erottamalla tietyt kriteerit ja asettamalla ne paremmuusjärjestykseen (rakenteellisella kriteerillä on korkeampi arvo kuin parametrisella , joten nämä kriteerit eivät ole ristiriidassa). N. N. Chubukov antaa seuraavan esimerkin [1] . Esitetään satunnainen prosessi otoksena, jonka koko on : . Kolme tehtävää on ratkaistava:
Jos otamme mallinnuksen perinteisen lähestymistavan, joka keskittyy prosessin tilastollisten ominaisuuksien kuvauksen ainutlaatuisuuteen, tuloksena on kolme täysin identtistä funktiota. Tosiasia on, että mallin laatukriteerin laskentasäännössä ei otettu huomioon olennaisia yksityiskohtia: ennustehorisonttia, otantatietojen edustaman satunnaisen prosessin tilastollisten trendien luonnetta ja tehtävien tavoitespesifisyyttä. huomiotta jätetty .
Pääsy tästä vaikeudesta voi olla diversiteetin periaatteen käyttö näytteenotossa , joka tunnetaan ja jota käytetään ratkaisemaan teknisiä ongelmia soveltamalla tietojen ristiinvalidointimenetelmää, esimerkiksi bootstrap-analyysiä [2] , menetelmää argumenttien ryhmälaskenta [3] jne. Monimuotoisuuden periaatteen ilmentymä tilastollisten ongelmien ratkaisemisessa on se, että algoritmi reagoi tietämättömyyteen lähtötietojen todennäköisyysominaisuuksista erilaisilla generoiduilla mallirakenteilla, joista jokainen altistetaan ristiin -optimaalisuuden tarkistaminen tietyn kaikille malleille yhteisen kaavion mukaan.
Otanta on moderni menetelmä, joka voi olla käytännössä hyödyllinen matemaattisten tilastojen ongelmien ratkaisemisessa, mukaan lukien käänteiset ja huonosti asetetut ongelmat [4] . Otanta toteuttaa monimuotoisuuden periaatetta ja voi yleistää koko valikoiman tilastollisen analyysin työkaluja lähdetietojen hallintaan perustuen. Näytteenotto ymmärretään sarjana tekniikoita, joilla alkuperäinen näyte jaetaan työ- ja ohjausosiin mallinnuksen tavoitteita vastaavien sääntöjen mukaisesti. Työosissa lasketaan "kilpailevien" mallien parametrit, kontrollimalleissa arvioidaan niiden kyky palauttaa arvot, joita ei käytetty parametrien laskemiseen.
Näytteenotto menetelmällisesti oikein "ohittaa" pääesteen, joka objektiivisesti esiintyy käänteisongelmissa. Syynä on mahdottomuus muodostaa tiukkaa matemaattista suhdetta muuttujan parametrin ja mallin optimaalisuuskriteerin numeerisen arvon välille. Samalla otanta siirtää mallin rakenneparametrisen tunnistamisen algoritmin tiukasti matemaattisen kategoriasta heuristiikan luokkaan ja tekee siitä lupaavan tekoälyjärjestelmien luomiseen .
Suhteessa yllä olevaan esimerkkiin ensimmäinen tapaus - "pitkä" ekstrapolointi näytteen ulkopuolella vastaa näytteenottovarianttia siten, että peräkkäiset kymmenen viimeistä näytearvoa jätetään pois malliparametrien laskennasta. Kymmenes lasku on kontrolli. Työskentelyalanäyte sisältää kaikki arvot paitsi tätä kymmentä. Vaihtoehtoisella laskennalla määritetään sitten paras malli, joka tarkimmin ennusti kontrollipisteen. Muuttamalla pois jätettyjen näytteiden paikkaa, rikkomatta niiden määrää ja jatkuvuutta, muodostuu jäännöstilastot, jotka ovat sovellettavissa laskemaan kriteerin ja tilastollisen stabiilisuuden "putken" tuloksen luotettavuuden arvioimiseksi. Algoritmi ikään kuin "tutkii" malleja ekstrapoloimalla tiettyyn syvyyteen ja valitsee niistä sen, joka kaappaa tarkimmin "pitkät" trendit, jotka sisältävät tietoa arvoista kymmenen otoksen viiveellä. Tässä tapauksessa "short-shooting" -malleja syrjitään.
Toinen tehtävä vastaa näytteenottoa, jossa yksi kontrollipiste jätetään pois laskelmista, ja aiempien arvojen lukumäärän ja järjestyksen yhdistelmä otetaan huomioon ennusteessa. Tässä tapauksessa "pitkän trendin" mallit "suljetaan", ja mallit, jotka antavat tarkkoja lähiajan ennusteita, päinvastoin, ovat etusijalla.
Kolmannessa tehtävässä näytteen jakaminen tunkeutuviin lohkoihin perustellaan, kun kontrolliarvot "hajallaan" työntekijöiden välillä. Tällaisten lohkojen pituudessa ja niiden tunkeutumisen syvyydessä on otettava huomioon alueen naapuripisteiden väliset etäisyydet, tarvittava vakaus ja arvioiden tarkkuus. Siten kolmas tehtävä voi vastata joka kolmannen näytenäytteen poissulkemista laskelmista ja poissuljettujen tietojen käyttöä kontrolliin kontrolli- ja työosanäytteiden syklisellä uudelleenmäärityksellä.
![]() | |
---|---|
Bibliografisissa luetteloissa |
|