Esimerkillä oppiminen

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 19. toukokuuta 2019 tarkistetusta versiosta . tarkastukset vaativat 4 muokkausta .

Esimerkeistä oppiminen on oppimisen tyyppi, jossa älyllinen järjestelmä esitetään joukolla positiivisia ja negatiivisia esimerkkejä, jotka liittyvät johonkin aiemmin tuntemattomaan säännönmukaisuuteen. Älykkäissä järjestelmissä kehitetään päätössääntöjä, joiden avulla esimerkkijoukko jaetaan positiivisiin ja negatiivisiin. Erottamisen laatu tarkastetaan yleensä esimerkkinäytteen avulla. [yksi]

Matemaattinen formalisointi

Antaa olla joukko kuvauksia esineistä, olla joukko kelvollisia vastauksia. On olemassa tuntematon kohderiippuvuus - kartoitus , jonka arvot tunnetaan vain lopullisen harjoitusnäytteen kohteista . On tarpeen rakentaa algoritmi , joka approksimoi tuntemattoman kohteen riippuvuuden sekä näytteen elementeistä että koko joukosta . $X$ $Y$ $y^{{*}}\kaksoispiste X\Y:ksi$ $X^{m}=\{(x_{1},y_{1}),\dots ,(x_{m},y_{m})\}$ $a\kaksoispiste X\Y:ksi$ $X$

He sanovat myös, että algoritmin on kyettävä yleistämään empiirisiä tosiasioita tai johtamaan yleistä tietoa ( säännöllisyys , riippuvuus ) tietyistä tosiseikoista (havainnoista, ennakkotapauksista).

Häviöfunktiot ja laatufunktiot

Otetaan käyttöön häviöfunktio , joka kuvaa vastauksen poikkeamaa oikeasta vastauksesta mielivaltaisessa objektissa . ${{\mathcal L}}(y,y')$ $y=a(x)$ $y'=y^{*}(x)$ $x\in X$

Tyypillinen häviöfunktion valinta:

Luokitteluongelmissa ; ${\mathcal {L}}(y,y')=[y'\neq y]$
regressio-ongelmissa . ${\mathcal {L}}(y,y')=(y'-y)^{2}$

Esitetään laatufunktio , joka kuvaa algoritmin keskimääräistä virhettä ( empiiristä riskiä ) mielivaltaisessa otoksessa $a$ ${\näyttötyyli X^{m))$

Q(a,X^{m})={\frac {1}{m}}\sum _{{i=1}}^{m}{{\mathcal L}}(a(x_{i}) ,y^{{*}}(x_{i})).

Empiirinen riskien minimointimenetelmä on yksi yleisimmistä lähestymistavoista algoritmien oppimiseen ennakkotapauksista. Se koostuu algoritmin löytämisestä annetusta algoritmimallista , joka minimoi harjoitusjoukon keskimääräisen virheen: $A=\{a\kaksoispiste X\Y:ksi\}$

a={\mathrm {arg}}\min _{{a\in A}}Q(a,X^{m}).

Siten oppimisongelma rajoittuu optimointiin ja voidaan ratkaista numeerisilla optimointimenetelmillä .

Yleistävä kyky ja ylisovitusongelma

Laatufunktion pieni arvo opetusnäytteessä ei takaa, että muodostettu algoritmi palauttaa hyvin kohderiippuvuuden koko tilasta . Ylisovituksen tai ylisovituksen vaara on olemassa, kun tiettyä dataa yritetään kuvata tarkemmin kuin datan melutaso ja itse mallin virhe periaatteessa sallivat. $X$

On helppo antaa esimerkki algoritmista, joka minimoi empiirisen riskin nollaan, mutta jolla ei ole yleistyskykyä. Saatuaan harjoitusnäytteen se muistaa sen ja vertaa sitten esitettyä objektia osoitteen harjoitusobjekteihin . Jos osuma, algoritmi antaa oikean vastauksen . Muussa tapauksessa annetaan mielivaltainen vastaus. Empiirinen riski ottaa pienimmän mahdollisen arvon, joka on yhtä suuri kuin nolla. Tämä algoritmi ei kuitenkaan pysty palauttamaan riippuvuutta oppimisobjektien ulkopuolella. Tämä esimerkki osoittaa vakuuttavasti, että onnistuneen oppimisen kannalta on välttämätöntä paitsi muistaa myös yleistää. ${\näyttötyyli X^{m))$ $x$ $x_{i}$ ${\näyttötyyli X^{m))$ ${\näyttötyyli x=x_{i))$ $y_{i}$

Melkein kaikissa menetelmissä pyritään erityisesti välttämään yliasennusta. Empiirisen riskien minimointimenetelmän sovellettavuuden rajoja ja ylisovitusongelmaa tutkitaan tilastollisessa oppimisteoriassa .

Ominaisuustila

Merkki on kartoitus , jossa on joukko merkin sallittuja arvoja. Jos piirteet on annettu , niin vektoria kutsutaan objektin piirrekuvaukseksi . Ohjeelliset kuvaukset voidaan tunnistaa itse esineistä. Tässä tapauksessa joukkoa kutsutaan ominaisuusavaruudeksi . ${\displaystyle f\colon X\to D_{f))$ $D_f$ ${\displaystyle f_{1},\dots ,f_{n))$ ${{\mathbf x}}=(f_{1}(x),\pisteet ,f_{n}(x))$ $x\in X$ $X=D_{{f_{1}}}\kertaa \pistettä \kertaa D_{{f_{n}}}$

Sarjasta riippuen kyltit jaetaan seuraaviin tyyppeihin: $D_f$

binäärimerkki : ; $D_{f}=\{0,1\}$
nimellinen attribuutti: - äärellinen joukko ; $D_f$
järjestysmäärite : - äärellinen järjestysjoukko; $D_f$
määrällinen etumerkki: - joukko reaalilukuja . $D_f$

Usein on sovellettavia ongelmia erityyppisillä ominaisuuksilla, kaikki menetelmät eivät sovellu niiden ratkaisemiseen.

Ratkaistavat tehtävät

Tehtävä täyttää puuttuvat tiedot

Alustavat tiedot esitetään suuntaa-antavien kuvausten muodossa. Joidenkin kohteiden joidenkin ominaisuuksien arvot saattavat puuttua. Tällaisia tapauksia tulee usein vastaan käytännössä. Esimerkiksi kokeen suorittaja ei välttämättä tallenna havainnon tulosta; vastaaja voi kieltäytyä vastaamasta kyselylomakkeen kysymykseen; potilas ei välttämättä läpäise tämäntyyppistä tutkimusta; jne. Monet data-analyysimenetelmät edellyttävät kuitenkin, että ominaisuuskuvausten syöttömatriisi täytetään kokonaan. Seuraavaa lähestymistapaa käytetään usein puuttuvien arvojen täyttämiseen. Kun tätä ominaisuutta pidetään kohteena, rakennetaan algoritmi, joka ennustaa sen arvon muista ominaisuuksista riippuen. Puuttuvat arvot täytetään ennusteilla. Tämä toiminto suoritetaan kaikilla ominaisuuksilla, joista puuttuu arvoja.

Jos etumerkki on kvantitatiivinen, käytetään regression palautusmenetelmiä , jos etumerkki on laadullinen ( nimellinen ), luokitusmenetelmiä .

Algoritmit

Muistiinpanot

↑ A. N. Averkin, M. G. Gaaze-Rapoport , D. A. Pospelov "Keinoälyn selittävä sanakirja" [1] Arkistokopio päivätty 5. toukokuuta 2010 Wayback Machinessa

Kirjallisuus

Ayvazyan S. A., Enyukov I. S., Meshalkin L. D. Sovellettu tilasto : mallinnuksen perusteet ja ensisijaiset tietojenkäsittelyt. - M .: Rahoitus ja tilastot, 1983.
Ayvazyan S. A., Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: riippuvuuksien tutkimus. - M .: Rahoitus ja tilastot, 1985.
Ayvazyan S. A., Buchstaber V. M., Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: luokittelu ja ulottuvuuden vähentäminen . - M .: Talous ja tilastot, 1989.
Vapnik VN Riippuvuuksien rekonstruktio empiiristen tietojen perusteella. - M.: Nauka, 1979.
Zhuravlev Yu. I., Ryazanov V. V., Senko O. V. "Tunnustus". Matemaattiset menetelmät. Ohjelmistojärjestelmä. Käytännön sovellukset. — M.: Fazis, 2006. ISBN 5-7036-0108-8 .
Zagoruiko NG Sovellettavat menetelmät datan ja tiedon analysointiin. - Novosibirsk : IM SO RAN, 1999. ISBN 5-86134-060-9 .
Shlesinger M., Glavach V. Kymmenen luentoa tilastollisesta ja rakenteellisesta tunnistamisesta. - Kiev : Naukova Dumka , 2004. ISBN 966-00-0341-2 .
Hastie, T., Tibshirani R., Friedman J. Tilastollisen oppimisen elementit: tiedon louhinta, päättely ja ennustaminen . – 2. painos - Springer-Verlag, 2009. - 746 s. - ISBN 978-0-387-84857-0 . .
Mitchell T. Koneoppiminen. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7 .

Linkit

www.MachineLearning.ru on ammattimainen wiki-resurssi, joka on omistettu koneoppimiseen ja tiedon louhintaan