Esimerkeistä oppiminen on oppimisen tyyppi, jossa älyllinen järjestelmä esitetään joukolla positiivisia ja negatiivisia esimerkkejä, jotka liittyvät johonkin aiemmin tuntemattomaan säännönmukaisuuteen. Älykkäissä järjestelmissä kehitetään päätössääntöjä, joiden avulla esimerkkijoukko jaetaan positiivisiin ja negatiivisiin. Erottamisen laatu tarkastetaan yleensä esimerkkinäytteen avulla. [yksi]
Antaa olla joukko kuvauksia esineistä, olla joukko kelvollisia vastauksia. On olemassa tuntematon kohderiippuvuus - kartoitus , jonka arvot tunnetaan vain lopullisen harjoitusnäytteen kohteista . On tarpeen rakentaa algoritmi , joka approksimoi tuntemattoman kohteen riippuvuuden sekä näytteen elementeistä että koko joukosta .
He sanovat myös, että algoritmin on kyettävä yleistämään empiirisiä tosiasioita tai johtamaan yleistä tietoa ( säännöllisyys , riippuvuus ) tietyistä tosiseikoista (havainnoista, ennakkotapauksista).
Otetaan käyttöön häviöfunktio , joka kuvaa vastauksen poikkeamaa oikeasta vastauksesta mielivaltaisessa objektissa .
Tyypillinen häviöfunktion valinta:
Esitetään laatufunktio , joka kuvaa algoritmin keskimääräistä virhettä ( empiiristä riskiä ) mielivaltaisessa otoksessa
Empiirinen riskien minimointimenetelmä on yksi yleisimmistä lähestymistavoista algoritmien oppimiseen ennakkotapauksista. Se koostuu algoritmin löytämisestä annetusta algoritmimallista , joka minimoi harjoitusjoukon keskimääräisen virheen:
Siten oppimisongelma rajoittuu optimointiin ja voidaan ratkaista numeerisilla optimointimenetelmillä .
Laatufunktion pieni arvo opetusnäytteessä ei takaa, että muodostettu algoritmi palauttaa hyvin kohderiippuvuuden koko tilasta . Ylisovituksen tai ylisovituksen vaara on olemassa, kun tiettyä dataa yritetään kuvata tarkemmin kuin datan melutaso ja itse mallin virhe periaatteessa sallivat.
On helppo antaa esimerkki algoritmista, joka minimoi empiirisen riskin nollaan, mutta jolla ei ole yleistyskykyä. Saatuaan harjoitusnäytteen se muistaa sen ja vertaa sitten esitettyä objektia osoitteen harjoitusobjekteihin . Jos osuma, algoritmi antaa oikean vastauksen . Muussa tapauksessa annetaan mielivaltainen vastaus. Empiirinen riski ottaa pienimmän mahdollisen arvon, joka on yhtä suuri kuin nolla. Tämä algoritmi ei kuitenkaan pysty palauttamaan riippuvuutta oppimisobjektien ulkopuolella. Tämä esimerkki osoittaa vakuuttavasti, että onnistuneen oppimisen kannalta on välttämätöntä paitsi muistaa myös yleistää.
Melkein kaikissa menetelmissä pyritään erityisesti välttämään yliasennusta. Empiirisen riskien minimointimenetelmän sovellettavuuden rajoja ja ylisovitusongelmaa tutkitaan tilastollisessa oppimisteoriassa .
Merkki on kartoitus , jossa on joukko merkin sallittuja arvoja. Jos piirteet on annettu , niin vektoria kutsutaan objektin piirrekuvaukseksi . Ohjeelliset kuvaukset voidaan tunnistaa itse esineistä. Tässä tapauksessa joukkoa kutsutaan ominaisuusavaruudeksi .
Sarjasta riippuen kyltit jaetaan seuraaviin tyyppeihin:
Usein on sovellettavia ongelmia erityyppisillä ominaisuuksilla, kaikki menetelmät eivät sovellu niiden ratkaisemiseen.
Alustavat tiedot esitetään suuntaa-antavien kuvausten muodossa. Joidenkin kohteiden joidenkin ominaisuuksien arvot saattavat puuttua. Tällaisia tapauksia tulee usein vastaan käytännössä. Esimerkiksi kokeen suorittaja ei välttämättä tallenna havainnon tulosta; vastaaja voi kieltäytyä vastaamasta kyselylomakkeen kysymykseen; potilas ei välttämättä läpäise tämäntyyppistä tutkimusta; jne. Monet data-analyysimenetelmät edellyttävät kuitenkin, että ominaisuuskuvausten syöttömatriisi täytetään kokonaan. Seuraavaa lähestymistapaa käytetään usein puuttuvien arvojen täyttämiseen. Kun tätä ominaisuutta pidetään kohteena, rakennetaan algoritmi, joka ennustaa sen arvon muista ominaisuuksista riippuen. Puuttuvat arvot täytetään ennusteilla. Tämä toiminto suoritetaan kaikilla ominaisuuksilla, joista puuttuu arvoja.
Jos etumerkki on kvantitatiivinen, käytetään regression palautusmenetelmiä , jos etumerkki on laadullinen ( nimellinen ), luokitusmenetelmiä .