Ohjattu oppiminen on yksi koneoppimisen menetelmistä , jonka aikana testattava järjestelmä pakotetaan oppimaan ärsyke-vaste-esimerkkien avulla. Kybernetiikan näkökulmasta se on yksi kyberneettisen kokeilun tyypeistä . Tulojen ja referenssilähtöjen välillä voi olla jokin yhteys (ärsyke-vaste), mutta tätä ei tiedetä. Tunnetaan vain rajallinen joukko ennakkotapauksia - "ärsyke-vaste" -pareja, joita kutsutaan harjoitusnäytteeksi. Näiden tietojen perusteella on tarpeen palauttaa riippuvuus (rakentaa ennustukseen sopiva ärsyke-vaste-suhteiden malli), eli rakentaa algoritmi, joka pystyy antamaan melko tarkan vastauksen mille tahansa objektille. Vastausten tarkkuuden mittaamiseksi sekä esimerkein oppimisessa voidaan ottaa käyttöön laatufunktio .
Tämä kokeilu on erityinen tapaus kyberneettistä palautetta sisältävästä kokeilusta. Tämän kokeen järjestäminen edellyttää kokeellisen järjestelmän, koulutusmenetelmän ja menetelmän järjestelmän testaamiseksi tai ominaisuuksien mittaamiseksi.
Kokeellinen järjestelmä puolestaan koostuu testatusta (käytetystä) järjestelmästä, ulkoisesta ympäristöstä vastaanotettujen ärsykkeiden tilasta ja vahvistusohjausjärjestelmästä (sisäisten parametrien säätäjä). Vahvistuksen ohjausjärjestelmänä voidaan käyttää automaattista ohjauslaitetta (esim. termostaattia) tai ihmisoperaattoria (opettaja), joka pystyy reagoimaan testattavan järjestelmän reaktioihin ja ympäristön ärsykkeisiin erityisillä tilaa muuttavilla vahvistussäännöillä. järjestelmän muistista.
Vaihtoehtoja on kaksi: (1) kun testattavan järjestelmän vaste ei muuta ympäristön tilaa ja (2) kun järjestelmän vaste muuttaa ympäristön ärsykkeitä. Nämä kaaviot osoittavat tällaisen yleisen järjestelmän perustavanlaatuisen samankaltaisuuden biologisen hermoston kanssa.
Tämä ero mahdollistaa syvemmän tarkastelun eri oppimistapojen eroista, sillä raja ohjatun ja ohjaamattoman oppimisen välillä on hienovaraisempi. Lisäksi tällainen ero mahdollisti tiettyjen rajoitusten osoittamisen keinotekoisille hermoverkoille S- ja R-ohjatuille järjestelmille (katso Perceptron Convergence Theorem ).
Koneoppiminen ja tiedon louhinta | |
---|---|
Tehtävät | |
Opettajan kanssa oppimista | |
ryhmäanalyysi | |
Mittasuhteiden vähentäminen | |
Rakenteellinen ennustaminen | |
Anomalian havaitseminen | |
Piirrä todennäköisyysmallit | |
Neuroverkot | |
Vahvistusoppiminen |
|
Teoria | |
Lehdet ja konferenssit |
|