Opettajan kanssa oppimista

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 12.4.2020 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Ohjattu oppiminen on yksi koneoppimisen menetelmistä  , jonka aikana testattava järjestelmä pakotetaan oppimaan ärsyke-vaste-esimerkkien avulla. Kybernetiikan näkökulmasta se on yksi kyberneettisen kokeilun tyypeistä . Tulojen ja referenssilähtöjen välillä voi olla jokin yhteys (ärsyke-vaste), mutta tätä ei tiedetä.  Tunnetaan vain rajallinen joukko ennakkotapauksia - "ärsyke-vaste" -pareja, joita kutsutaan harjoitusnäytteeksi. Näiden tietojen perusteella on tarpeen palauttaa riippuvuus (rakentaa ennustukseen sopiva ärsyke-vaste-suhteiden malli), eli rakentaa algoritmi, joka pystyy antamaan melko tarkan vastauksen mille tahansa objektille. Vastausten tarkkuuden mittaamiseksi sekä esimerkein oppimisessa voidaan ottaa käyttöön laatufunktio .

Tämän kokeilun perustamisperiaate

Tämä kokeilu on erityinen tapaus kyberneettistä palautetta sisältävästä kokeilusta. Tämän kokeen järjestäminen edellyttää kokeellisen järjestelmän, koulutusmenetelmän ja menetelmän järjestelmän testaamiseksi tai ominaisuuksien mittaamiseksi.

Kokeellinen järjestelmä puolestaan ​​koostuu testatusta (käytetystä) järjestelmästä, ulkoisesta ympäristöstä vastaanotettujen ärsykkeiden tilasta ja vahvistusohjausjärjestelmästä (sisäisten parametrien säätäjä). Vahvistuksen ohjausjärjestelmänä voidaan käyttää automaattista ohjauslaitetta (esim. termostaattia) tai ihmisoperaattoria (opettaja), joka pystyy reagoimaan testattavan järjestelmän reaktioihin ja ympäristön ärsykkeisiin erityisillä tilaa muuttavilla vahvistussäännöillä. järjestelmän muistista.

Vaihtoehtoja on kaksi: (1) kun testattavan järjestelmän vaste ei muuta ympäristön tilaa ja (2) kun järjestelmän vaste muuttaa ympäristön ärsykkeitä. Nämä kaaviot osoittavat tällaisen yleisen järjestelmän perustavanlaatuisen samankaltaisuuden biologisen hermoston kanssa.

Ohjattujen oppimistehtävien typologia

Syötetietotyypit

Vastaustyypit

Degeneroidut vahvistusohjausjärjestelmien tyypit ("opettajat")

Tämä ero mahdollistaa syvemmän tarkastelun eri oppimistapojen eroista, sillä raja ohjatun ja ohjaamattoman oppimisen välillä on hienovaraisempi. Lisäksi tällainen ero mahdollisti tiettyjen rajoitusten osoittamisen keinotekoisille hermoverkoille S- ja R-ohjatuille järjestelmille (katso Perceptron Convergence Theorem ).

Katso myös

Kirjallisuus