Koneoppiminen

Koneoppiminen ( eng.  machine learning , ML) on tekoälymenetelmien luokka , jolle ominaista ei ole suora ratkaisu ongelmaan, vaan oppiminen soveltamalla ratkaisuja moniin samankaltaisiin ongelmiin. Tällaisten menetelmien rakentamiseen käytetään matemaattisia tilastoja , numeerisia menetelmiä , matemaattista analyysiä , optimointimenetelmiä , todennäköisyysteoriaa , graafiteoriaa , erilaisia ​​tekniikoita digitaalisessa muodossa olevien tietojen käsittelyyn .

Koulutusta on kahdenlaisia:

  1. Tapausoppiminen eli induktiivinen oppiminen perustuu empiiristen mallien löytämiseen tiedosta .
  2. Deduktiivinen oppiminen tarkoittaa asiantuntijoiden tiedon formalisointia ja siirtämistä tietokoneelle tietopohjan muodossa .

Deduktiivista oppimista kutsutaan yleensä asiantuntijajärjestelmien alaksi , joten käsitteitä koneoppiminen ja tapausoppiminen voidaan pitää synonyymeinä.

Useita induktiivisia oppimismenetelmiä on kehitetty vaihtoehdoksi klassisille tilastollisille lähestymistavoille. Monet menetelmät liittyvät läheisesti tiedon talteenottoon ( englanniksi  information extraction , information retrieval ), tiedon louhintaan ( data mining ).

Yleinen lausunto ennakkotapausten oppimisen ongelmasta

On monia esineitä (tilanteita) ja monia mahdollisia vastauksia (vastauksia, reaktioita). Vastausten ja objektien välillä on jonkin verran riippuvuutta, mutta sitä ei tunneta. Tunnetaan vain rajallinen joukko ennakkotapauksia  - pareja "objekti, vastaus", kutsutaan opetusnäytteeksi . Näiden tietojen perusteella on palautettava implisiittinen riippuvuus eli rakennettava algoritmi, joka pystyy tuottamaan riittävän tarkan luokitusvastauksen mille tahansa mahdolliselle syöttöobjektille. Tätä riippuvuutta ei välttämättä ilmaista analyyttisesti, ja tässä neuroverkot toteuttavat empiirisesti muodostetun ratkaisun periaatetta. Tärkeä piirre tässä tapauksessa on oppimisjärjestelmän kyky yleistää, eli vastata riittävästi dataan, joka ylittää olemassa olevan koulutusnäytteen rajat. Vastausten tarkkuuden mittaamiseksi otetaan käyttöön arvioitu laatufunktio .

Tämä muotoilu on yleistys klassisista funktion approksimaatioongelmista . Klassisissa approksimaatioongelmissa objektit ovat reaalilukuja tai vektoreita. Todellisissa sovellettavissa ongelmissa kohteiden syöttötiedot voivat olla epätäydellisiä, epätarkkoja, ei-numeerisia, heterogeenisia. Nämä ominaisuudet johtavat monenlaisiin koneoppimismenetelmiin.

Koneoppimismenetelmät

Koneoppimisen osa syntyi toisaalta hermoverkkotieteen jakamisen seurauksena verkkojen koulutusmenetelmiksi ja niiden arkkitehtuurin topologiatyypeiksi, toisaalta se omaksui matemaattisten tilastojen menetelmät. [a] . Alla luetellut koneoppimismenetelmät perustuvat hermoverkkojen käyttöön, vaikka on olemassa muitakin koulutusotokseen perustuvia menetelmiä, esimerkiksi erotteluanalyysi, joka toimii havaittujen tilastojen yleistetyllä varianssilla ja kovarianssilla, tai Bayesin luokittelijat. Neuraaliverkkojen perustyyppejä, kuten perceptronia ja monikerroksisia perceptroneja (sekä niiden muunnelmia), voidaan harjoitella sekä opettajan kanssa että ilman opettajaa vahvistamalla ja itseorganisoimalla. Mutta jotkut hermoverkot ja useimmat tilastolliset menetelmät voidaan katsoa vain yhden oppimismenetelmien ansioksi. Siksi, jos sinun on luokiteltava koneoppimismenetelmiä oppimismenetelmän mukaan, olisi väärin liittää hermoverkkoja tietylle tyypille, olisi oikeampaa kirjoittaa neuroverkkojen oppimisalgoritmeja.

  1. Keinotekoinen hermoverkko
    1. Syväoppiminen
  2. Virheenkorjausmenetelmä
  3. Takaisin lisäysmenetelmä
  4. Tuki vektorikonetta
  1. Alfa-vahvistusjärjestelmä
  2. Gamma-vahvistusjärjestelmä
  3. Lähin naapuri -menetelmä
  1. Geneettinen algoritmi .

Klassiset ongelmat ratkaistu koneoppimisen avulla

Harjoitussyötteiden tyypit

Laadukkaiden funktioiden tyypit

Käytännön sovellukset

Koneoppimisen tarkoitus on automatisoida osittain tai kokonaan monimutkaisten ammatillisten ongelmien ratkaiseminen ihmisen toiminnan eri alueilla.

Koneoppimisessa on laaja valikoima sovelluksia :

Koneoppimisen laajuus laajenee jatkuvasti. Laaja informatisointi johtaa valtavien tietomäärien keräämiseen tieteessä, tuotannossa, liiketoiminnassa, liikenteessä ja terveydenhuollossa. Tässä tapauksessa ilmenevät ennustamisen, hallinnan ja päätöksenteon ongelmat pelkistyvät usein ennakkotapausten kautta oppimiseen. Aikaisemmin, kun tällaista tietoa ei ollut saatavilla, näitä tehtäviä ei joko asetettu ollenkaan tai ne ratkaistiin täysin eri menetelmin.

Katso myös

Muistiinpanot

Kommentit

  1. Tunnetun koneoppimisasiantuntijan Jan LeCunin mukaan koneoppiminen on keinotekoisiin hermoverkkoihin perustuvan ajattelun toistamista [1]

Alaviitteet

  1. LeCun, 2021 , s. 78.

Kirjallisuus

Linkit