Koneoppiminen
Koneoppiminen ( eng. machine learning , ML) on tekoälymenetelmien luokka , jolle ominaista ei ole suora ratkaisu ongelmaan, vaan oppiminen soveltamalla ratkaisuja moniin samankaltaisiin ongelmiin. Tällaisten menetelmien rakentamiseen käytetään matemaattisia tilastoja , numeerisia menetelmiä , matemaattista analyysiä , optimointimenetelmiä , todennäköisyysteoriaa , graafiteoriaa , erilaisia tekniikoita digitaalisessa muodossa olevien tietojen käsittelyyn .
Koulutusta on kahdenlaisia:
- Tapausoppiminen eli induktiivinen oppiminen perustuu empiiristen mallien löytämiseen tiedosta .
- Deduktiivinen oppiminen tarkoittaa asiantuntijoiden tiedon formalisointia ja siirtämistä tietokoneelle tietopohjan muodossa .
Deduktiivista oppimista kutsutaan yleensä asiantuntijajärjestelmien alaksi , joten käsitteitä koneoppiminen ja tapausoppiminen voidaan pitää synonyymeinä.
Useita induktiivisia oppimismenetelmiä on kehitetty vaihtoehdoksi klassisille tilastollisille lähestymistavoille. Monet menetelmät liittyvät läheisesti tiedon talteenottoon ( englanniksi information extraction , information retrieval ), tiedon louhintaan ( data mining ).
Yleinen lausunto ennakkotapausten oppimisen ongelmasta
On monia esineitä (tilanteita) ja monia mahdollisia vastauksia (vastauksia, reaktioita). Vastausten ja objektien välillä on jonkin verran riippuvuutta, mutta sitä ei tunneta. Tunnetaan vain rajallinen joukko ennakkotapauksia - pareja "objekti, vastaus", kutsutaan opetusnäytteeksi . Näiden tietojen perusteella on palautettava implisiittinen riippuvuus eli rakennettava algoritmi, joka pystyy tuottamaan riittävän tarkan luokitusvastauksen mille tahansa mahdolliselle syöttöobjektille. Tätä riippuvuutta ei välttämättä ilmaista analyyttisesti, ja tässä neuroverkot toteuttavat empiirisesti muodostetun ratkaisun periaatetta. Tärkeä piirre tässä tapauksessa on oppimisjärjestelmän kyky yleistää, eli vastata riittävästi dataan, joka ylittää olemassa olevan koulutusnäytteen rajat. Vastausten tarkkuuden mittaamiseksi otetaan käyttöön arvioitu laatufunktio .
Tämä muotoilu on yleistys klassisista funktion approksimaatioongelmista . Klassisissa approksimaatioongelmissa objektit ovat reaalilukuja tai vektoreita. Todellisissa sovellettavissa ongelmissa kohteiden syöttötiedot voivat olla epätäydellisiä, epätarkkoja, ei-numeerisia, heterogeenisia. Nämä ominaisuudet johtavat monenlaisiin koneoppimismenetelmiin.
Koneoppimismenetelmät
Koneoppimisen osa syntyi toisaalta hermoverkkotieteen jakamisen seurauksena verkkojen koulutusmenetelmiksi ja niiden arkkitehtuurin topologiatyypeiksi, toisaalta se omaksui matemaattisten tilastojen menetelmät. [a] . Alla luetellut koneoppimismenetelmät perustuvat hermoverkkojen käyttöön, vaikka on olemassa muitakin koulutusotokseen perustuvia menetelmiä, esimerkiksi erotteluanalyysi, joka toimii havaittujen tilastojen yleistetyllä varianssilla ja kovarianssilla, tai Bayesin luokittelijat. Neuraaliverkkojen perustyyppejä, kuten perceptronia ja monikerroksisia perceptroneja (sekä niiden muunnelmia), voidaan harjoitella sekä opettajan kanssa että ilman opettajaa vahvistamalla ja itseorganisoimalla. Mutta jotkut hermoverkot ja useimmat tilastolliset menetelmät voidaan katsoa vain yhden oppimismenetelmien ansioksi. Siksi, jos sinun on luokiteltava koneoppimismenetelmiä oppimismenetelmän mukaan, olisi väärin liittää hermoverkkoja tietylle tyypille, olisi oikeampaa kirjoittaa neuroverkkojen oppimisalgoritmeja.
- Ohjattu oppiminen - jokaiselle käyttötapaukselle asetetaan "tilanne, vaadittu ratkaisu" -pari:
- Keinotekoinen hermoverkko
- Syväoppiminen
- Virheenkorjausmenetelmä
- Takaisin lisäysmenetelmä
- Tuki vektorikonetta
- Valvomaton oppiminen - jokaiselle käyttötapaukselle määritetään vain "tilanne", objektit on ryhmiteltävä klustereihin käyttämällä tietoa objektien parittaisesta samankaltaisuudesta ja/tai pienennettävä dataulottuvuutta:
- Alfa-vahvistusjärjestelmä
- Gamma-vahvistusjärjestelmä
- Lähin naapuri -menetelmä
- Geneettinen algoritmi .
- Aktiivioppiminen eroaa siitä, että oppimisalgoritmilla on kyky määrittää itsenäisesti seuraava tutkittava tilanne, josta oikea vastaus selviää:
- Puoliohjattu oppiminen - joissakin tapauksissa asetetaan pari "tilanne, vaadittu ratkaisu" ja joissakin - vain " tilanne "
- Transduktiivinen oppiminen - oppiminen opettajan osittaisella osallistumisella, kun ennuste on tarkoitus tehdä vain ennakkotapauksille testinäytteestä
- Multi-task learning ( eng. multi-task learning ) - samanaikainen oppiminen toisiinsa liittyvien tehtävien joukosta, joille kullekin asetetaan omat "tilanne, tarvittava ratkaisu" -pari
- Moniasteen oppiminen on oppimista , kun ennakkotapauksia voidaan yhdistää ryhmiin, joissa jokaisessa on "tilanne" kaikille ennakkotapauksille, mutta vain yhdelle niistä (lisäksi ei tiedetä kummalle) on pari " tilanne ,
- Tehostaminen on prosessi koneoppimisalgoritmien kokoonpanon peräkkäiseen rakentamiseen , kun jokainen seuraava algoritmi pyrkii kompensoimaan kaikkien aikaisempien algoritmien koostumuksen puutteet.
- Bayesin verkko
Klassiset ongelmat ratkaistu koneoppimisen avulla
Harjoitussyötteiden tyypit
- Objektien attribuuttikuvaus tai objektiattribuuttien matriisi on yleisin tapaus. Jokainen kohde on kuvattu joukolla ominaisuuksia.
- Objektien välinen etäisyysmatriisi . Jokainen kohde kuvataan etäisyyksillä kaikkiin muihin harjoitusnäytteen objekteihin, useimmiten parittaisilla samankaltaisuussuhteilla.
- Aikasarja tai signaali . Mittaussarja ajassa, joka voidaan esittää numerolla, vektorilla ja yleisessä tapauksessa - ohjeellisella kuvauksella tietyllä hetkellä.
- Kuva- tai videosarja .
- pelkkää tekstiä Natural Language Processing -toiminnolla .
Laadukkaiden funktioiden tyypit
- Opettajan kanssa oppiessa laatufunktio voidaan määritellä vastausten keskimääräiseksi virheeksi. Oletetaan, että halutun algoritmin tulisi minimoida se. Liiallisen sovituksen estämiseksi minimoitavaan laatutoimintoon lisätään usein säännöllisesti tai epäsuorasti.
- Ohjaamattomassa oppimisessa laatufunktioita voidaan määritellä eri tavoin, esimerkiksi keskimääräisten klusterien välisten ja klusterin sisäisten etäisyyksien suhteeksi.
- Vahvistusoppimisessa laatufunktiot määräytyvät fyysisen ympäristön mukaan, mikä osoittaa agentin sopeutumisen laadun.
Käytännön sovellukset
Koneoppimisen tarkoitus on automatisoida osittain tai kokonaan monimutkaisten ammatillisten ongelmien ratkaiseminen ihmisen toiminnan eri alueilla.
Koneoppimisessa on laaja valikoima sovelluksia :
Koneoppimisen laajuus laajenee jatkuvasti. Laaja informatisointi johtaa valtavien tietomäärien keräämiseen tieteessä, tuotannossa, liiketoiminnassa, liikenteessä ja terveydenhuollossa. Tässä tapauksessa ilmenevät ennustamisen, hallinnan ja päätöksenteon ongelmat pelkistyvät usein ennakkotapausten kautta oppimiseen. Aikaisemmin, kun tällaista tietoa ei ollut saatavilla, näitä tehtäviä ei joko asetettu ollenkaan tai ne ratkaistiin täysin eri menetelmin.
Katso myös
Muistiinpanot
Kommentit
- ↑ Tunnetun koneoppimisasiantuntijan Jan LeCunin mukaan koneoppiminen on keinotekoisiin hermoverkkoihin perustuvan ajattelun toistamista [1]
Alaviitteet
- ↑ LeCun, 2021 , s. 78.
Kirjallisuus
- Ayvazyan S. A. , Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: mallinnuksen perusteet ja primaarinen tietojenkäsittely. - M .: Rahoitus ja tilastot, 1983.
- Ayvazyan S. A., Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: riippuvuuksien tutkimus. - M .: Rahoitus ja tilastot, 1985.
- Ayvazyan S. A., Buchstaber V. M. , Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: luokittelu ja ulottuvuuden vähentäminen. - M .: Talous ja tilastot, 1989.
- Vapnik VN Riippuvuuksien rekonstruktio empiiristen tietojen perusteella. - M.: Nauka , 1979.
- Zhuravlev Yu. I. , Ryazanov V. V., Senko O. V. "Tunnustaminen". Matemaattiset menetelmät. Ohjelmistojärjestelmä. Käytännön sovellukset. — M.: Fazis, 2006. ISBN 5-7036-0108-8 .
- Zagoruiko NG Sovellettavat menetelmät datan ja tiedon analysointiin. - Novosibirsk: IM SO RAN, 1999. ISBN 5-86134-060-9 .
- Flach P. Koneoppiminen. - M. : DMK Press, 2015. - 400 s. — ISBN 978-5-97060-273-7 .
- Shlesinger M., Glavach V. Kymmenen luentoa tilastollisesta ja rakenteellisesta tunnistamisesta. - Kiova: Naukova Dumka , 2004. ISBN 966-00-0341-2 .
- Hastie, T., Tibshirani R., Friedman J. Tilastollisen oppimisen elementit: tiedon louhinta, päättely ja ennustaminen . – 2. painos - Springer-Verlag, 2009. - 746 s. - ISBN 978-0-387-84857-0 . .
- Mitchell T. Koneoppiminen. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7 .
- Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1983), Machine Learning: An Artificial Intelligence Approach , Tioga Publishing Company, ISBN 0-935382-05-4 ( Machine Learning : An Artificial Intelligence Approach in Google Books ).
- Vapnik V. N. Tilastollinen oppimisteoria. — NY: John Wiley & Sons, Inc., 1998. [1]
- Bernhard Schölkopf , Alexander J. Smola Oppiminen ytimien kanssa. Tukee vektorikoneita, laillistamista, optimointia ja muuta. - MIT Press , Cambridge, MA, 2002 ISBN 978-0-262-19475-4 [2]
- I. H. Witten , E. Frank Data Mining: Käytännön koneoppimistyökalut ja -tekniikat (toinen painos). — Morgan Kaufmann, 2005 ISBN 0-12-088407-0 [3]
- Liang Wang, Li Cheng, Guoying Zhao. Koneoppiminen ihmisen liikeanalyysiin. - IGI Global, 2009. - 318 s. - ISBN 978-1-60566-900-7 .
- Jan LeCun . Kuinka kone oppii. Vallankumous neuroverkoissa ja syvässä oppimisessa. (Sber Library: Artificial Intelligence). - M . : Alpina tietokirjallisuus, 2021. - ISBN 978-5-907394-29-2 .
Linkit
Sanakirjat ja tietosanakirjat |
|
---|
Bibliografisissa luetteloissa |
|
---|