Koneoppiminen

Koneoppiminen ( eng. machine learning , ML) on tekoälymenetelmien luokka , jolle ominaista ei ole suora ratkaisu ongelmaan, vaan oppiminen soveltamalla ratkaisuja moniin samankaltaisiin ongelmiin. Tällaisten menetelmien rakentamiseen käytetään matemaattisia tilastoja , numeerisia menetelmiä , matemaattista analyysiä , optimointimenetelmiä , todennäköisyysteoriaa , graafiteoriaa , erilaisia tekniikoita digitaalisessa muodossa olevien tietojen käsittelyyn .

Koulutusta on kahdenlaisia:

Tapausoppiminen eli induktiivinen oppiminen perustuu empiiristen mallien löytämiseen tiedosta .
Deduktiivinen oppiminen tarkoittaa asiantuntijoiden tiedon formalisointia ja siirtämistä tietokoneelle tietopohjan muodossa .

Deduktiivista oppimista kutsutaan yleensä asiantuntijajärjestelmien alaksi , joten käsitteitä koneoppiminen ja tapausoppiminen voidaan pitää synonyymeinä.

Useita induktiivisia oppimismenetelmiä on kehitetty vaihtoehdoksi klassisille tilastollisille lähestymistavoille. Monet menetelmät liittyvät läheisesti tiedon talteenottoon ( englanniksi information extraction , information retrieval ), tiedon louhintaan ( data mining ).

Yleinen lausunto ennakkotapausten oppimisen ongelmasta

On monia esineitä (tilanteita) ja monia mahdollisia vastauksia (vastauksia, reaktioita). Vastausten ja objektien välillä on jonkin verran riippuvuutta, mutta sitä ei tunneta. Tunnetaan vain rajallinen joukko ennakkotapauksia - pareja "objekti, vastaus", kutsutaan opetusnäytteeksi . Näiden tietojen perusteella on palautettava implisiittinen riippuvuus eli rakennettava algoritmi, joka pystyy tuottamaan riittävän tarkan luokitusvastauksen mille tahansa mahdolliselle syöttöobjektille. Tätä riippuvuutta ei välttämättä ilmaista analyyttisesti, ja tässä neuroverkot toteuttavat empiirisesti muodostetun ratkaisun periaatetta. Tärkeä piirre tässä tapauksessa on oppimisjärjestelmän kyky yleistää, eli vastata riittävästi dataan, joka ylittää olemassa olevan koulutusnäytteen rajat. Vastausten tarkkuuden mittaamiseksi otetaan käyttöön arvioitu laatufunktio .

Tämä muotoilu on yleistys klassisista funktion approksimaatioongelmista . Klassisissa approksimaatioongelmissa objektit ovat reaalilukuja tai vektoreita. Todellisissa sovellettavissa ongelmissa kohteiden syöttötiedot voivat olla epätäydellisiä, epätarkkoja, ei-numeerisia, heterogeenisia. Nämä ominaisuudet johtavat monenlaisiin koneoppimismenetelmiin.

Koneoppimismenetelmät

Koneoppimisen osa syntyi toisaalta hermoverkkotieteen jakamisen seurauksena verkkojen koulutusmenetelmiksi ja niiden arkkitehtuurin topologiatyypeiksi, toisaalta se omaksui matemaattisten tilastojen menetelmät. [a] . Alla luetellut koneoppimismenetelmät perustuvat hermoverkkojen käyttöön, vaikka on olemassa muitakin koulutusotokseen perustuvia menetelmiä, esimerkiksi erotteluanalyysi, joka toimii havaittujen tilastojen yleistetyllä varianssilla ja kovarianssilla, tai Bayesin luokittelijat. Neuraaliverkkojen perustyyppejä, kuten perceptronia ja monikerroksisia perceptroneja (sekä niiden muunnelmia), voidaan harjoitella sekä opettajan kanssa että ilman opettajaa vahvistamalla ja itseorganisoimalla. Mutta jotkut hermoverkot ja useimmat tilastolliset menetelmät voidaan katsoa vain yhden oppimismenetelmien ansioksi. Siksi, jos sinun on luokiteltava koneoppimismenetelmiä oppimismenetelmän mukaan, olisi väärin liittää hermoverkkoja tietylle tyypille, olisi oikeampaa kirjoittaa neuroverkkojen oppimisalgoritmeja.

Ohjattu oppiminen - jokaiselle käyttötapaukselle asetetaan "tilanne, vaadittu ratkaisu" -pari:

Valvomaton oppiminen - jokaiselle käyttötapaukselle määritetään vain "tilanne", objektit on ryhmiteltävä klustereihin käyttämällä tietoa objektien parittaisesta samankaltaisuudesta ja/tai pienennettävä dataulottuvuutta:

Vahvistusoppiminen - jokaiselle käyttötapaukselle on olemassa pari "tilanne, päätös":

Geneettinen algoritmi .

Aktiivioppiminen eroaa siitä, että oppimisalgoritmilla on kyky määrittää itsenäisesti seuraava tutkittava tilanne, josta oikea vastaus selviää:
Puoliohjattu oppiminen - joissakin tapauksissa asetetaan pari "tilanne, vaadittu ratkaisu" ja joissakin - vain " tilanne "
Transduktiivinen oppiminen - oppiminen opettajan osittaisella osallistumisella, kun ennuste on tarkoitus tehdä vain ennakkotapauksille testinäytteestä
Multi-task learning ( eng. multi-task learning ) - samanaikainen oppiminen toisiinsa liittyvien tehtävien joukosta, joille kullekin asetetaan omat "tilanne, tarvittava ratkaisu" -pari
Moniasteen oppiminen on oppimista , kun ennakkotapauksia voidaan yhdistää ryhmiin, joissa jokaisessa on "tilanne" kaikille ennakkotapauksille, mutta vain yhdelle niistä (lisäksi ei tiedetä kummalle) on pari " tilanne ,
Tehostaminen on prosessi koneoppimisalgoritmien kokoonpanon peräkkäiseen rakentamiseen , kun jokainen seuraava algoritmi pyrkii kompensoimaan kaikkien aikaisempien algoritmien koostumuksen puutteet.
Bayesin verkko

Klassiset ongelmat ratkaistu koneoppimisen avulla

Luokittelu tapahtuu yleensä ohjatun oppimisen kautta varsinaisessa oppimisvaiheessa.
Klusterointi tapahtuu tyypillisesti ohjaamattoman oppimisen kautta
Regressio , joka suoritetaan tyypillisesti ohjatulla oppimisella testausvaiheen aikana, on ennustusongelmien erikoistapaus .
Tietojen ulottuvuuden vähentäminen ja datan visualisointi tapahtuu ohjaamattoman oppimisen avulla
Todennäköisyysjakauman tiheyden rekonstruointi tietojoukosta
Yksiluokkainen luokitus ja uutuuden havaitseminen
Sijoitusriippuvuuksien rakentaminen
Anomalian havaitseminen

Harjoitussyötteiden tyypit

Objektien attribuuttikuvaus tai objektiattribuuttien matriisi on yleisin tapaus. Jokainen kohde on kuvattu joukolla ominaisuuksia.
Objektien välinen etäisyysmatriisi . Jokainen kohde kuvataan etäisyyksillä kaikkiin muihin harjoitusnäytteen objekteihin, useimmiten parittaisilla samankaltaisuussuhteilla.
Aikasarja tai signaali . Mittaussarja ajassa, joka voidaan esittää numerolla, vektorilla ja yleisessä tapauksessa - ohjeellisella kuvauksella tietyllä hetkellä.
Kuva- tai videosarja .
pelkkää tekstiä Natural Language Processing -toiminnolla .

Laadukkaiden funktioiden tyypit

Opettajan kanssa oppiessa laatufunktio voidaan määritellä vastausten keskimääräiseksi virheeksi. Oletetaan, että halutun algoritmin tulisi minimoida se. Liiallisen sovituksen estämiseksi minimoitavaan laatutoimintoon lisätään usein säännöllisesti tai epäsuorasti.
Ohjaamattomassa oppimisessa laatufunktioita voidaan määritellä eri tavoin, esimerkiksi keskimääräisten klusterien välisten ja klusterin sisäisten etäisyyksien suhteeksi.
Vahvistusoppimisessa laatufunktiot määräytyvät fyysisen ympäristön mukaan, mikä osoittaa agentin sopeutumisen laadun.

Käytännön sovellukset

Koneoppimisen tarkoitus on automatisoida osittain tai kokonaan monimutkaisten ammatillisten ongelmien ratkaiseminen ihmisen toiminnan eri alueilla.

Koneoppimisessa on laaja valikoima sovelluksia :

Puheentunnistus
Eleiden tunnistus
Käsialan tunnistus
Hahmontunnistus
Tekninen diagnostiikka
Lääketieteellinen diagnostiikka
Aikasarjan ennustaminen
bioinformatiikka
Petosten havaitseminen
Roskapostin tunnistus
Asiakirjojen luokittelu
Varaston tekninen analyysi
Rahoitusvalvonta (katso myös Talousrikokset )
Luottopisteytys
Asiakkaan poistumisennuste
Kemoinformatiikka
Opi asettumaan paremmuusjärjestykseen tiedonhaussa

Koneoppimisen laajuus laajenee jatkuvasti. Laaja informatisointi johtaa valtavien tietomäärien keräämiseen tieteessä, tuotannossa, liiketoiminnassa, liikenteessä ja terveydenhuollossa. Tässä tapauksessa ilmenevät ennustamisen, hallinnan ja päätöksenteon ongelmat pelkistyvät usein ennakkotapausten kautta oppimiseen. Aikaisemmin, kun tällaista tietoa ei ollut saatavilla, näitä tehtäviä ei joko asetettu ollenkaan tai ne ratkaistiin täysin eri menetelmin.

Katso myös

Muistiinpanot

Kommentit

↑ Tunnetun koneoppimisasiantuntijan Jan LeCunin mukaan koneoppiminen on keinotekoisiin hermoverkkoihin perustuvan ajattelun toistamista [1]

Alaviitteet

↑ LeCun, 2021 , s. 78.

Kirjallisuus

Ayvazyan S. A. , Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: mallinnuksen perusteet ja primaarinen tietojenkäsittely. - M .: Rahoitus ja tilastot, 1983.
Ayvazyan S. A., Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: riippuvuuksien tutkimus. - M .: Rahoitus ja tilastot, 1985.
Ayvazyan S. A., Buchstaber V. M. , Enyukov I. S., Meshalkin L. D. Sovellettu tilasto: luokittelu ja ulottuvuuden vähentäminen. - M .: Talous ja tilastot, 1989.
Vapnik VN Riippuvuuksien rekonstruktio empiiristen tietojen perusteella. - M.: Nauka , 1979.
Zhuravlev Yu. I. , Ryazanov V. V., Senko O. V. "Tunnustaminen". Matemaattiset menetelmät. Ohjelmistojärjestelmä. Käytännön sovellukset. — M.: Fazis, 2006. ISBN 5-7036-0108-8 .
Zagoruiko NG Sovellettavat menetelmät datan ja tiedon analysointiin. - Novosibirsk: IM SO RAN, 1999. ISBN 5-86134-060-9 .
Flach P. Koneoppiminen. - M. : DMK Press, 2015. - 400 s. — ISBN 978-5-97060-273-7 .
Shlesinger M., Glavach V. Kymmenen luentoa tilastollisesta ja rakenteellisesta tunnistamisesta. - Kiova: Naukova Dumka , 2004. ISBN 966-00-0341-2 .
Hastie, T., Tibshirani R., Friedman J. Tilastollisen oppimisen elementit: tiedon louhinta, päättely ja ennustaminen . – 2. painos - Springer-Verlag, 2009. - 746 s. - ISBN 978-0-387-84857-0 . .
Mitchell T. Koneoppiminen. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7 .
Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1983), Machine Learning: An Artificial Intelligence Approach , Tioga Publishing Company, ISBN 0-935382-05-4 ( Machine Learning : An Artificial Intelligence Approach in Google Books ).
Vapnik V. N. Tilastollinen oppimisteoria. — NY: John Wiley & Sons, Inc., 1998. [1]
Bernhard Schölkopf , Alexander J. Smola Oppiminen ytimien kanssa. Tukee vektorikoneita, laillistamista, optimointia ja muuta. - MIT Press , Cambridge, MA, 2002 ISBN 978-0-262-19475-4 [2]
I. H. Witten , E. Frank Data Mining: Käytännön koneoppimistyökalut ja -tekniikat (toinen painos). — Morgan Kaufmann, 2005 ISBN 0-12-088407-0 [3]
Liang Wang, Li Cheng, Guoying Zhao. Koneoppiminen ihmisen liikeanalyysiin. - IGI Global, 2009. - 318 s. - ISBN 978-1-60566-900-7 .
Jan LeCun . Kuinka kone oppii. Vallankumous neuroverkoissa ja syvässä oppimisessa. (Sber Library: Artificial Intelligence). - M . : Alpina tietokirjallisuus, 2021. - ISBN 978-5-907394-29-2 .

Linkit

Weka: Tiedonlouhintaohjelmisto Javassa
www.MachineLearning.ru on ammattimainen wiki-resurssi, joka on omistettu koneoppimiseen ja tiedon louhintaan
MMRO - Matemaattiset kuviontunnistuksen menetelmät
Konstantin Vorontsov . Luentokurssi Matemaattiset opetuksen menetelmät ennakkotapausten mukaan, Moskovan fysiikan ja tekniikan instituutti , 2004—2008
Konstantin Vorontsov . Koneoppimiskurssi Yandexin data-analyysikoulussa .
Igor Kuralenok . Koneoppimiskurssi Lectorium.
Roman Shamin . Kurssi "Matematiikan ja sovellusten koneoppiminen ja tekoäly" . Matemaattisen instituutin REC . V. A. Steklov RAS

Sanakirjat ja tietosanakirjat	iso kiinalainen iso kiinalainen Hienoa norjalaista Britannica (verkossa) Treccani
Bibliografisissa luetteloissa	GND : 4193754-5 J9U : 987007541156405171 LCCN : sh85079324 NDL : 001210569 NKC : ph126143

Tekoäly
Tarina	Tekoälyn historia Tekoälyn talvi Dartmouthin seminaari
Filosofia	Turingin testi kiinalainen huone Vahva ja heikko tekoäly Ystävällinen tekoäly Tekoälyn etiikka Ohjausongelma
Ohjeet	Agentin lähestymistapa Mukautuva ohjaus Tietotekniikka Toimiva järjestelmämalli Koneoppiminen Neuroverkko sumea logiikka luonnollisen kielen käsittely Hahmontunnistus Parven älykkyys Symbolinen AI Evoluutioalgoritmit Asiantuntijajärjestelmä
Sovellus	Ääniohjaus Luokittelu ongelma Asiakirjojen luokittelu Asiakirjojen klusterointi ryhmäanalyysi Paikallinen haku Konekäännös Optinen hahmon tunnistus Puheentunnistus Käsialan tunnistus Peli AI
Tutkijat	Charles Babbage Vladimir Vapnik Joseph Weizenbaum Norbert Wiener Viktor Glushkov Vladimir Gorodetsky Jan LeCun Aleksei Ljapunov John McCarthy Marvin Minsky Allen Newell Seymour Papert Juudan helmi Germogen Pospelov Dmitri Pospelov Frank Rosenblatt Herbert Alexander Simon Alan Turing Patrick Winston Viktor Finn Sergei Fomin Demis Hassabis Geoffrey Hinton Noam Chomsky Claude Shannon Andrew Eun Eliezer Judkovski

Koneoppiminen ja tiedon louhinta
Tehtävät	Luokittelu ongelma Oppiminen ilman opettajaa Opettajan avustama oppiminen Taantumisanalyysi AutoML Yhdistyksen säännöt Ominaisuuksien erottaminen Ominaisuuksien koulutus Ranking koulutus Kieliopillinen johtaminen Verkko-oppiminen
Opettajan kanssa oppimista	k-lähimmän naapurin menetelmä Naiivi Bayesin luokitin päätöspuu Tuki vektorikonetta Lineaarinen regressio Logistinen regressio perceptron Mallien kokoonpanot Pussittaminen tehostaa satunnainen metsä Asiaankuuluva vektorimenetelmä
ryhmäanalyysi	k-keinomenetelmä Sumea klusterointimenetelmä Hierarkkinen klusterointi EM-algoritmi KOIVU PARANTAA DBSCAN OPTIIKKA Keskimääräinen siirto
Mittasuhteiden vähentäminen	Tekijäanalyysi Pääkomponenttimenetelmä CCA ICA LDA Ei-negatiivinen matriisin laajennus t-SNE
Rakenteellinen ennustaminen	Graafinen todennäköisyysmalli Bayesin verkko Piilotettu Markovin malli CRF
Anomalian havaitseminen	k-lähimmän naapurin menetelmä Paikallinen päästötaso
Piirrä todennäköisyysmallit	Bayesin verkko Markovin verkko Piilotettu Markovin malli
Neuroverkot	Rajoitettu Boltzmann-kone itseorganisoituva kartta Aktivointitoiminto Sigmoidi softmax Radiaalinen kantafunktio Takaisin lisäysmenetelmä Syväoppiminen Monikerroksinen perceptroni Toistuva neuroverkko pitkä lyhytaikainen muisti Hallittu toistuva esto Konvoluutiohermoverkko U-verkko Autoenkooderi
Vahvistusoppiminen	Markovin prosessi Bellmanin yhtälö Ahne algoritmi Q-oppiminen SARSA Aikaero (TD)
Teoria	Vapnik-Chervonenkis teoria Bias-dispersion dilemma Laskennallinen oppimisteoria Empiirinen riskin minimointi Occam oppii PAC-oppiminen Tilastollinen oppimisteoria
Lehdet ja konferenssit	NeurIPS ICML ML JMLR ArXiv:cs.LG