Autoenkooderi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 25.5.2022 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Autoencoder ( englanniksi autoencoder , myös - autoassociator ) [1] - keinotekoisten hermoverkkojen erityinen arkkitehtuuri , jonka avulla voit soveltaa valvomatonta oppimista [2] käytettäessä backpropagation menetelmää . Yksinkertaisin autoenkooderiarkkitehtuuri on myötäkytkentäverkko, ilman palautetta, eniten perceptronin kaltainen ja sisältää tulokerroksen, välikerroksen ja lähtökerroksen. Toisin kuin perceptronin, autoenkooderin lähtökerroksen tulee sisältää yhtä monta hermosolua kuin syöttökerroksessa.

Autoenkooderiverkon toiminnan ja koulutuksen pääperiaate on saada vastaus lähtökerrokseen, joka on lähimpänä tulokerrosta. Jotta ratkaisu ei olisi triviaali, autoenkooderin välikerrokseen asetetaan rajoituksia: välikerroksen tulee olla joko pienempi kuin tulo- ja lähtökerros tai samanaikaisesti aktiivisten välikerroksen hermosolujen määrää on keinotekoisesti rajoitettu - harva . aktivointi . Nämä rajoitukset pakottavat hermoverkon etsimään yleistyksiä ja korrelaatioita syöttötiedoista ja suorittamaan niiden pakkaamisen. Siten hermoverkko koulutetaan automaattisesti poimimaan yhteisiä piirteitä syöttötiedoista, jotka on koodattu keinotekoisen hermoverkon painoarvoihin. Joten kun verkkoa opetetaan joukolla erilaisia syöttökuvia, hermoverkko voi itsenäisesti oppia tunnistamaan viivoja ja raitoja eri kulmista.

Useimmiten autoenkoodeja käytetään peräkkäin syvien (monikerroksisten) verkkojen kouluttamiseen . Autoenkoodeja käytetään syväverkon valvomattomaan esiopetukseen . Tätä varten kerrokset koulutetaan peräkkäin ensimmäisestä alkaen. Jokaiseen uuteen kouluttamattomaan kerrokseen liitetään koulutusjakson ajaksi lisälähtökerros, joka täydentää verkkoa autoencoder-arkkitehtuuriin, minkä jälkeen verkkotuloon syötetään koulutusta varten tarkoitettu tietojoukko. Harjoittamattoman kerroksen ja autoenkooderin lisäkerroksen painoja harjoitellaan backpropagation menetelmällä. Sitten automaattinen kooderikerros poistetaan käytöstä ja luodaan uusi, joka vastaa seuraavaa kouluttamatonta verkkokerrosta. Sama tietojoukko syötetään jälleen verkkosyötteeseen, verkon koulutetut ensimmäiset kerrokset pysyvät muuttumattomina ja toimivat syötteenä seuraavan koulutetun kerroksen automaattiselle kooderille. Joten koulutus jatkuu kaikille verkon kerroksille viimeisiä lukuun ottamatta. Verkon viimeiset kerrokset opetetaan yleensä ilman autoenkooderia käyttämällä samaa takaisinetenemismenetelmää ja merkittyjä tietoja (ohjattu oppiminen).

Autoenkooderin sovellukset

Viime aikoina autoenkoodereita on käytetty vain vähän kuvattuun "ahneeseen" kerrostettuun syvän hermoverkkojen esikoulutukseen. Kun Jeffrey Hinton ja Ruslan Salakhutdinov [3] [4] ehdottivat tätä menetelmää vuonna 2006 , kävi nopeasti ilmi, että uudet alustusmenetelmät satunnaisten painojen avulla ovat riittäviä syvien verkkojen jatkokoulutukseen [5] . Vuonna 2014 ehdotettu eränormalisointi [6] mahdollisti vielä syvempien verkkojen kouluttamisen, kun taas vuoden 2015 lopulla ehdotettu jäännösoppimismenetelmä [7] mahdollisti mielivaltaisen syvyisten verkkojen harjoittamisen [5] .

Autoenkooderien tärkeimmät käytännön sovellukset ovat edelleen datan kohinan vähentäminen sekä korkeadimensionaalisen datan mittasuhteiden vähentäminen visualisointia varten. Tietyillä tietojen dimensiota ja harvalukuisuutta koskevin varoin autoenkooderit voivat mahdollistaa moniulotteisen datan projektioiden saamisen, jotka osoittautuvat paremmiksi kuin pääkomponenttimenetelmällä tai jollain muulla klassisella menetelmällä [5] .

Autoenkooderien mahdollisten sovellusten valikoima ei kuitenkaan rajoitu tähän. Niillä voidaan siis havaita poikkeavuuksia [8] [9] [10] [11] [12] , koska malli oppii palauttamaan syöttötiedot tyypillisimpien ominaisuuksien mukaan ja poikkeamien esiintyessä palautus. tarkkuus heikkenee. Vuonna 2019 esiteltiin myös autoenkooderin onnistunut sovellus lääkesuunnittelussa [13] [14] .

Muistiinpanot

↑ Autoencoder for Words, Liou, C.-Y., Cheng, C.-W., Liou, J.-W. ja Liou, D.-R., Neurocomputing, osa 139, 84-96 (2014), doi : 10.1016/j.neucom.2013.09.055
↑ Monikerroksisen harvaan automaattisen enkooderin koulutus suurissa kuvissa, Khurshudov A. A., Bulletin of Computer and Information Technologies 02.2014 doi : 10.14489/vkit.2014.02.pp.027-030
↑ G. E. Hinton, R. R. Salakhutdinov. Tietojen ulottuvuuden vähentäminen hermoverkkojen avulla // Tiede . – 28.7.2006. — Voi. 313 , iss. 5786 . — s. 504–507 . — ISSN 1095-9203 0036-8075, 1095-9203 . - doi : 10.1126/tiede.1127647 . Arkistoitu alkuperäisestä 23. joulukuuta 2015.
↑ Miksi ohjaamaton esikoulutus auttaa syvään oppimiseen? . Arkistoitu alkuperäisestä 13. joulukuuta 2016.
↑ 1 2 3 Autoenkooderien rakentaminen Kerasissa . blog.keras.io. Haettu 25. kesäkuuta 2016. Arkistoitu alkuperäisestä 23. kesäkuuta 2016. (määrätön)
↑ Sergey Ioffe, Christian Szegedy. Eränormalisointi: syväverkkokoulutuksen nopeuttaminen vähentämällä sisäistä kovariaattisiirtymää // arXiv:1502.03167 [cs]. - 2015-02-10. Arkistoitu alkuperäisestä 3. heinäkuuta 2016.
↑ Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Deep Residual Learning for Image Recognition // arXiv:1512.03385 [cs]. – 10.12.2015. Arkistoitu alkuperäisestä 3. syyskuuta 2016.
↑ Morales-Forero A., Bassetto S. Tapaustutkimus: Puolivalvottu metodologia poikkeamien havaitsemiseen ja diagnosointiin // 2019 IEEE International Conference on Industrial Engineering and Engineering Management (IEEM). - Macao, Macao: IEEE, 2019-12. — S. 1031–1037 . - ISBN 978-1-7281-3804-6 . - doi : 10.1109/IEEM44572.2019.8978509 .
↑ Sakurada Mayu, Yairi Takehisa. Poikkeamien havaitseminen automaattisilla koodereilla, joissa on epälineaarisen ulottuvuuden vähentäminen // Proceedings of the MLSDA 2014 2nd Workshop on Machine Learning for Sensor Data Analysis - MLSDA'14. — Gold Coast, Australia QLD, Australia: ACM Press, 2014. — S. 4–11 . — ISBN 978-1-4503-3159-3 . doi : 10.1145 / 2689746.2689747 .
↑ Jinwon An, Sungzoon Cho. [ http://dm.snu.ac.kr/static/docs/TR/SNUDM-TR-2015-03.pdf Vaihteleva automaattinen kooderipohjainen poikkeamien havaitseminen rekonstruktiotodennäköisyyden avulla] // Erikoisluento IE:stä. - 2015. - Nro 2 . - S. 1-18 .
↑ Chong Zhou, Randy C. Paffenroth. Poikkeamien havaitseminen vankilla syväautoenkoodereilla // 23. ACM SIGKDD:n kansainvälisen tiedonhakua ja tiedonlouhintaa käsittelevän konferenssin julkaisuja. – Halifax NS Canada: ACM, 2017-08-04. — s. 665–674 . — ISBN 978-1-4503-4887-4 . - doi : 10.1145/3097983.3098052 .
↑ Manassés Ribeiro, André Eugênio Lazzaretti, Heitor Silvério Lopes. Tutkimus syväkonvoluutioautomaateista koodereista poikkeamien havaitsemiseen videoissa // Pattern Recognition Letters. - 2018-04. — Voi. 105 . — s. 13–22 . - doi : 10.1016/j.patrec.2017.07.016 .
↑ Alex Zhavoronkov, Yan A. Ivanenkov, Alex Aliper, Mark S. Veselov, Vladimir A. Aladinskiy. Syväoppiminen mahdollistaa tehokkaiden DDR1-kinaasiestäjien nopean tunnistamisen // Nature Biotechnology. – 2019-09. — Voi. 37 , iss. 9 . — s. 1038–1040 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/s41587-019-0224-x .
↑ Gregory Barber. Tekoälyn suunnittelemassa molekyylissä on "lääkkeiden kaltaisia" ominaisuuksia // Langallinen . — ISSN 1059-1028 .

Linkit

Keinotekoisten neuroverkkojen tyypit

Feed-forward-verkko ( Säteittäisten perustoimintojen verkko )
Yksikerroksinen perceptroni
Monikerroksinen Perceptron ( Rosenblatt • Rumelhart )
Hopfieldin verkko
Markovin ketju
Boltzmannin kone
Rajoitettu Boltzmann-kone
Autoencoder ( Denoise autoencoder • Sparse autoencoder • Variational autoencoder )
Syvä luottamuksen verkko
Konvoluutiohermoverkko
Syvä konvoluutiohermoverkko
Käyttöönoton hermoverkko
Deep Convolutional Inverse Graphic Network
Generatiivinen kontradiktorinen verkosto
Toistuva neuroverkko
Rekursiiviset hermoverkot
pitkä lyhytaikainen muisti
Hallittu toistuva esto
Neuraaliset Turingin koneet
Kaksisuuntainen verkko ( Kaksisuuntainen toistuva hermoverkko • Kaksisuuntainen verkko pitkällä lyhytaikaisella muistilla • Kaksisuuntaisesti ohjatut toistuvat neuronit )
Deep Residual Network
Neuraalinen kaikuverkko
Extreme Learning Method
Epävakaiden tilojen menetelmä
Tuki vektorikonetta
Kohosen verkko
Kohosen itseorganisoituva kartta
Kapselin hermoverkko
Assosiatiivinen muisti neuroverkoissa

Koneoppiminen ja tiedon louhinta
Tehtävät	Luokitteluongelma Oppiminen ilman opettajaa Opettajan avustama oppiminen Taantumisanalyysi AutoML Yhdistyksen säännöt Ominaisuuksien erottaminen Ominaisuuksien koulutus Ranking koulutus Kieliopillinen johtaminen Verkko-oppiminen
Opettajan kanssa oppimista	k-lähimmän naapurin menetelmä Naiivi Bayesin luokitin päätöspuu Tuki vektorikonetta Lineaarinen regressio Logistinen regressio perceptron Mallien kokoonpanot Pussittaminen tehostaa satunnainen metsä Asiaankuuluva vektorimenetelmä
ryhmäanalyysi	k-keinomenetelmä Sumea klusterointimenetelmä Hierarkkinen klusterointi EM-algoritmi KOIVU PARANTAA DBSCAN OPTIIKKA Keskimääräinen siirto
Mittasuhteiden vähentäminen	Tekijäanalyysi Pääkomponenttimenetelmä CCA ICA LDA Ei-negatiivinen matriisin laajennus t-SNE
Rakenteellinen ennustaminen	Graafinen todennäköisyysmalli Bayesin verkko Piilotettu Markovin malli CRF
Anomalian havaitseminen	k-lähimmän naapurin menetelmä Paikallinen päästötaso
Piirrä todennäköisyysmallit	Bayesin verkko Markovin verkko Piilotettu Markovin malli
Neuroverkot	Rajoitettu Boltzmann-kone itseorganisoituva kartta Aktivointitoiminto Sigmoidi softmax Radiaalinen kantafunktio Takaisin lisäysmenetelmä Syväoppiminen Monikerroksinen perceptroni Toistuva neuroverkko pitkä lyhytaikainen muisti Hallittu toistuva esto Konvoluutiohermoverkko U-Net Autoenkooderi
Vahvistusoppiminen	Markovin prosessi Bellmanin yhtälö Ahne algoritmi Q-oppiminen SARSA Aikaero (TD)
Teoria	Vapnik-Chervonenkis teoria Bias-dispersion dilemma Laskennallinen oppimisteoria Empiirinen riskin minimointi Occam oppii PAC-oppiminen Tilastollinen oppimisteoria
Lehdet ja konferenssit	NeurIPS ICML ML JMLR ArXiv:cs.LG