Kohosen itseorganisoituva kartta

Kohosen itseorganisoituva kartta ( englanniksi  Self-organising map -  SOM) on valvomaton hermoverkko , joka suorittaa visualisointi- ja klusterointitehtävää . Verkoston idean esitti suomalainen tiedemies T. Kohonen . Se on menetelmä moniulotteisen tilan projisoimiseksi tilaan, jossa on pienempi ulottuvuus (useimmiten kaksiulotteinen), sitä käytetään myös mallinnus-, ennustamis-, itsenäisten ominaisuuksien joukkojen tunnistamiseen, kuvioiden etsimiseen suurista tietosarjoista liittyvien ongelmien ratkaisemiseen. , tietokonepelien kehittäminen, värien kvantisointi niiden rajoitettuun määrään väripaletin indeksejä: tulostettaessa tulostimella ja aikaisemmin PC:llä tai digibokseilla, joissa on näyttö, jossa on pienempi määrä värejä, arkistointia varten [yleinen käyttö] tai videokoodekit jne. Se on yksi Kohosen hermoverkkojen versioista .

Historia

Menetelmän ehdotti suomalainen tiedemies Teuvo Kohonen vuonna 1984. Alkuperäiseen malliin on monia muunnelmia.

Verkon rakenne

Itseorganisoituva kartta koostuu komponenteista, joita kutsutaan solmuiksi tai neuroneiksi. Niiden lukumäärän määrittää analyytikko . Jokainen solmu on kuvattu kahdella vektorilla. Ensimmäinen on ns. painon m vektori, jolla on sama mitta kuin syötteellä. Toinen on vektori r , joka on kartan solmun koordinaatit. Kohosen kartta esitetään visuaalisesti suorakaiteen tai kuusikulmaisen solun avulla; jälkimmäistä käytetään useammin, koska tässä tapauksessa vierekkäisten solujen keskipisteiden väliset etäisyydet ovat samat, mikä lisää kartan visualisoinnin oikeellisuutta.

Aluksi syöttötiedon ulottuvuus on tiedossa, jollain tavalla kartan alkuperäinen versio rakennetaan sen varaan. Oppimisprosessin aikana solmun painovektorit lähestyvät syöttödataa. Jokaiselle havainnolle (näytteelle) valitaan painovektorin suhteen samankaltaisin solmu, jonka painovektorin arvo lähestyy havaintoa. Myös useiden lähellä olevien solmujen painovektorit lähestyvät havaintoa, joten jos kaksi havaintoa olivat samanlaisia ​​syöttötietojoukossa, läheiset solmut vastaavat niitä kartalla. Syklinen oppimisprosessi, joka iteroi syöttödatan yli, päättyy, kun kartta saavuttaa hyväksyttävän (analyytikon ennalta määrittämän) virheen tai tietyn iteraatiomäärän jälkeen. Niinpä Kohosen kartta luokittelee koulutuksen tuloksena syötetiedot klustereihin ja näyttää visuaalisesti moniulotteisen syöttötiedon kaksiulotteisessa tasossa jakaen läheisten piirteiden vektorit naapurisoluihin ja värittämällä ne neuronien analysoitavien parametrien mukaan.

Algoritmin tuloksena saadaan seuraavat kartat:

Verkkokäyttö

Algoritmi

On kolme yleisintä tapaa asettaa solmun alkupainot:

Olkoon  iteraationumero (alustus vastaa numeroa 0).

, mille tahansa , missä  on solmun painovektori . Jos ehdon täyttäviä solmuja on useita, BMU valitaan satunnaisesti niiden joukosta. Funktio määrittää solmujen "naapurimitan" ja painovektoreiden muutoksen . Sen pitäisi vähitellen tarkentaa niiden arvoja, ensin suuremmassa määrässä solmuja ja vahvempia, sitten pienemmässä ja heikommassa. Usein Gaussin funktiota käytetään naapuruusfunktiona: missä  on harjoituskerroin, joka pienenee monotonisesti jokaisella seuraavalla iteraatiolla (eli se määrittää BMU:n ja sen naapurimaiden painovektorien arvon likiarvon; mitä suurempi askel, sitä pienempi tarkennus); ,  - solmujen koordinaatit ja kartalla;  — tekijä, joka vähentää naapurien määrää iteraatioilla, pienenee monotonisesti. Analyytikko asettaa parametrit ja niiden vähenemisen luonteen. Helpompi tapa määritellä naapurustofunktio: , jos se on analyytikon ennalta määrittämän säteen läheisyydessä ja muuten 0. Funktio on yhtä suuri BMU:lle ja pienenee etäisyyden mukaan BMU:sta. Muuta painovektoria kaavan mukaan: Että. kaikkien BMU:n naapureina olevien solmujen painovektorit lähestyvät tarkasteltavaa havaintoa. Esimerkiksi havaintojen välisten etäisyyksien ja niitä vastaavien BMU:iden painovektoreiden aritmeettisena keskiarvona: , missä N on syötetietojoukon elementtien lukumäärä.

Mallin ominaisuudet

Kestävyys meluisalle datalle, nopea ja valvomaton oppiminen, kyky yksinkertaistaa monimuuttujatulodataa visualisoinnin avulla. [2]

Itseorganisoituvia Kohosen karttoja voidaan käyttää klusterianalyysiin vain, jos klusterien lukumäärä on etukäteen tiedossa [2] .

Tärkeä haittapuoli on, että neuroverkkojen työn lopputulos riippuu verkon alkuasetuksista. Toisaalta neuroverkot voivat teoriassa approksimoida mitä tahansa jatkuvaa funktiota, jolloin tutkija ei voi tehdä mallista etukäteen mitään hypoteeseja [2] .

Katso myös

Muistiinpanot

  1. Chubukova, 2000 , s. 140.
  2. 1 2 3 Manzhula, 2011 .

Kirjallisuus

Linkit