Tietokonenäössä segmentointi on prosessi, jossa digitaalinen kuva jaetaan useisiin segmentteihin ( pikseleiden joukko , jota kutsutaan myös superpikseleiksi). Segmentoinnin tarkoituksena on yksinkertaistaa ja/tai muuttaa kuvan esitystä niin, että se on yksinkertaisempi ja helpompi analysoida. [1] Kuvan segmentointia käytetään yleisesti kohteiden ja rajojen (viivojen, käyrien jne.) korostamiseen kuvissa. Tarkemmin sanottuna kuvan segmentointi on prosessi, jossa tunnisteet määritetään jokaiselle kuvan pikselille siten, että pikselit, joilla on sama nimi, jakavat visuaaliset ominaisuudet.
Kuvan segmentoinnin tulos on joukko segmenttejä, jotka yhdessä peittävät koko kuvan, tai joukko ääriviivoja , jotka on erotettu kuvasta (katso Reunojen erotus ). Kaikki segmentin pikselit ovat samanlaisia joidenkin ominaisten tai laskettujen ominaisuuksien osalta, kuten värin , kirkkauden tai tekstuurin osalta . Naapurisegmentit eroavat toisistaan merkittävästi tässä ominaisuudessa. [yksi]
Jotkut kuvien segmentoinnin käytännön sovellukset ovat:
Kuvien segmentointiin on kehitetty useita universaaleja algoritmeja ja menetelmiä. Koska kuvan segmentointiongelmaan ei ole yleistä ratkaisua, nämä menetelmät on usein yhdistettävä aihealueen tietoon, jotta tämä ongelma voidaan ratkaista tehokkaasti sen aihealueella.
k-means on iteratiivinen menetelmä, jota käytetään kuvan jakamiseen K - klusteriin. Perusalgoritmi näkyy alla:
Tässä etäisyydeksi otetaan yleensä pikselin ja klusterin keskikohdan välisten erojen neliöiden summa tai absoluuttiset arvot . Ero perustuu yleensä väriin, kirkkauteen, tekstuuriin ja pikselien sijaintiin tai näiden tekijöiden painotettuun summaan. K voidaan valita manuaalisesti, satunnaisesti tai heuristisesti.
Tämä algoritmi taatusti konvergoi, mutta se ei välttämättä johda optimaaliseen ratkaisuun. Ratkaisun laatu riippuu klusterien alkujoukosta ja K :n arvosta .
Histogrammimenetelmät ovat erittäin tehokkaita verrattuna muihin kuvien segmentointimenetelmiin, koska ne vaativat vain yhden pikselin läpimenon. Tässä menetelmässä histogrammi lasketaan kaikille kuvan pikseleille ja sen minimi- ja maksimiarvoja käytetään klustereiden etsimiseen kuvasta. [1] Vertailun vuoksi voidaan käyttää väriä tai kirkkautta .
Tämän menetelmän parannus on soveltaa sitä rekursiivisesti kuvan klustereihin niiden jakamiseksi pienempiin klustereihin. Prosessi toistetaan yhä pienemmillä klustereilla, kunnes klustereita ei enää näy. [1] [4]
Yksi tämän menetelmän haittapuoli on, että kuvasta voi olla vaikea löytää merkittäviä minimi- ja maksimiarvoja. Tässä kuvan luokittelumenetelmässä etäisyysmetriikka ja integroitu aluesovitus ovat samanlaisia.
Histogrammiin perustuvia lähestymistapoja voidaan myös nopeasti mukauttaa useisiin kehyksiin säilyttäen samalla niiden yhden kierron nopeusetunsa. Histogrammi voidaan rakentaa useilla tavoilla, kun otetaan huomioon useita kehyksiä. Samaa lähestymistapaa, jota käytetään yhdelle kehykselle, voidaan soveltaa useisiin kehyksiin, ja kun tulokset yhdistetään, matalat ja korkeat, joita oli vaikea poimia, näkyvät paremmin. Histogrammia voidaan käyttää myös pikselikohtaisesti, jolloin tietoa käytetään määrittämään tietyn pikselin sijainnin yleisin väri. Tämä lähestymistapa käyttää segmentointia, joka perustuu liikkuviin objekteihin ja liikkuviin ympäristöihin, mikä antaa erilaisen segmentoinnin, joka on hyödyllinen videoseurannassa .
Reunojen poisto on hyvin tutkittu ala kuvankäsittelyssä. Alueiden rajat ja reunat ovat vahvasti yhteydessä toisiinsa, koska alueiden rajoilla on usein voimakas kirkkausero. Siksi reunantunnistusmenetelmiä käytetään toisen segmentointimenetelmän perustana.
Löydetyt reunat ovat usein repeytyneet. Mutta objektin valitsemiseksi kuvasta tarvitaan suljetun alueen rajoja.
Ensimmäinen oli menetelmä alueiden kasvattamiseksi siemenistä. Tämä menetelmä ottaa syötteeksi kuvia ja joukon siemeniä. Siemenet merkitsevät valittavat kohteet. Alueet kasvavat asteittain vertaamalla kaikkia vierekkäisiä vierekkäisiä pikseleitä alueeseen. Samankaltaisuusmittarina käytetään pikselin kirkkauden ja alueen keskimääräisen kirkkauden eroa . Pikseli, jolla on pienin ero, lisätään vastaavalle alueelle. Prosessi jatkuu, kunnes kaikki pikselit on lisätty jollekin alueelle.
Menetelmä alueiden kasvattamiseen siemenistä vaatii lisäpanosta. Segmentoinnin tulos riippuu siementen valinnasta. Kuvan kohina voi aiheuttaa siementen huonon sijoittamisen. Ei-siemenalueen kasvatusmenetelmä on modifioitu algoritmi, joka ei vaadi eksplisiittisiä siemeniä. Se alkaa yhdestä alueesta - tässä valitulla pikselillä on vain vähän vaikutusta lopulliseen segmentointiin. Jokaisessa iteraatiossa se ottaa huomioon vierekkäiset pikselit samalla tavalla kuin siemeniä käyttävä alueviljelymenetelmä. Mutta se eroaa siinä, että jos minimi on pienempi kuin määritetty kynnys , se lisätään vastaavalle alueelle . Muuten pikseli katsotaan hyvin erilaiseksi kuin kaikki nykyiset alueet ja luodaan uusi alue, joka sisältää tämän pikselin.
Eräs Haralikin ja Shapiron (1985) [1] ehdottama versio tästä menetelmästä perustuu pikselien kirkkauden käyttöön. Alueen keskiarvoa ja varianssia sekä ehdokaspikselin kirkkautta käytetään testitilastojen rakentamiseen. Jos testitilasto on tarpeeksi pieni, alueelle lisätään pikseli ja alueen keskiarvo ja varianssi lasketaan uudelleen. Muussa tapauksessa pikseli ohitetaan ja sitä käytetään uuden alueen luomiseen.
Graafisen viipalointitekniikoita voidaan soveltaa tehokkaasti kuvien segmentointiin. Näissä menetelmissä kuva esitetään painotettuna suuntaamattomana graafina. Tyypillisesti pikseli tai pikseliryhmä liittyy kärkeen, ja reunapainot määrittävät vierekkäisten pikselien (erojen) samankaltaisuuden. Sitten kuvaaja (kuva) leikataan "hyvien" klustereiden saamiseksi luodun kriteerin mukaan. Näillä algoritmeilla saatuja pisteiden (pikseleiden) jokaista osaa pidetään kohteena kuvassa. Joitakin tämän luokan suosittuja algoritmeja ovat normalisoidut graafin leikkaukset [5] , satunnainen kävely [6] , minimileikkaus [7] , isoperimetrinen osiointi [8] ja minimivirittävän puun segmentointi [9] .
Vedenjakaja-segmentointi ottaa kuvan gradientin itseisarvon topografisena pintana. Pikselit, joilla on suurin kirkkausgradientin absoluuttinen arvo, vastaavat alueiden rajoja edustavia vedenjakajaviivoja. Yhteisen vedenjakajan mille tahansa pikselille asetettu vesi virtaa alas yhteiseen paikalliseen kirkkauden minimiin. Pikselit, joista vesi valuu yhteiseen minimiin, muodostavat segmenttiä edustavan valuma-alueen.
Tämän lähestymistavan perusoletus on, että kiinnostavilla rakenteilla tai elimillä on toistuvia geometrisia muotoja. Siksi on mahdollista löytää todennäköisyysmalli elimen muodon muutosten selittämiseksi ja sitten kuva segmentoimalla asettaa rajoituksia käyttämällä tätä mallia a priori. Tällaiseen tehtävään kuuluu (i) harjoitusesimerkkien saattaminen yhteiseen asentoon, (ii) muutosten todennäköisyysesitys annetuissa näytteissä ja (iii) tilastollinen päättely mallille ja kuvalle. Nykyisiä tietopohjaisen segmentoinnin menetelmiä kirjallisuudessa ovat aktiiviset muoto- ja ulkonäkömallit, aktiiviset ääriviivat, muotoutuvat kuviot ja tasoitusmenetelmät.
Kuvan segmentointi suoritetaan eri mittakaavassa mittakaavatilassa, ja joskus se ulottuu pienestä suureen mittakaavaan.
Segmentointikriteeri voi olla mielivaltaisen monimutkainen ja voi ottaa huomioon sekä paikalliset että globaalit kriteerit. Yleinen vaatimus on, että jokainen alue on liitettävä jollakin tavalla.
Witkinin tärkeä työ [10] [11] mittakaava-avaruudesta sisälsi ajatuksen, että yksiulotteinen signaali voidaan segmentoida yksiselitteisesti alueisiin käyttämällä vain yhtä parametria, joka ohjaa segmentointiskaalaa.