Kuvahaku sisällön mukaan

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 24. marraskuuta 2017 tarkistetusta versiosta . tarkastukset vaativat 10 muokkausta .

Sisältöpohjainen kuvanhaku (CBIR) on tietokonenäön osa , joka ratkaisee ongelman löytää kuvia, joilla on vaadittu sisältö suuresta digitaalisten kuvien joukosta.

Hakualgoritmin tulee analysoida kuvan sisältö, esimerkiksi siinä esiteltyjen esineiden väri, muoto, tekstuuri, kohtauskoostumus. Jos kohtausta ei ole mahdollista analysoida, haussa otetaan huomioon metatiedot : avainsanat, tunnisteet.

Historia

Termin "sisältöön perustuva kuvanhaku" otti ensimmäisen kerran käyttöön vuonna 1992 T. Kato kuvaillessaan kokeita automaattisella kuvanhaulla nykyisten värien ja geometristen muotojen kriteerien perusteella. Siitä lähtien sitä on käytetty yleistyksenä kuvien valintaprosessille tietokannasta objektien syntaktisten ominaisuuksien mukaan. Käytetyt algoritmit, menetelmät ja ohjelmistotyökalut ovat peräisin signaalinkäsittelyyn , tietokonenäköön ja tilastoihin liittyviltä alueilta .

Kehitys

Tällä hetkellä kiinnostus sisältökriteerien mukaista kuvahakua kohtaan on lisääntynyt, mikä johtuu pelkästään metatietojen luokitteluun perustuvien menetelmien rajoituksista sekä sen soveltuvuusmahdollisuuksien lisääntymisestä. Tällä hetkellä tekstidatan luokittelu- ja hakualgoritmit mahdollistavat kuvattujen kuvien käsittelyn metadatan avulla varsin tehokkaasti, mutta tämä lähestymistapa edellyttää jokaisen tietokannan kuvan manuaalista kuvausta henkilön toimesta. Tämä on täysin epäkäytännöllistä, varsinkin kun sitä sovelletaan suuriin tietokantoihin tai automaattisesti luotuihin kuviin (kuten CCTV-kameroihin ). Lisäksi on lähes nolla todennäköisyys, että jokin hakukohdekuvista puuttuu epäselvyyden tai synonyymien vuoksi.

Mahdolliset sovellukset sisällönhakualgoritmeille:

Kuvien etsiminen Internetistä
Taidekuvien luettelointi
Valokuva-arkistojen kanssa työskentelyn organisointi
Tavaroiden vähittäismyyntiluetteloiden järjestäminen
Sairauksien lääketieteellinen diagnoosi
Rikollisuuden ja häiriöiden ehkäisy
Sotilasasesovellus
Immateriaalioikeuksien jakelun valvontaan liittyvät kysymykset
Tietojen hankkiminen etäluotainten sijainnista ja maantieteellisestä sijainnista
Kuvataulukoiden sisällön hallinta

Ohjelmistojärjestelmät ja algoritmit

Huolimatta siitä, että tietokannoista on olemassa monia ohjelmistopaketteja kuvien etsimiseen, pikselisisältöön perustuvan haun ongelmaa ei useimmissa tilanteissa ole vielä toteutettu. Katso luettelo kuvahakukoneista.

Tapoja luoda kyselyitä

Kuvasisällön hakujärjestelmien erilaiset toteutukset toimivat seuraavan tyyppisten käyttäjäkyselyiden kanssa :

Esimerkkitulos

Oletetaan, että järjestelmä suorittaa haun käyttäjän määrittämän syötekuvan perusteella. Järjestelmän muodostavilla algoritmeilla voi olla erilaisia tapoja kuvata ja työskennellä syötekuvan kanssa, mutta kaikilla tuloksena olevilla kuvailmenteillä tulee olla yhteisiä elementtejä käyttäjän määrittämän syötteen kanssa.

Käyttäjä voi syöttää sekä olemassa olevan kuvan että karkean luonnoksen halutusta tuloksesta (merkitseminen värillisiksi alueiksi tai yksinkertaisiksi geometrisiksi muodoiksi). [yksi]

Tällä kyselyjen muodostamismenetelmällä kuvan esittämiseen sanajoukolla ei liity vaikeuksia.

Kyselyn semantiikan resoluutio

Ihannetapauksessa hakujärjestelmän pitäisi pystyä käsittelemään vapaassa muodossa muotoiltuja käyttäjien pyyntöjä, esimerkiksi "löydä kuvia koirista" tai jopa "löytää muotokuvia Leonid Iljitš Brežnevistä". Tämän tyyppisiä pyyntöjä on erittäin vaikea käsitellä tietokoneella, koska valokuvat labradorista ja minivillakoirasta ovat hyvin erilaisia, ja Leonid Iljitš ei aina katso kameraa samassa asennossa. Tällä hetkellä monet järjestelmät käyttävät luokitteluun matalan tason ominaisuuksia, kuten kohteen väriä, tekstuuria ja muotoa, vaikka on myös järjestelmiä, jotka perustuvat pääasiassa korkean tason kriteerien erottamiseen (katso kuviontunnistusteoria ). Useimmat järjestelmät eivät ole laaja-alaisia. Esimerkiksi tietokoneella luodut kuvanhakujärjestelmät hallitsevat onnistuneesti ominaisuuksia, jotka perustuvat yhteensopiviin muotoihin ja liukuväreihin.

Muita tapoja

Tämä luokka sisältää kyselymuotoja, kuten luokan määrittelyn ehdotetussa hierarkiassa, kyselyn osana odotettua kuvaa, kyselyn laajentamista lisäkuvilla, graafisen luonnostelun monimutkaisilla muodoilla ja menetelmien yhdistelmän.

Kyselyä on myös mahdollista tarkentaa asteittain, kun käyttäjä merkitsee hakujärjestelmän aikana välitulokset "sopivaksi" tai "epätyydyttäväksi" ja järjestelmä jatkaa työskentelyä tarkennetun kyselyn kanssa.

Sisällön kuvausmenetelmät

Tässä on yleisimmät menetelmät kuvien sisällön kuvaamiseen, joita käytetään niiden myöhemmässä vertailussa keskenään. Kaikki ne ovat mahdollisesti laajalti sovellettavissa, eli ne eivät ole erityisiä millekään tietylle järjestelmien alaluokalle.

Väri

Kuvien haku värikomponentteja vertailemalla tehdään rakentamalla niiden jakautumisesta histogrammi . Parhaillaan tehdään tutkimusta sellaisen kuvauksen rakentamiseksi, jossa kuva jaetaan alueisiin samanlaisten väriominaisuuksien mukaan ja sitten otetaan huomioon niiden suhteellinen sijainti. Kuvien kuvaus niiden sisältämillä väreillä on yleisin, koska se ei riipu kuvan koosta tai suunnasta. Histogrammien rakentamista ja niiden myöhempää vertailua käytetään useimmiten, mutta se ei ole ainoa tapa kuvata väriominaisuuksia.

Tekstuuri

Sellaisen kuvauksen menetelmät toimivat vertaamalla kuvassa olevia tekstuurinäytteitä ja niiden suhteellista sijaintia. Tekstuurin määrittämiseen käytetään tekseleja , jotka yhdistetään sarjoiksi. Ne eivät sisällä vain tekstuuria kuvaavia tietoja, vaan myös sen sijaintia kuvatussa kuvassa. Tekstuuria kokonaisuutena on vaikea kuvata formalisoidulla tavalla, ja se esitetään yleensä kaksiulotteisena kirkkauden muutosten joukkona . Kuvaus sisältää joskus myös kontrastin , gradientin suuntaavuuden ja säännöllisyyden mittarin. Pikselien kovarianssin vertailussa on ongelma luokkien osoittamiseksi tekstuureille, kuten "sileä" tai "karkea".

Lomake

Muodon kuvaus sisältää kuvan yksittäisten alueiden geometrisen muodon kuvauksen. Sen määrittämiseksi alueelle sovelletaan ensin segmentointia tai rajan valintaa . Muitakin menetelmiä on olemassa, kuten lomakesuodatus (Tushabe ja Wilkinson, 2008). Usein lomakkeen määrittely vaatii ihmisen väliintuloa, koska segmentoinnin kaltaisia menetelmiä on vaikea täysin automatisoida monille tehtäville.

Sovellus

On ohjelmistoyrityksiä, jotka käyttävät sisältöpohjaisia kuvahakualgoritmeja verkkosisällön suodattamiseen ja valvovat valtion verkkoliikennettä pornografisen sisällön kuvien seuraamiseksi.
Esimerkkejä:

Käänteinen kuvahaku TinEye.com
Ihmiset hakevat valokuvien perusteella PhotoDate.ru

Linkit

Kysely kuvan ja videon sisällön mukaan: QBIC-järjestelmä , (Flickner, 1995)
Alastomien ihmisten löytäminen (Fleck et al., 1996)
Virage Video Engine (linkki ei saatavilla) , (Hampapur, 1997)
Kirjastopohjainen koodaus: tehokkaan videon pakkaamisen ja haun esitys (Vasconcelos & Lippman, 1997)
Vastaavien kuvien seulontajärjestelmä (Wang et al., 1998)
Sisältöpohjainen kuvanhaku ( JISC Technology Applications Program Report 39) (Eakins & Graham 1999)
Todennäköisyyspohjainen arkkitehtuuri sisältöön perustuvaan kuvanhakuun , (Vasconcelos & Lippman, 2000)
Yhdistävä näkemys kuvan samankaltaisuudesta (Vasconcelos & Lippman, 2000)
Seuraavan sukupolven verkkohaut visuaalista sisältöä varten , (Lew, 2000)
Kuvan indeksointi sekoitushierarkioilla (Vasconcelos, 2001)
YKSINKERTAINEN: Semantiikka-herkkä integroitu vastaavuus kuvakirjastoille (Wang, Li ja Wiederhold, 2001)
FACERET: Interaktiivinen kasvojen hakujärjestelmä, joka perustuu itseorganisoituviin karttoihin (linkki ei saatavilla) (Ruiz-del-Solar et al., 2002)
Kuvien automaattinen kielellinen indeksointi tilastollisella mallinnusmenetelmällä (Li ja Wang, 2003)
Video google: Tekstin hakumenetelmä objektien vastaavuuteen videoissa (Sivic & Zisserman, 2003)
Virhekuvan haun minimitodennäköisyys (Vasconcelos, 2004)
Todennäköisyyspohjaisten samankaltaisuusfunktioiden tehokkaasta arvioinnista kuvanhaussa (Vasconcelos, 2004)
Kuvien hakujärjestelmien laajentaminen muotojen tesaurusten avulla (Hove, 2004)
Nimet ja kasvot uutisissa (Berg et al., 2004)
Cortina: järjestelmä laajamittaiseen, sisältöön perustuvaan verkkokuvien hakuun (Quack et al., 2004)
Uusi näkökulma visuaaliseen tiedonhakuun (Eidenberger 2004)
Kielipohjainen kuvakokoelmien kysely laajennettavan ontologian perusteella (Town ja Sinclair, 2004)
Puku: uusi ominaisuus videosisällön automaattiseen indeksointiin (Jaffre 2005)
Automaattinen kasvojentunnistus elokuvan hahmojen hakuun pitkissä elokuvissa (Arandjelovic & Zisserman, 2005)
Algoritmi, johon Retrievr (Flickr-haku) ja imgSeek perustuvat (Jacobs, Finkelstein, Salesin)
Image Retrieval: Ideas, Influences ja Trends of the New Age (Datta et al., 2008)
Visuaalisen kyselyn määrityksen liitäntöjen käytön arviointi. (Hove, 2007)
Pikseleistä semanttisiin tiloihin: edistysaskel sisältöön perustuvassa kuvanhaussa (Vasconcelos, 2007)
Sisältöpohjainen kuvanhaku indeksoimalla satunnaisia aliikkunoita satunnaisten puiden avulla (Maree et al., 2007)
Reaaliaikainen tietokoneistettu kuvien merkintä (Li ja Wang, 2008)
Bird, C.L.; PJ Elliott, Griffiths. Käyttöliittymät sisältöpohjaiseen kuvien hakuun (neopr.) . – 1996.
Rui, Yong; Thomas S. Huang, Shih-Fu Chang. Kuvien haku: nykyiset tekniikat, lupaavat ohjeet ja avoimet ongelmat (määrittelemätön) . – 1999.
Datta, Ritendra; Dhiraj Joshi, Jia Li, James Z. Wang. Kuvanhaku: uuden aikakauden ideoita, vaikutteita ja trendejä // ACM Computing Surveys : päiväkirja. - 2008. - Voi. 40 . - s. 1-60 . - doi : 10.1145/1348246.1348248 .
Tushabe, F.; MHF Wilkinson. Sisältöpohjainen kuvanhaku yhdistetyllä 2D-attribuuttikuviospektrillä // Springer Lecture Notes in Computer Science: Journal. – 2008.

Muistiinpanot

↑ Shapiro, Linda; George Stockman. Computer Vision (määrittelemätön) . - Upper Saddle River, NJ: Prentice Hall , 2001. - ISBN 0-13-030796-3 .