Automaattinen kuvan huomautus

Automaattinen kuvan merkintä (tunnetaan myös nimellä automaattinen kuvien merkintä tai kielellinen indeksointi ) on prosessi, jolla tietokonejärjestelmä määrittää automaattisesti metatiedot kuvatekstien tai avainsanojen muodossa digitaaliseen kuvaan . Tätä tietokonenäkötekniikoiden sovellusta käytetään kuvanhakujärjestelmissä kuvien järjestämiseen ja hakemiseen kiinnostavasta tietokannasta.

Tätä menetelmää voidaan pitää eräänlaisena moniluokkaisena kuvaluokituksena, jossa on erittäin suuri määrä luokkia - koko on verrattavissa sanastoon. Tyypillisesti koneoppimistekniikat käyttävät kuva-analyysiä poimittujen piirrevektoreiden ja huomautusharjoitussanojen muodossa yrittäessään lisätä merkintöjä automaattisesti uusiin kuviin. Ensimmäiset menetelmät tutkivat korrelaatioita kuvan ominaisuuksien ja koulutusmerkintöjen välillä, sitten kehitettiin menetelmiä käyttämällä konekäännöstä, jolla yritettiin kääntää tekstisanakirjaa "visuaalisella sanastolla" tai klusterialueilla, jotka tunnetaan nimellä blobs. Näitä pyrkimyksiä seurannut työ sisälsi luokittelulähestymistapoja, relevanssimalleja ja niin edelleen.

Automaattisen kuvamerkinnän etuna sisältökuvahakuun (CBIR) verrattuna on, että käyttäjä voi määrittää kyselyt luonnollisemmin. [1] CBIR vaatii tyypillisesti (tällä hetkellä) käyttäjiä etsimään kuvakäsitteitä, kuten väriä ja tekstuuria, tai etsimään esimerkkikyselyitä. Jotkut esimerkkikuvien kuvaominaisuudet voivat ohittaa käsitteen, johon käyttäjä todella keskittyy. Perinteiset kuvahakumenetelmät perustuvat manuaalisesti merkittyihin kuviin, mikä on kallis ja aikaa vievä prosessi, etenkin kun otetaan huomioon olemassa olevat suuret ja jatkuvasti kasvavat kuvatietokannat.

Useita moottoreita on kytketty Internetiin, mukaan lukien Pennsylvania State Universityn ja Beholdin tutkijoiden kehittämä reaaliaikainen merkintämoottori [2] . Yritykset, kuten Playment, Edgecase.ai, Microsoft VOTT.ai ja dataloop.ai, ovat luoneet sisäänrakennettuja automaattisia videomerkintöjä. Yritykset, kuten Alegion.com, Infolks, DataPure.co, Scaleapi.com, Diffgram.com, Figure-eight.com, tarjoavat yhdistelmän automaattista kuvamerkintää ja manuaalista tarkistusta, kun automaatio epäonnistuu.

Muistiinpanot

  1. Masashi Inoue. Annotaatiopohjaisen kuvanhaun tarpeesta  // National Institute of Informatics 2-1-2 Hitotsubashi, Chiyoda-ku Tokio, Japani.
  2. ALIPR.com (downlink) . Arkistoitu alkuperäisestä 3. maaliskuuta 2016.