ImageNet- tietokanta on hanke, jolla luodaan ja ylläpidetään massiivista tietokantaa kommentoiduista kuvista, jotka on suunniteltu kehittämään ja testaamaan kuvantunnistus- ja konenäkömenetelmiä . Vuodesta 2016 lähtien tietokantaan oli tallennettu noin kymmenen miljoonaa kuvilla varustettua URL-osoitetta, jotka merkittiin manuaalisesti ImageNetille, merkinnöissä listattiin kuvan päälle pudonneet kohteet ja suorakulmiot koordinaatteineen. [1] Tietokanta kolmansien osapuolien kommentoiduista ja URL-kuvista on saatavilla suoraan ImageNetin kautta, mutta itse kuvat eivät ole projektin omaisuutta [2] . Vuodesta 2010 lähtien on ollut käynnissä ILSVRC ( ImageNet Large Scale Visual Recognition Challenge ) -projekti , jossa eri ohjelmistotuotteet kilpailevat vuosittain ImageNet-tietokannan esineiden ja kohtausten luokittelussa ja tunnistamisessa.
ImageNet käyttää joukkolähdettä kuvien huomautuksiin.
Itse kuvien tasolla olevat huomautukset osoittavat tämän luokan esineen olemassaolon tai puuttumisen (esimerkiksi "kuvassa on tiikeri" tai "kuvassa ei ole tiikereitä"). Objektitasolla huomautus sisältää suorakulmion, jossa on objektin näkyvän osan koordinaatit. ImageNet käyttää esineiden luokitteluun WordNetin semanttisen verkon varianttia , joka on melko yksityiskohtainen, esimerkiksi koiraroduja edustaa 120 luokkaa. Kuhunkin WordNet -solmuun liittyy satoja tai tuhansia kuvia, mutta vuoden 2016 keskiarvo on noin 500 kuvaa [3] .
Elokuussa 2017 ImageNetissä on 14 197 122 kuvaa , jotka on jaettu 21 841 luokkaan.
Vuodesta 2010 lähtien ILSVRC-hankkeen puitteissa on järjestetty tutkimusryhmien välisiä kilpailuja esineiden luokittelussa. ILSVCR sai inspiraationsa pienestä vuoden 2005 PASCAL VOC -kampanjasta, jossa oli 20 000 kuvaa ja 20 ominaisuusluokkaa [3] . Kuviontunnistuksessa edistyttiin merkittävästi vuonna 2010. Vuonna 2011 25 % luokitusvirhettä pidettiin hyvänä tuloksena. Vuonna 2012 konvoluutiohermoverkkoon perustuva syväoppimisjärjestelmä pystyi saavuttamaan 16 % virheen; ja seuraavina vuosina virhe putosi muutamaan prosenttiin [4] . Vuonna 2015 tutkijat totesivat, että ILSVRC-projektin tiettyjen tehtävien ohjelmat ylittivät ihmisen kyvyt [5] . Kuten yksi kampanjan järjestäjistä Olga Russakovskaja kuitenkin huomautti, ohjelmien on silti määritettävä objektit yhteen tuhannesta kategoriasta, ja ihmiset voivat tunnistaa useampia luokkia ja (toisin kuin ohjelmat) voivat myös osoittaa kuvien kontekstin [6 ] .
Vuonna 2014 kampanjaan liittyi yli 50 organisaatiota [3] . Vuonna 2015 Baidu -projektin tutkijat keskeytettiin vuodeksi, koska he osallistuivat projektiin useilla eri nimillä kiertääkseen kahden viikon rajan [7] [8] . Baidu ilmoitti myöhemmin, että ryhmän johtaja oli erotettu ja että erityinen tieteellinen neuvoa-antava ryhmä koottaisiin [9] .