MNIST (tietokanta)

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 14. tammikuuta 2019 tarkistetusta versiosta . tarkastukset vaativat 9 muokkausta .

MNIST -tietokanta (lyhenne sanoista Modified National Institute of Standards and Technology ) on suuri käsinkirjoitettujen numeronäytteiden tietokanta. Tietokanta on US National Institute of Standards and Technology -instituutin ehdottama standardi , jonka tarkoituksena on kalibroida ja vertailla kuvantunnistusmenetelmiä pääasiassa hermoverkkoihin perustuvan koneoppimisen avulla [1] [2] . Aineisto koostuu esivalmistetuista esimerkkikuvista, joiden pohjalta suoritetaan koulutusta ja järjestelmien testausta [3] [4] . Tietokanta luotiin alkuperäisen NIST 20x20 pikselin mustavalkomallisarjan uudelleentyöstön jälkeen . NIST-tietokannan luojat puolestaan käyttivät joukkoa US Census Bureaun näytteitä , joihin lisättiin lisää amerikkalaisten yliopistojen opiskelijoiden kirjoittamia testinäytteitä [5] . NIST-sarjan näytteet normalisoitiin, antialiasoitiin ja pienennettiin 28 x 28 pikselin harmaasävykuvaksi [5] .

MNIST-tietokanta sisältää 60 000 kuvaa koulutukseen ja 10 000 kuvaa testaukseen [6] . Puolet koulutus- ja testausnäytteistä oli NIST-harjoitussarjasta ja toinen puoli oli NIST-testauspakkauksesta [7] .

MNIST-tietokannan harjoittamisen jälkeen on yritetty saavuttaa mahdollisimman vähän virheitä, ja niistä on keskusteltu tieteellisessä kirjallisuudessa. Ennätystuloksia esitettiin konvoluutiohermoverkkojen käyttöä koskevissa julkaisuissa , virheprosentti nostettiin 0,23 %:iin [8] . Tietokannan luojat itse tarjosivat useita testausmenetelmiä [5] . Alkuperäinen työ osoittaa, että tukivektorikoneella voidaan saavuttaa 0,8 %:n virhetaso [9] .

Tuloksen laatu ja lähestymistapojen kehitys

Joissakin teoksissa on havaittu korkeita tuloksia useiden hermoverkkojen ryhmille rakennetuista järjestelmistä; samalla MNIST-kannan numerotunnistuksen laatu osoittautuu ihmisen tasoa vastaavaksi ja muissa tunnistustehtävissä, erityisesti liikennemerkkien osalta, jopa kaksi kertaa parempi [8] .

Tekijöiden alkuperäisillä sivuilla [5] havaitaan 12 %:n virheitä käytettäessä yksinkertaisia lineaarisia luokittimia ilman esikäsittelyä [9] .

Vuonna 2004 Rosenblattin kolmikerroksista perceptronia käyttävä LIRA-järjestelmä saavutti 0,42 %:n virheprosentin [10] .

MNIST-järjestelmän mukaisesta oppimisesta tehtiin tutkimus satunnaisia vääristymiä käyttäen. Affiinit tai elastiset muunnokset otettiin käyttöön vääristyminä [5] . Joskus tällaiset järjestelmät saavuttivat hyviä tuloksia, erityisesti 0,39 prosentin virhetasosta on julkaisuja [11] .

Vuonna 2011 hermoverkkojen avulla saavutettiin 0,27 prosentin virhetaso [12] . Vuonna 2013 ilmestyi julkaisuja 0,21 %:n virheen saavuttamisesta hermoverkkojen regularisoinnilla ( DropConnect -yhteyskatkojen kautta ) [13] .

Myöhemmin yhden konvoluutiohermoverkon käyttö mahdollisti laadun parantamisen 0,31 %:n virhetasolle [14] . Parhaan tuloksen yhdellä konvoluutiohermoverkolla osoitti 74 harjoitusjakson jälkeen saatu järjestelmä - 0,27 % [15] . Viiden konvoluutiohermoverkon kokonaisuus mahdollisti kuitenkin 0,21 %:n virhesuhteen [16] [17] . Vuonna 2018 Random Multimodel Deep Learning (RMDL) -tutkijat raportoivat 0,18 prosentin virheestä, mikä parantaa aiempaa parasta tulosta: uusi kokonaisuus, syväoppimismenetelmä luokitteluun [18] .

Järjestelmien vertailu

Taulukko sisältää esimerkkejä koneoppimisen tuloksista erilaisissa kuvien luokitusjärjestelmissä: [19]

Tyyppi	Rakenne	vääristymä	Esikäsittely	Virhe (%)
Lineaarinen luokitin	Yksitasoinen perceptroni	Ei	Ei	12 [8]
Lineaarinen luokitin	Pariittainen lineaarinen luokitin	Ei	linjaus	7.6 [9]
k lähimmän naapurin menetelmä	K-NN epälineaarisella muodonmuutoksella (P2DHMDM)	Ei	siirrettävät reunat	0,52 [20]
gradientin tehostaminen	Haar-ominaisuuksiin perustuva jäännöskäsittely	Ei	Haarin merkkejä	0,87 [21]
Epälineaarinen luokitin	40 PCA + neliöllinen luokitin	Ei	Ei	3.3 [9]
Tuki vektorikonetta	Virtual Support Vector System , deg-9 poly, 2-pikseliä värinää	Ei	linjaus	0,56 [22]
Neuroverkko	2-tasoinen verkko 784-800-10	Ei	Ei	1,6 [23]
Neuroverkko	2-tasoinen verkko 784-800-10	Elastiset muodonmuutokset	Ei	0,7 [23]
Syvä hermoverkko	6-kerroksinen verkko 784-2500-2000-1500-1000-500-10	Elastiset muodonmuutokset	Ei	0,35 [24]
Konvoluutiohermoverkko	6-kerroksinen verkko 784-40-80-500-1000-2000-10	Ei	Tietolaajennus koulutusta varten	0,31 [14]
Konvoluutiohermoverkko	6-kerroksinen verkko 784-50-100-500-1000-10-10	Ei	Tietolaajennus koulutusta varten	0,27 [15]
Konvoluutiohermoverkko	35 CNN-verkon kokonaisuus, 1-20-P-40-P-150-10	Elastiset muodonmuutokset	Normalisoinnin kanssa	0,23 [8]
Konvoluutiohermoverkko	5 CNN-verkon kokonaisuus, 6 tasoa 784-50-100-500-1000-10-10	Ei	Tietolaajennus koulutusta varten	0,21 [16]
Random Multi-Model Deep Learning (RMDL)	30 satunnaista syväoppimismallia (RDL) (10 CNN:tä, 10 RNN:tä ja 10 DNN:tä)	Ei	Ei	0,18 [18]

Katso myös

koneoppimistutkimukseen
Caltech 101
imagenet
LabelMe

Muistiinpanot

↑ Tuki vektorikoneiden nopeuskuviontunnistusta - Vision Systems Design . Vision Systems Design . Haettu: 17. elokuuta 2013. (määrätön)
↑ Gangaputra, Sachin Käsinkirjoitettu numerotietokanta . Haettu: 17. elokuuta 2013. (määrätön)
↑ Qiao, Yu MNIST-TIETOKANTA käsinkirjoitetuista numeroista (2007). Haettu: 18. elokuuta 2013. (määrätön)
↑ Platt, John C. Analyyttisen QP:n ja harvalukuisuuden käyttäminen tukivektorikoneiden koulutuksen nopeuttamiseen // Advances in Neural Information Processing Systems : Journal. - 1999. - P. 557-563 . Arkistoitu alkuperäisestä 4. maaliskuuta 2016.
↑ 1 2 3 4 5 LeCun, Yann MNIST käsinkirjoitettu numerotietokanta, Yann LeCun, Corinna Cortes ja Chris Burges . Haettu: 17. elokuuta 2013. (määrätön)
↑ Kussul, Ernst; Tatiana Baidyk. Parannettu menetelmä käsinkirjoitettujen numeroiden tunnistamiseen testattu MNIST-tietokannassa // Image and Vision Computing: Journal. - 2004. - Voi. 22 , ei. 12 . - s. 971-981 . - doi : 10.1016/j.imavis.2004.03.008 .
↑ Zhang, Bin; Sargur N. Srihari. Nopea k -Lähimmän naapurin luokittelu klusteripohjaisten puiden avulla // IEEE- tapahtumat kuvioanalyysistä ja koneälystä : päiväkirja. - 2004. - Voi. 26 , nro. 4 . - s. 525-528 . - doi : 10.1109/TPAMI.2004.1265868 . — PMID 15382657 .
↑ 1 2 3 4 Cires¸an, Dan; Ueli Meier; Jürgen Schmidhuber. Monisarakkeiset syvät neuroverkot kuvien luokitteluun // 2012 IEEE Conference on Computer Vision and Pattern Recognition : Journal. - 2012. - S. 3642-3649 . — ISBN 978-1-4673-1228-8 . - doi : 10.1109/CVPR.2012.6248110 . - arXiv : 1202.2745 .
↑ 1 2 3 4 LeCun, Yann; Leon Bottou; Yoshua Bengio; Patrick Haffner. Gradienttipohjaista oppimista sovelletaan asiakirjan tunnistamiseen // Proceedings of the IEEE 86 : Journal. - 1998. - Voi. 86 , no. 11 . - P. 2278-2324 . - doi : 10.1109/5.726791 .
↑ Kussul, Ernst; Tatiana Baidyk. Parannettu menetelmä käsinkirjoitettujen numeroiden tunnistamiseen testattu MNIST-tietokannassa // Image and Vision Computing: Journal. - 2004. - Voi. 22 . - s. 971-981 . - doi : 10.1016/j.imavis.2004.03.008 . Arkistoitu alkuperäisestä 21. syyskuuta 2013.
↑ Ranzato, Marc'Aurelio; Christopher Poultney; Sumit Chopra; Yann LeCun. Harvaiden esitysten tehokas oppiminen energiapohjaisella mallilla // Advances in Neural Information Processing Systems : Journal. - 2006. - Voi. 19 . - s. 1137-1144 .
↑ Ciresan, Dan Claudiu; Ueli Meier; Luca Maria Gambardella; Jürgen Schmidhuber. Konvoluutiohermoverkkokomiteat käsinkirjoitettujen merkkien luokitteluun (englanniksi) // 2011 International Conference on Document Analysis and Recognition (ICDAR) : aikakauslehti. - 2011. - S. 1135-1139 . - doi : 10.1109/ICDAR.2011.229 . Arkistoitu alkuperäisestä 22. helmikuuta 2016.
↑ Wang, Li; Matthew Zeiler; Sixin Zhang; Yann LeCun; Rob Fergus (2013). Neuraaliverkon laillistaminen DropConnectilla . Kansainvälinen koneoppimiskonferenssi (ICML).
↑ 1 2 Romanuke, Vadim Yksittäinen konvoluutiohermoverkko, joka on paras suorituskyky 18 aikakauteen laajennetun harjoitustiedon perusteella Khmelnitskissä, Ukrainassa . Käyttöönottopäivä: 16.11.2016. (määrätön)
↑ 1 2 Romanuke, Vadim Parallel Computing Center (Hmelnitskiy, Ukraina) antaa yhden konvoluutiohermoverkon, joka toimii MNIST:ssä 0,27 prosentin virhetasolla. . Käyttöönottopäivä: 24.11.2016. (määrätön)
↑ 1 2 Romanuke, Vadim Parallel Computing Center (Hmelnitskiy, Ukraina) edustaa 5 konvoluutiohermoverkon kokonaisuutta, joka toimii MNIST:ssä 0,21 prosentin virhetasolla. . Käyttöönottopäivä: 24.11.2016. (määrätön)
↑ Romanuke, Vadim. Koulutusdatan laajentaminen ja konvoluutiohermoverkkojen tehostaminen MNIST-tietojoukon virhesuhteen vähentämiseksi // Research Bulletin of NTUU “Kyiv Polytechnic Institute” : Journal. - 2016. - Vol. 6 . - s. 29-34 . - doi : 10.20535/1810-0546.2016.6.84115 .
↑ 1 2 Kowsari, Kamran; Heidarysafa, Mojtaba; Brown, Donald E.; Meimandi, Kiana Jafari; Barnes, Laura E. RMDL: Random Multimodel Deep Learning for Classification (3. toukokuuta 2018). Haettu: 10.5.2018. (määrätön)
↑ Le Cunn, käsinkirjoitettujen numeroiden MNIST-TIETOKANTA
↑ Keysers, Daniel; Thomas Deselaers; Christian Golan; Hermann Ney. Muodonmuutosmallit kuvantunnistukseen (määrittämätön) // EEE Transactions on Pattern Analysis and Machine Intelligence. - 2007. - elokuu ( osa 29 , nro 8 ). - S. 1422-1435 .
↑ Kégl, Balázs; Robert Busa-Fekete. Perusluokittajien tuotteiden tehostaminen (määrittämätön) // Proceedings of the 26th Annual International Conference on Machine Learning. - 2009. - S. 497-504 .
↑ DeCoste ja Scholkopf, MLJ 2002
↑ 1 2 Patrice Y. Simard; Dave Steinkraus; John C. Platt. Visuaaliseen dokumenttianalyysiin sovelletut konvoluutiohermoverkkojen parhaat käytännöt // Document Analysis and Recognition, 2003. Proceedings. Seitsemäs kansainvälinen konferenssi aiheesta: Journal. - IEEE, 2003. - doi : 10.1109/ICDAR.2003.1227801 .
↑ Ciresan, Claudiu Dan; Dan, Ueli Meier, Luca Maria Gambardella ja Juergen Schmidhuber. Deep Big Simple Neural Nets Excel käsinkirjoitettujen numeroiden tunnistamisessa // Neural Computation : Journal. - 2010. - joulukuu ( osa 22 , nro 12 ). - doi : 10.1162/NECO_a_00052 . - arXiv : 1003.0358 .

Kirjallisuus

Ciresan, Dan; Meier, Ueli; Schmidhuber, Jürgen. Monisarakkeiset syvät neuroverkot kuvien luokitteluun // IEEE-konferenssi 2012 Computer Vision and Pattern Recognition : päiväkirja. - New York, NY: Institute of Electrical and Electronics Engineers (IEEE), 2012. - kesäkuu. - P. 3642-3649 . — ISBN 9781467312264 . - doi : 10.1109/CVPR.2012.6248110 . - arXiv : 1202.2745v1 .

Linkit

MNIST käsinkirjoitettu numerotietokanta, Yann LeCun, Corinna Cortes ja Chris Burges – tietokannan koti
Neuraaliverkko käsinkirjoitettujen numeroiden tunnistamiseen JavaScriptissä — hermoverkon JavaScript-toteutus käsinkirjoitettujen numeroiden luokitteluun MNIST-tietokantaan perustuvan