MNIST (tietokanta)
Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 14. tammikuuta 2019 tarkistetusta
versiosta . tarkastukset vaativat
9 muokkausta .
MNIST -tietokanta (lyhenne sanoista Modified National Institute of Standards and Technology ) on suuri käsinkirjoitettujen numeronäytteiden tietokanta. Tietokanta on US National Institute of Standards and Technology -instituutin ehdottama standardi , jonka tarkoituksena on kalibroida ja vertailla kuvantunnistusmenetelmiä pääasiassa hermoverkkoihin perustuvan koneoppimisen avulla [1] [2] . Aineisto koostuu esivalmistetuista esimerkkikuvista, joiden pohjalta suoritetaan koulutusta ja järjestelmien testausta [3] [4] . Tietokanta luotiin alkuperäisen NIST 20x20 pikselin mustavalkomallisarjan uudelleentyöstön jälkeen . NIST-tietokannan luojat puolestaan käyttivät joukkoa US Census Bureaun näytteitä , joihin lisättiin lisää amerikkalaisten yliopistojen opiskelijoiden kirjoittamia testinäytteitä [5] . NIST-sarjan näytteet normalisoitiin, antialiasoitiin ja pienennettiin 28 x 28 pikselin harmaasävykuvaksi [5] .
MNIST-tietokanta sisältää 60 000 kuvaa koulutukseen ja 10 000 kuvaa testaukseen [6] . Puolet koulutus- ja testausnäytteistä oli NIST-harjoitussarjasta ja toinen puoli oli NIST-testauspakkauksesta [7] .
MNIST-tietokannan harjoittamisen jälkeen on yritetty saavuttaa mahdollisimman vähän virheitä, ja niistä on keskusteltu tieteellisessä kirjallisuudessa. Ennätystuloksia esitettiin konvoluutiohermoverkkojen käyttöä koskevissa julkaisuissa , virheprosentti nostettiin 0,23 %:iin [8] . Tietokannan luojat itse tarjosivat useita testausmenetelmiä [5] . Alkuperäinen työ osoittaa, että tukivektorikoneella voidaan saavuttaa 0,8 %:n virhetaso [9] .
Tuloksen laatu ja lähestymistapojen kehitys
Joissakin teoksissa on havaittu korkeita tuloksia useiden hermoverkkojen ryhmille rakennetuista järjestelmistä; samalla MNIST-kannan numerotunnistuksen laatu osoittautuu ihmisen tasoa vastaavaksi ja muissa tunnistustehtävissä, erityisesti liikennemerkkien osalta, jopa kaksi kertaa parempi [8] .
Tekijöiden alkuperäisillä sivuilla [5] havaitaan 12 %:n virheitä käytettäessä yksinkertaisia lineaarisia luokittimia ilman esikäsittelyä [9] .
Vuonna 2004 Rosenblattin kolmikerroksista perceptronia käyttävä LIRA-järjestelmä saavutti 0,42 %:n virheprosentin [10] .
MNIST-järjestelmän mukaisesta oppimisesta tehtiin tutkimus satunnaisia vääristymiä käyttäen. Affiinit tai elastiset muunnokset otettiin käyttöön vääristyminä [5] . Joskus tällaiset järjestelmät saavuttivat hyviä tuloksia, erityisesti 0,39 prosentin virhetasosta on julkaisuja [11] .
Vuonna 2011 hermoverkkojen avulla saavutettiin 0,27 prosentin virhetaso [12] . Vuonna 2013 ilmestyi julkaisuja 0,21 %:n virheen saavuttamisesta hermoverkkojen regularisoinnilla ( DropConnect -yhteyskatkojen kautta ) [13] .
Myöhemmin yhden konvoluutiohermoverkon käyttö mahdollisti laadun parantamisen 0,31 %:n virhetasolle [14] . Parhaan tuloksen yhdellä konvoluutiohermoverkolla osoitti 74 harjoitusjakson jälkeen saatu järjestelmä - 0,27 % [15] . Viiden konvoluutiohermoverkon kokonaisuus mahdollisti kuitenkin 0,21 %:n virhesuhteen [16] [17] . Vuonna 2018 Random Multimodel Deep Learning (RMDL) -tutkijat raportoivat 0,18 prosentin virheestä, mikä parantaa aiempaa parasta tulosta: uusi kokonaisuus, syväoppimismenetelmä luokitteluun [18] .
Järjestelmien vertailu
Taulukko sisältää esimerkkejä koneoppimisen tuloksista erilaisissa kuvien luokitusjärjestelmissä: [19]
Tyyppi |
Rakenne |
vääristymä |
Esikäsittely |
Virhe (%)
|
Lineaarinen luokitin |
Yksitasoinen perceptroni |
Ei |
Ei |
12 [8]
|
Lineaarinen luokitin |
Pariittainen lineaarinen luokitin |
Ei |
linjaus |
7.6 [9]
|
k lähimmän naapurin menetelmä |
K-NN epälineaarisella muodonmuutoksella (P2DHMDM) |
Ei |
siirrettävät reunat |
0,52 [20]
|
gradientin tehostaminen |
Haar-ominaisuuksiin perustuva jäännöskäsittely |
Ei |
Haarin merkkejä |
0,87 [21]
|
Epälineaarinen luokitin |
40 PCA + neliöllinen luokitin |
Ei |
Ei |
3.3 [9]
|
Tuki vektorikonetta |
Virtual Support Vector System , deg-9 poly, 2-pikseliä värinää |
Ei |
linjaus |
0,56 [22]
|
Neuroverkko |
2-tasoinen verkko 784-800-10 |
Ei |
Ei |
1,6 [23]
|
Neuroverkko |
2-tasoinen verkko 784-800-10 |
Elastiset muodonmuutokset |
Ei |
0,7 [23]
|
Syvä hermoverkko |
6-kerroksinen verkko 784-2500-2000-1500-1000-500-10 |
Elastiset muodonmuutokset |
Ei |
0,35 [24]
|
Konvoluutiohermoverkko |
6-kerroksinen verkko 784-40-80-500-1000-2000-10 |
Ei |
Tietolaajennus koulutusta varten |
0,31 [14]
|
Konvoluutiohermoverkko |
6-kerroksinen verkko 784-50-100-500-1000-10-10 |
Ei |
Tietolaajennus koulutusta varten |
0,27 [15]
|
Konvoluutiohermoverkko |
35 CNN-verkon kokonaisuus, 1-20-P-40-P-150-10 |
Elastiset muodonmuutokset |
Normalisoinnin kanssa |
0,23 [8]
|
Konvoluutiohermoverkko |
5 CNN-verkon kokonaisuus, 6 tasoa 784-50-100-500-1000-10-10 |
Ei |
Tietolaajennus koulutusta varten |
0,21 [16]
|
Random Multi-Model Deep Learning (RMDL) |
30 satunnaista syväoppimismallia (RDL) (10 CNN:tä, 10 RNN:tä ja 10 DNN:tä) |
Ei |
Ei |
0,18 [18]
|
Katso myös
Muistiinpanot
- ↑ Tuki vektorikoneiden nopeuskuviontunnistusta - Vision Systems Design . Vision Systems Design . Haettu: 17. elokuuta 2013. (määrätön)
- ↑ Gangaputra, Sachin Käsinkirjoitettu numerotietokanta . Haettu: 17. elokuuta 2013. (määrätön)
- ↑ Qiao, Yu MNIST-TIETOKANTA käsinkirjoitetuista numeroista (2007). Haettu: 18. elokuuta 2013. (määrätön)
- ↑ Platt, John C. Analyyttisen QP:n ja harvalukuisuuden käyttäminen tukivektorikoneiden koulutuksen nopeuttamiseen // Advances in Neural Information Processing Systems : Journal. - 1999. - P. 557-563 . Arkistoitu alkuperäisestä 4. maaliskuuta 2016.
- ↑ 1 2 3 4 5 LeCun, Yann MNIST käsinkirjoitettu numerotietokanta, Yann LeCun, Corinna Cortes ja Chris Burges . Haettu: 17. elokuuta 2013. (määrätön)
- ↑ Kussul, Ernst; Tatiana Baidyk. Parannettu menetelmä käsinkirjoitettujen numeroiden tunnistamiseen testattu MNIST-tietokannassa // Image and Vision Computing: Journal. - 2004. - Voi. 22 , ei. 12 . - s. 971-981 . - doi : 10.1016/j.imavis.2004.03.008 .
- ↑ Zhang, Bin; Sargur N. Srihari. Nopea k -Lähimmän naapurin luokittelu klusteripohjaisten puiden avulla // IEEE- tapahtumat kuvioanalyysistä ja koneälystä : päiväkirja. - 2004. - Voi. 26 , nro. 4 . - s. 525-528 . - doi : 10.1109/TPAMI.2004.1265868 . — PMID 15382657 .
- ↑ 1 2 3 4 Cires¸an, Dan; Ueli Meier; Jürgen Schmidhuber. Monisarakkeiset syvät neuroverkot kuvien luokitteluun // 2012 IEEE Conference on Computer Vision and Pattern Recognition : Journal. - 2012. - S. 3642-3649 . — ISBN 978-1-4673-1228-8 . - doi : 10.1109/CVPR.2012.6248110 . - arXiv : 1202.2745 .
- ↑ 1 2 3 4 LeCun, Yann; Leon Bottou; Yoshua Bengio; Patrick Haffner. Gradienttipohjaista oppimista sovelletaan asiakirjan tunnistamiseen // Proceedings of the IEEE 86 : Journal. - 1998. - Voi. 86 , no. 11 . - P. 2278-2324 . - doi : 10.1109/5.726791 .
- ↑ Kussul, Ernst; Tatiana Baidyk. Parannettu menetelmä käsinkirjoitettujen numeroiden tunnistamiseen testattu MNIST-tietokannassa // Image and Vision Computing: Journal. - 2004. - Voi. 22 . - s. 971-981 . - doi : 10.1016/j.imavis.2004.03.008 . Arkistoitu alkuperäisestä 21. syyskuuta 2013.
- ↑ Ranzato, Marc'Aurelio; Christopher Poultney; Sumit Chopra; Yann LeCun. Harvaiden esitysten tehokas oppiminen energiapohjaisella mallilla // Advances in Neural Information Processing Systems : Journal. - 2006. - Voi. 19 . - s. 1137-1144 .
- ↑ Ciresan, Dan Claudiu; Ueli Meier; Luca Maria Gambardella; Jürgen Schmidhuber. Konvoluutiohermoverkkokomiteat käsinkirjoitettujen merkkien luokitteluun (englanniksi) // 2011 International Conference on Document Analysis and Recognition (ICDAR) : aikakauslehti. - 2011. - S. 1135-1139 . - doi : 10.1109/ICDAR.2011.229 . Arkistoitu alkuperäisestä 22. helmikuuta 2016.
- ↑ Wang, Li; Matthew Zeiler; Sixin Zhang; Yann LeCun; Rob Fergus (2013). Neuraaliverkon laillistaminen DropConnectilla . Kansainvälinen koneoppimiskonferenssi (ICML).
- ↑ 1 2 Romanuke, Vadim Yksittäinen konvoluutiohermoverkko, joka on paras suorituskyky 18 aikakauteen laajennetun harjoitustiedon perusteella Khmelnitskissä, Ukrainassa . Käyttöönottopäivä: 16.11.2016. (määrätön)
- ↑ 1 2 Romanuke, Vadim Parallel Computing Center (Hmelnitskiy, Ukraina) antaa yhden konvoluutiohermoverkon, joka toimii MNIST:ssä 0,27 prosentin virhetasolla. . Käyttöönottopäivä: 24.11.2016. (määrätön)
- ↑ 1 2 Romanuke, Vadim Parallel Computing Center (Hmelnitskiy, Ukraina) edustaa 5 konvoluutiohermoverkon kokonaisuutta, joka toimii MNIST:ssä 0,21 prosentin virhetasolla. . Käyttöönottopäivä: 24.11.2016. (määrätön)
- ↑ Romanuke, Vadim. Koulutusdatan laajentaminen ja konvoluutiohermoverkkojen tehostaminen MNIST-tietojoukon virhesuhteen vähentämiseksi // Research Bulletin of NTUU “Kyiv Polytechnic Institute” : Journal. - 2016. - Vol. 6 . - s. 29-34 . - doi : 10.20535/1810-0546.2016.6.84115 .
- ↑ 1 2 Kowsari, Kamran; Heidarysafa, Mojtaba; Brown, Donald E.; Meimandi, Kiana Jafari; Barnes, Laura E. RMDL: Random Multimodel Deep Learning for Classification (3. toukokuuta 2018). Haettu: 10.5.2018. (määrätön)
- ↑ Le Cunn, käsinkirjoitettujen numeroiden MNIST-TIETOKANTA
- ↑ Keysers, Daniel; Thomas Deselaers; Christian Golan; Hermann Ney. Muodonmuutosmallit kuvantunnistukseen (määrittämätön) // EEE Transactions on Pattern Analysis and Machine Intelligence. - 2007. - elokuu ( osa 29 , nro 8 ). - S. 1422-1435 .
- ↑ Kégl, Balázs; Robert Busa-Fekete. Perusluokittajien tuotteiden tehostaminen (määrittämätön) // Proceedings of the 26th Annual International Conference on Machine Learning. - 2009. - S. 497-504 .
- ↑ DeCoste ja Scholkopf, MLJ 2002
- ↑ 1 2 Patrice Y. Simard; Dave Steinkraus; John C. Platt. Visuaaliseen dokumenttianalyysiin sovelletut konvoluutiohermoverkkojen parhaat käytännöt // Document Analysis and Recognition, 2003. Proceedings. Seitsemäs kansainvälinen konferenssi aiheesta: Journal. - IEEE, 2003. - doi : 10.1109/ICDAR.2003.1227801 .
- ↑ Ciresan, Claudiu Dan; Dan, Ueli Meier, Luca Maria Gambardella ja Juergen Schmidhuber. Deep Big Simple Neural Nets Excel käsinkirjoitettujen numeroiden tunnistamisessa // Neural Computation : Journal. - 2010. - joulukuu ( osa 22 , nro 12 ). - doi : 10.1162/NECO_a_00052 . - arXiv : 1003.0358 .
Kirjallisuus
Linkit