Ulottuvuuden kirous

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 28. huhtikuuta 2021 tarkistetusta versiosta . tarkastukset vaativat 4 muokkausta .

Ulottuvuuden kirous (CU) on termi, jota käytetään liittyen useisiin korkeadimensionaalisten tilojen ominaisuuksiin ja kombinatorisiin ongelmiin . Ensinnäkin tämä koskee tarvittavan kokeellisen datan eksponentiaalista kasvua avaruuden ulottuvuudesta riippuen, kun ratkaistaan ​​todennäköisyys-tilastollisen kuviontunnistuksen , koneoppimisen , luokituksen ja erotteluanalyysin ongelmia . Tämä koskee myös kombinatoristen ongelmien vaihtoehtojen lukumäärän eksponentiaalista kasvua lähtötietojen koosta riippuen, mikä johtaa vastaavaan laskenta-algoritmien monimutkaisuuden lisääntymiseen. "Kirous" vaikuttaa myös jatkuviin optimointimenetelmiin moniulotteisen tavoitefunktion monimutkaisuuden vuoksi. Laajemmassa merkityksessä termiä sovelletaan kaikkiin korkeaulotteisten tilojen "epämukaviin" tai epätavallisiin ominaisuuksiin ja niiden tutkimuksen vaikeuksiin. Kombinatoriikassa ne eivät usein tarkoita tilan ulottuvuutta, vaan lähtötiedon kokoa. Erityisesti Ramseyn teorian ongelmissa olisi tarkempaa puhua lähtötiedon '''koon kirouksesta''' myös silloin, kun kyseessä ovat minimaaliset ongelmat - ongelman määrittelevien parametrien lukumäärä. Terminin esitteli ensimmäisenä Richard Bellman liittyen dynaamisen ohjelmoinnin yleiseen ongelmaan [1] [2] . Tätä ilmaisua käytetään edelleen teknistä kybernetiikkaa, koneoppimista ja monimutkaisten järjestelmien analysointia koskevissa teoksissa, myös tieteellisten artikkeleiden otsikoissa [3] .

Tyypillisiä esimerkkejä

Tunnistusongelmissa

Todennäköisyystunnistusongelmissa on kaksi tilannetta, joissa ulottuvuuden kirous voidaan voittaa yleisten lähestymistapojen avulla.

  1. Tilanne on mahdollinen, kun toisistaan ​​riippuvaisten satunnaismuuttujien vektorin jakauma on keskittynyt pienemmän ulottuvuuden aliavaruuteen, eli vektori voidaan hyvin approksimoida pienemmän muuttujamäärän lineaarifunktiolla. Tässä tapauksessa pääkomponenttimenetelmä mahdollistaa mittasuhteen pienentämisen. Lisäksi tunnistuksen (syrjinnän) asetetut tehtävät voidaan ratkaista jo matalan ulottuvuuden tilassa.
  2. Tilanne on mahdollinen, kun tutkittujen vektorien satunnaismuuttujat ovat riippumattomia tai realistisemmin heikosti riippuvaisia ​​toisistaan. Tässä tapauksessa voidaan palauttaa satunnaismuuttujien yksiulotteiset jakaumat ja rakentaa monimuuttujajakaumia niiden tuotteiksi. Edelleen käyttämällä samaa harjoitusnäytettä liukuvassa koemoodissa voidaan palauttaa differentioituvien luokkien todennäköisyysfunktioiden suhteen yksiulotteinen jakauma , mikä eliminoi keskinäiseen riippuvuuteen liittyvän harhan päätöksentekosäännössä.

Yleensä moniulotteisen datan analysointiin ehdotetaan metrisen lähin naapurin menetelmää [4] [5] . Menetelmän etuna on, että muodollisesti sitä voidaan soveltaa minkä kokoisiin näytteisiin riippumatta vektorien dimensiosta. Mutta PR:n pohjimmiltaan sovellettu ongelma on, että rajoitetussa datanäytteessä ei ole tarpeeksi tietoa objektista, jota kuvataan suurella määrällä merkittäviä parametreja. Ja jos tämä kuvaus on todella monimutkainen ja moniulotteinen, ja ongelman ratkaisu vaatii koko parametrikompleksin analyysin, niin ongelma osoittautuu vaikeaksi eikä sitä voida ratkaista yleisillä menetelmillä.

Optimointiongelmat

Optimointitehtävissä on myös menetelmiä, jotka helpottavat suurten ongelmien ratkaisemista.

Kaikki nämä taistelumenetelmät eivät ratkaise PR-ongelmaa radikaalisti ja ovat tehokkaita vain erityistapauksissa.

Ramseyn teoriassa

Vaikka Ramseyn teoriaongelmat yleensä sallivat moniulotteiset yleistykset, ne ovat vaikeita jopa pienillä mitoilla ja pienillä syötetietokooilla.

Kombinatorisessa geometriassa

Kombinatorisessa geometriassa on useita vaikeita tiukasti matemaattisia ongelmia, jotka liittyvät suoraan tilan ulottuvuuteen.

Jotkut moniulotteisten tilojen "epätavalliset" ominaisuudet

Muistiinpanot

  1. Richard Ernest Bellman; rand yhtiö. Dynaaminen ohjelmointi  (rajoittamaton) . - Princeton University Press , 1957. - ISBN 978-0-691-07951-6 . ,
    Julkaistu uudelleen: Richard Ernest Bellman. Dynaaminen ohjelmointi  (rajoittamaton) . — Courier Dover Publications , 2003. — ISBN 978-0-486-42809-3 .
  2. Richard Ernest Bellman. Mukautuvat ohjausprosessit : opastettu kierros  . - Princeton University Press , 1961.
  3. Powell, Warren B. 2007. Approximate Dynamic Programming: Solving the Curses of Dimensionality. Wiley, ISBN 0-470-17155-3 .
  4. Marimont, R. B.; Shapiro, MB Lähin naapurihaut ja ulottuvuuden kirous  // IMA J Appl  Math : päiväkirja. - 1979. - Voi. 24 , ei. 1 . - s. 59-70 . - doi : 10.1093/imamat/24.1.59 .
  5. Radovanovic, Miloš; Nanopoulos, Alexandros; Ivanovic, Mirjana. Keskittimet avaruudessa: Suositut lähinaapurit korkeaulotteisessa datassa  //  Journal of Machine Learning Research  : Journal. - 2010. - Vol. 11 . - P. 2487-2531 .
  6. TIEDÄ INTUITTI | Luento | Jyrkin laskeutumismenetelmä. Davidon-Fletcher-Powell menetelmä. Rokon ongelma. Multi-extremaalisuuden ongelma . Haettu 26. huhtikuuta 2022. Arkistoitu alkuperäisestä 27. joulukuuta 2016.
  7. Joel H. Spencer (1994), Ten Lectures on the Probabilistic Method , SIAM , p. 4, ISBN 978-0-89871-325-1 
  8. Aubrey D.N.J. D.E. Grey. Tason kromaattinen luku on vähintään 5  // math.CO. — 2018. Arkistoitu 12. heinäkuuta 2018.