SSA (menetelmä)

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 9.9.2021 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

SSA ( Singular Spectrum Analysis tai Singular Spectrum Analysis ) on aikasarjaanalyysimenetelmä, joka perustuu yksiulotteisen aikasarjan muuntamiseen moniulotteiseksi sarjaksi, jonka jälkeen pääkomponenttien menetelmää sovelletaan tuloksena olevaan moniulotteiseen aikasarjaan .

Menetelmä yksiulotteisen sarjan muuntamiseksi moniulotteiseksi on aikasarjan "konvoluutio" matriisiksi, joka sisältää tietyllä siirrolla saadun aikasarjan fragmentteja. Yleinen näkemys siirtomenettelystä muistuttaa "toukkaa", minkä vuoksi itse menetelmää kutsutaan usein "Toukiksi": fragmentin pituutta kutsutaan "toukan pituudeksi " ja yhden fragmentin siirtymän määrää suhteelliseksi. toiseen kutsutaan "toukkien" askeleeksi . Yleensä käytetään vaihetta 1.

Singulaarinen spektrianalyysi (SSA) yhdistää klassisen aikasarjaanalyysin , monimuuttujatilastot, monimuuttujageometrian, dynaamiset järjestelmät ja signaalinkäsittelyn elementit . SSA:n lähtökohtia ovat pääkomponenttimenetelmä ja klassinen Karhunen-Loeven teoreema aikasarjojen ja digitaalisten kuvien spektraaliselle hajotukselle.

Tietoaloja, joilla SSA:ta voidaan soveltaa, on erittäin laaja: ilmastotiede, valtameri, geofysiikka, suunnittelu, kuvantaminen, lääketiede, ekonometria ja monet muut. Siksi SSA:n erilaisia ​​muunnelmia käytetään käytännön sovelluksissa. Kaksi pääsuuntaa voidaan erottaa, nämä ovat SSA yleiskäyttöisenä menetelmänä (Golyandina et al, 2001) yleiskäyttöisten ongelmien, kuten trendin havaitsemisen, jaksollisuuden havaitsemisen , kausittaisen säädön, tasoituksen , kohinan vaimennuksen ja kiinteiden laitteiden spektrianalyysin, ratkaisemiseen. aikasarjoja (Vautard ja Ghil, 1989), jolla on monia sovelluksia alueilla, joilla tällaisia ​​sarjoja havaitaan, erityisesti klimatologiassa.

SSA sarjaanalyysimenetelmänä

SSA:ta voidaan käyttää ilman sarjamallin alustavaa määrittelyä mielivaltaisten, myös ei-stationaaristen sarjojen analysointiin. SSA:n päätavoite on hajottaa sarja tulkittavissa olevien komponenttien summaksi, kuten trendi, jaksolliset komponentit, kohina. Tässä tapauksessa näiden komponenttien parametrisen muodon tuntemusta ei vaadita.

Harkitse reaaliarvoista pituussarjaa . Antaa olla  jokin kokonaisluku nimeltä ikkunan pituus , ja .

Perus SSA-algoritmi

Vaihe 1: Kiinnitys.

Sarjan lentoratamatriisi on rakennettu seuraavasti:

missä  ovat pituuden upotusvektorit . Matriisi on Hankel , mikä tarkoittaa, että siinä on samat merkinnät anti-diagonaaleissa .

Vaihe 2: Singular Decomposition (SVD).

Suoritetaan lentoratamatriisin singulaarinen arvohajottelu (SVD) . Asetetaan ja merkitään ei-nousevassa järjestyksessä ( ) otetut ominaisarvot ja ominaisarvoja vastaava ortonormaali matriisin ominaisvektorijärjestelmä .

Asetamme (huomaa, että todellisuudessa yleensä ) ja . Tässä merkinnässä lentoratamatriisin singulaariarvohajotelma voidaan kirjoittaa muodossa

jossa matriiseilla on arvo 1 ja niitä kutsutaan alkematriiseiksi . Joukkoa kutsutaan singulaariarvojaottelun : nneksi varsinaiseksi kolmiosaksi (lyhyesti ET tarkoittaa ominaistripleä). Vektoreita ja kutsutaan matriisin vasemmaksi ja oikeaksi yksikkövektoriksi, luvut  ovat yksikkölukuja (ne muodostavat singulaarispektrin , joka antoi menetelmälle nimen Singular Spectrum Analysis), vektorit , analogisesti analyysin kanssa. päävektorien vektoreita kutsutaan pääkomponenttien vektoreiksi.

Vaihe 3: Ryhmittele omat kolmosesi.

Kaikkien indeksien joukko on jaettu ei-päällekkäisiin osajoukkoon .

Anna . Sitten tuloksena oleva ryhmää vastaava matriisi määritellään muodossa . Tuloksena saadut matriisit lasketaan ryhmissä ja matriisin ryhmitelty SVD-hajotelma voidaan kirjoittaa muodossa

Vaihe 4: Diagonaalinen keskiarvo.

Jokainen klusteroitu hajontamatriisi gankelisoidaan (keskiarvona antidiagonaalien yli) ja sitten tuloksena oleva Hankel-matriisi muunnetaan uudeksi pituiseksi aikasarjaksi , joka perustuu Hankel-matriisien ja aikasarjan väliseen vastaavuuteen. Jokaiseen tuloksena olevaan matriisiin sovellettu diagonaalinen keskiarvo tuottaa palautettuja rivejä . Alkuperäinen sarja on siis jaettu palautetun sarjan summaksi :

Tämä hajotus on SSA-algoritmin päätulos aikasarjaanalyysiä varten. Tämä laajentaminen on järkevää. jos jokainen sen komponenteista voidaan tulkita joko trendiksi tai vaihteluiksi (jaksoiksi) tai kohina.

Menetelmässä on muunnoksia, kuten SSA yhdellä keskityksellä ja SSA kaksoiskeskityksellä. Jälkimmäinen vaihtoehto toimii hyvin lineaarisen trendin läsnä ollessa.

SSA teoria

SSA-teoria vastaa seuraaviin kysymyksiin: (a) mitkä aikasarjan komponentit voidaan erottaa SSA:lla ja (b) kuinka valita ikkunan pituus ja suorittaa oikea ryhmittely halutun komponentin korostamiseksi. Tärkeimmät teoreettiset tulokset sisältyvät julkaisuun Golyandina et al (2001, Ch. 1 and 6).

Trendi (määritelty sarjan hitaasti muuttuvaksi komponentiksi), jaksolliset komponentit ja kohina ovat asymptoottisesti erotettavissa SSA:lla osoitteessa . Käytännössä se on kiinteä ja puhutaan aikasarjan komponenttien likimääräisestä erotettavuudesta. Se, onko olemassa likimääräistä erotettavuutta, voidaan määrittää käyttämällä useita indikaattoreita, katso Golyandina et al (2001, Ch. 1). Ikkunan pituus määrää menetelmän resoluution: suuret arvot (mutta enintään puolet sarjan pituudesta) tarjoavat yksityiskohtaisimman erottelun peruskomponentteihin ja sen seurauksena paremman erotettavuuden. Ikkunan pituus tietyssä mielessä määrää menetelmän ratkaistavuuden, erityisesti se vastaa maksimijaksoa, joka voidaan havaita sellaisella ikkunan pituudella. Trendi voidaan erottaa ryhmittelemällä ominaisviivat hitaasti vaihtelevilla ominaisvektoreilla. Sinimuoto, jonka taajuus on pienempi kuin 0,5, vastaa sinimuotoisten ominaisvektorien paria, joilla on sama taajuus ja jonka vaihe-ero on suunnilleen yhtä suuri kuin .

Kahden aikasarjan erottaminen voidaan formalisoida yhden sarjan valinnaksi, jos toisessa sarjassa on häiriö. Häiriöteorian soveltamista SSA:han käsittelee Nekrutkin (2010).

SSA kiinteälle sarjalle

Stacionaarisille aikasarjoille SSA:ta voidaan pitää ei-parametrisena spektrin estimointimenetelmänä. Tässä tapauksessa menetelmällä on omat ominaisuutensa terminologian, algoritmin ja sovellusmetodologian suhteen. Erityisesti rivikeskitystä käytetään yleisesti esikäsittelynä.

Suurin ero algoritmissa on viive-kovarianssimatriisin käyttö . Matriisi voidaan arvioida suoraan alkuperäisestä sarjasta Toeplitz-matriisina , jonka diagonaaleissa on vakiot (Vautard ja Ghil, 1989):

Broomhead ja King (1986a, 1986b) ehdottivat matriisin käyttöä Basic SSA -menetelmässä, ja siksi Basic SSA:ta kutsutaan joskus nimellä "BK-SSA". Matriisin käyttö otettiin käyttöön Vautard ja Ghil (1987) antaen menetelmälle nimen "VG-SSA" (toinen nimi tälle modifikaatiolle on "Toeplitz SSA" (Golyandina et al, 2001, kappale 1.7)).

Ennustaminen ja muut SSA:n laajennukset

Ennustaminen . Tapauksessa SSA-hajotelman perusteella on mahdollista rakentaa estimaatti signaaliavaruudesta ja saada estimaatti signaalia ohjaavan lineaarisen toistuvuusrelaation kertoimista, eli . Signaalialiavaruus ja tuloksena oleva lineaarinen toistuvuus toimivat perustana SSA-ennustusalgoritmeille, erityisesti rekursiiviselle ja vektoriennusteelle.

Samanaikainen aikasarjajärjestelmäanalyysi (MSSA, Multivariate SSA) . Jos upotusvaiheessa rakennetaan aikasarjajärjestelmän lentoratamatriisi yhdistämällä yksiulotteisten sarjojen lentoratamatriisit, niin saadaan MSSA-menetelmä, jonka avulla voidaan rakentaa usean sarjan samanaikainen laajennus kerralla. . MSSA on parempi kuin SSA:n käyttäminen riveille yksittäin, jos riveillä on samanlainen rakenne. Voidaan myös harkita sarjajärjestelmän samanaikaista ennustamista.

Digitaalinen kuvaanalyysi (2D-SSA) . Tässä tapauksessa lentoratamatriisin analogi rakennetaan erityisellä tavalla liukuvalla kaksiulotteisella ikkunalla, jonka koko on.

Aukkojen täyttö aikasarjoissa Aukkojen täyttämiseen on kaksi tapaa. Kondrashovin ja Ghilin (2006) kuvaamassa algoritmissa aukkojen täyttö suoritetaan iteratiivisen proseduurin perusteella, kun jokaisessa iteraatiossa aukot täytetään edellisessä iteraatiossa saaduilla arvoilla. Golyandina ja Osipov (2007) käyttävät ajatusta vektorien puuttuvien komponenttien palauttamisesta tietystä aliavaruudesta. Näin ollen toistuvat ja vektoriennusteet ovat erityinen aukon täytön tapaus, jos aukkoja on määritelty ennustettujen arvojen paikoissa.

Vianilmaisu Häiriöiden havaitseminen suoritetaan laskemalla etäisyys upotusvektoreista signaalin arvioituun aliavaruuteen. Vastaavasti, jos etäisyys alkaa kasvaa, tämä osoittaa muutosta sarjan rakenteessa.

SSA:n ja muiden menetelmien välinen suhde

SSA ja autoregressio . Tyypillinen SSA:ssa harkittu sarjamalli on , jossa (lineaarisen toistuvuussuhteen ohjaama signaali) ja  on kohina. Autoregressiivisen (AR) mallin muoto on < . Ensimmäisessä tapauksessa (SSA) kohina lisätään koko signaaliin ja toisessa (AR) - jokaisessa vaiheessa. Vaikka mallit näyttävät samanlaisilta, SSA pitää autoregressiota vain kohinan mallina.

SSA ja Fourier-hajoaminen . Toisin kuin Fourier-analyysissä, jossa huomioidaan sinien ja kosinien kiinteä kanta, SSA käyttää itse sarjan luomaa adaptiivista kantaa. Tämän seurauksena SSA:n taustalla oleva sarjamalli on yleisempi, ja SSA voi poimia amplitudimoduloituja sinejä ja kosineja muilla taajuuksilla kuin . Vastaavasti SSA:n estimoimaan signaalialiavaruuteen perustuvat menetelmät voivat arvioida taajuuksia suuremmalla resoluutiolla kuin spektraalinen Fourier-analyysi .

SSA ja signaalin aliavaruuteen perustuvat tekniikat . SSA:ta voidaan pitää myös signaalinkäsittelymenetelmänä, joka perustuu signaalin aliavaruuden estimointiin, koska dimensiotavaruuden signaalialiavaruuden estimaatti voidaan saada SSA:n puitteissa muodossa .

SSA ja parametrinen regressio . SSA pystyy tuomaan esille erityisesti polynomisia ja eksponentiaalisia trendejä. Toisin kuin regressio, SSA ei kuitenkaan edellytä parametrisen mallin määrittämistä ensin, mikä voi olla merkittävä etu, kun suoritetaan sarjan tutkiva analyysi, eikä ilmeistä mallia ole. Erityisesti SSA mahdollistaa jaksollisuuksien poimintamisen tietämättä jaksojen arvoja.

SSA ja linjasuodattimet . Sarjakomponentin palauttamista SSA:lla voidaan pitää adaptiivisena lineaarisuotimena. Jos ikkunan pituus on pieni, niin jokainen ominaisvektori generoi lineaarisen leveyden suodattimen , joka palauttaa sarjan keskikohdan , . Suodattaminen ei ole kausaalista. Niin sanottua kausaalista SSA:ta voidaan kuitenkin pitää kausaalisuodattimen analogina (Golyandina ja Zhigljavsky 2013, luku 2.9).

Menetelmän lyhyt historia

Ensimmäinen julkaisu, jota voidaan pitää yhtenä SSA:n ja signaalin aliavaruuden estimointiin perustuvien signaalinkäsittelymenetelmien alkulähteistä, on peräisin 1700-luvulta (Pronyn menetelmä).

Seuraava koski eläinten lukumäärän dynamiikan analyysiä, Efimov, Galaktionov (1983). Maailman ensimmäinen monografia aiheesta on Efimov ym. (1988).

Broomhead ja King (1986a, b) ja Fraedrich (1986) muotoilivat SSA-algoritmin käytettäväksi epälineaarisen dynamiikan yhteydessä attraktoreiden rekonstruoinnissa .

Ghil, Vautard ja heidän kollegansa (Vautard ja Ghil, 1989; Ghil ja Vautard, 1991; Vautard et al., 1992) huomasivat analogian toisaalta Broomheadin ja Kingin lentoratamatriisin ja Karhunen-Loeve-hajoamisen välillä ( Pääkomponenttianalyysi aika-alueella), toisaalta. Näin ollen SSA:ta on alettu käyttää menetelmänä aikasarjojen analysointiin vetovoiman rekonstruoinnista riippumatta , mukaan lukien tapaukset, joissa jälkimmäinen ei ole järkevää.

Niin kutsutun 'Caterpillar'-menetelmän metodologia voidaan mainita erikseen, katso Danilov ja Zhiglyavsky (Toim.) (1997) ja Golyandina et al (2001). Tämä menetelmä on versio SSA:sta, joka kehitettiin alun perin Neuvostoliitossa ulkomaisesta työstä riippumatta. Suurin ero Caterpillar-SSA-metodologian välillä on se, että menetelmä on kehitetty yleissarjojen analysointiin, pääpaino on menetelmän teoreettisten ominaisuuksien tutkimisessa. Pääteoreettinen käsite on sarjan erotettavuuden käsite. Erityisesti vaatimus sarjan erottelusta asettaa omat rajoituksensa parametrien valinnalle.

Tällä hetkellä on olemassa useita kymmeniä artikkeleita SSA:n metodologisista näkökohdista ja vielä enemmän SSA-sovelluksista. Johdatus SSA:han löytyy julkaisusta Elsner ja Tsonis (1996). Tarkempia teoksia ovat monografia Golyandina et al. (2001) (sen sisältö on esitetty lyhyesti ja osittain venäjänkielisissä oppikirjoissa (Golyandina, 2004)), arvioivat Ghil et al. (2002), "Statistics and Its Interface" -lehden erikoisnumero (Zhigljavsky, 2010, toim.) sekä Golyandinan ja Zhigljavskyn kirja (2013). Julkaisussa Golyandina et ai. (2018) kuvaili ja strukturoi erilaisia ​​SSA-menetelmän yleistyksiä ja muunnelmia aikasarja- ja kuva-analyysiin sekä niiden algoritmeja ja niiden toteutusta R-paketissa Rssa . Kirjan kumppanisivusto R-esimerkkien kanssa - http://ssa-with-r-book.github.io

Kirjallisuus

Englantilainen kirjallisuus
  • Broomhead, DS ja GP King (1986a): "Kvalitatiivisen dynamiikan erottaminen tiedoista", Physica D , 20, 217-236.
  • Broomhead, DS ja GP King (1986b): "Kokeellisten dynaamisten järjestelmien kvalitatiivisesta analyysistä". Nonlinear Phenomena and Chaos , Sarkar S (Toim.), Adam Hilger, Bristol, 113-144.
  • Elsner, JB ja Tsonis, A.A. (1996): Singular Spectrum Analysis. Uusi työkalu aikasarja-analyysissä , Plenum Press.
  • Fraedrich, K. (1986) "Sää- ja ilmasto houkuttelevien mittojen arviointi". J. Atmos. sci. 43, 419-432.
  • Ghil, M. ja R. Vautard (1991): "Interdecadal oscillations and the warming trend in global lämpötila time series", Nature , 350, 324-327.
  • Ghil, M., RM Allen, MD Dettinger, K. Ide, D. Kondrashov, et ai. (2002) "Kehittyneet spektrimenetelmät ilmastollisiin aikasarjoihin" , Rev. Geophys. 40(1), 3.1-3.41.
  • Golyandina, N., A. Korobeynikov ja A. Zhigljavsky (2018): Singular Spectrum Analysis with R . Sarja Käytä R! Springer Verlag. ISBN 3662573784 .
  • Golyandina, N., V. Nekrutkin ja A. Zhigljavsky (2001): Aikasarjarakenteen analyysi: SSA ja siihen liittyvät tekniikat . Chapman ja Hall/CRC. ISBN 1-58488-194-1 .
  • Golyandina, N. ja E. Osipov (2007) "The 'Caterpillar'-SSA menetelmä puuttuvien arvojen aikasarjojen analysointiin", J. Stat. suunnitelma. Johtopäätös 137(8), 2642-2653 .
  • Golyandina, N. ja D. Stepanov (2005): "SSA-pohjaiset lähestymistavat moniulotteisten aikasarjojen analysointiin ja ennustamiseen" . Julkaisussa: Proceedings of the 5th St.Petersburg Workshop on Simulation, 26.6.- 2.7.2005, St.Petersburg Pietarin valtionyliopisto Pietari, s. 293-298.
  • Golyandina, N. ja K. Usevich (2010): "2D-extension of Singular Spectrum Analysis: algoritmi ja teorian elementit". Teoksessa: Matrix Methods: Theory, Algorithms and Applications (Toim. V. Olshevsky ja E. Tyrtyshnikov). World Scientific Publishing, 449-473.
  • Golyandina, N. ja A. Zhigljavsky (2013) Singular Spectrum Analysis for time series . Springer Briefs in Statistics, Springer, ISBN 978-3-642-34912-6 .
  • Kondrashov, D. ja M. Ghil (2006): "Puutuvien pisteiden spatio-ajallinen täyttö geofysikaalisissa tietosarjoissa" , Nonlin. Prosessit Geophys. , 13, 151-159.
  • Nekrutkin, V. (2010) "Signaalialiavaruuksien häiriölaajennukset pitkille signaaleille". J. Stat. Liitäntä 3, 297-319.
  • de Prony, G. (1795) "Essai expérimental et analytique sur les lois de la dilatabilité des fluides elastiques et sur celles de la force expansive de la vapeur de l'eau et la vapeur de l'alkool à différentes températures". J. de l'Ecole Polytechnique , 1(2), 24-76.
  • Vautard, R. ja M. Ghil (1989): "Singulaarinen spektrianalyysi epälineaarisessa dynamiikassa, sovelluksia paleoklimaattisiin aikasarjoihin", Physica D , 35, 395-424.
  • Zhigljavsky, A. (toim.) (2010) Statistics and Its Interface (Erikoisnumero singulaarispektrianalyysistä aikasarjoissa) , osa 3. Vierastoimittaja.

Katso myös

Linkit