Kanoninen korrelaatioanalyysi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 27. maaliskuuta 2021 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Canonical Correlation Analysis ( CCA ) on tapa  saada tietoa ristikorrelaatiomatriiseista [ . Jos meillä on kaksi vektoria ja satunnaismuuttujia ja näiden muuttujien välillä on korrelaatioita , niin kanoninen korrelaatioanalyysi löytää X :n ja Y :n lineaarisen yhdistelmän, jolla on suurin korrelaatio [1] . T. R. Knapp totesi, että "käytännössä kaikki yleisesti käytetyt parametriset testit merkitsevyyttä voidaan käsitellä kanonisen korrelaatioanalyysin erikoistapauksena, joka on yleinen menettely kahden muuttujajoukon välisten suhteiden tutkimiseksi” [2] . Harold Hotelling esitteli menetelmän ensimmäisen kerran vuonna 1936 [3] .

Määritelmä

Kun on annettu kaksi sarakevektoria ja satunnaismuuttujat, joilla on äärellinen toinen momentti , ristikorrelaatio voidaan määritellä matriisiksi, jonka alkiot ovat kovariansseja . Käytännössä arvioimme kovarianssimatriisin otosdatan perusteella ja (eli datamatriisin parista).

Kanoninen korrelaatioanalyysi etsii vektoreita ( ) ja ( ) siten, että satunnaismuuttujat maksimoivat korrelaation . Satunnaismuuttujat ja ovat kanonisten muuttujien ensimmäinen pari . Sitten etsitään vektoreita, jotka maksimoivat saman korrelaation rajoituksella, että ne eivät korreloi kanonisten muuttujien ensimmäisen parin kanssa, jolloin saadaan toinen kanonisten muuttujien pari . Tätä menettelyä voidaan jatkaa jopa kertaa.

( a ′ , b ′ ) = argmax a , b korr ⁡ ( a T X , b T Y ) {\displaystyle (a',b')={\underset {a,b}{\operaattorinimi {argmax} }}\operaattorinimi {corr} (a^{T}X,b^{T}Y)}

Laskenta

Johtopäätös

Anna ja . Maksimoitu parametri

Ensimmäisessä vaiheessa muutamme perustetta ja määritämme

Sitten meillä on

Cauchyn ja Bunyakovskyn epätasa-arvolla saamme

Epäyhtälöstä tulee tasa-arvo, jos vektorit ja ovat kollineaarisia . Lisäksi maksimikorrelaatio saavutetaan, kun on ominaisvektori , jolla on matriisin suurin ominaisarvo (katso Rayleigh-relaatio ). Seuraava pari löydetään käyttämällä seuraavaksi suurinta ominaisarvoa . Ortogonaalisuuden takaa korrelaatiomatriisien symmetria.

Ratkaisu

Ratkaisu:

Vastaavasti myös

Koordinaattien käänteisellä muutoksella saamme

Kanoniset muuttujat määritellään yhtälöillä:

Toteutus

CCA voidaan laskea käyttämällä korrelaatiomatriisin singulaariarvojakelua [4] . Kanoninen korrelaatio on saatavana ominaisuutena seuraavissa järjestelmissä [5] .

Hypoteesin testaus

Jokaisen rivin merkitys testataan seuraavalla menetelmällä. Koska korrelaatiot on lajiteltu, väite, että rivi on nolla, tarkoittaa, että kaikki muut korrelaatiot ovat myös nolla. Jos meillä on riippumattomia havaintoja otoksessa ja se on arvioitu korrelaatio arvolle , -: nnelle riville merkitsevyyskriteeri on:

joka on asymptoottisesti jakautunut khi-neliöön , jolla on vapausasteita suurille [6] . Koska kaikki korrelaatiot välillä - ovat nollia, termien tulo tämän pisteen jälkeen on merkityksetön.

Käytännön käyttö

Tyypillinen kanonisen korrelaation käyttö kokeellisessa kontekstissa on tarkastella kahta muuttujajoukkoa ja tutkia, mitä yhteistä näillä kahdella joukolla on [7] . Esimerkiksi psykologisessa tutkimuksessa voidaan suorittaa kaksi vakiintunutta monimuuttujapersoonallisuustestiä [ , kuten Minnesota Multidimensional Personality Inventory (MMPI-2) ja NEO . Tarkastelemalla, kuinka MMPI-2-tekijät liittyvät NEO-tekijöihin, voidaan selvittää, mitkä ominaisuudet havaittiin olevan yhteisiä näiden kahden testin välillä ja kuinka paljon muuttujat ovat yhteisiä. Voidaan esimerkiksi havaita, että ominaisuudet, kuten ekstraversio tai neuroottisuus , muodostavat olennaisen osan näiden kahden testin yhteisistä muuttujista.

Voit myös käyttää kanonista korrelaatioanalyysiä saadaksesi yhtälön, joka yhdistää kahta muuttujajoukkoa, kuten suoritusmittausjoukon ja selittävien muuttujien joukon tai tulosjoukon ja syöttöjoukon. Tällaiselle mallille voidaan asettaa rajoittavia ehtoja teoreettisten tai intuitiivisesti ilmeisten vaatimusten tarjoamiseksi. Tämän tyyppinen malli tunnetaan maksimikorrelaatiomallina [8] .

Kanonisen korrelaation tulosten visualisointi tehdään yleensä pylväsdiagrammin avulla kahden muuttujajoukon kertoimista kanonisten muuttujien parille, mikä osoittaa merkittävän korrelaation. Jotkut kirjoittajat ehdottavat, että tulokset on parempi visualisoida heliografilla, joka on ympyräkaavio, jossa on pylväitä säteinä, joista puolet edustaa yhtä muuttujajoukkoa ja toinen puoli toista joukkoa [9] .

Esimerkkejä

Olkoon nolla matemaattinen odotus , ts. . Jos ts. ja ovat täysin korreloituneita, niin esimerkiksi ja , joten ensimmäinen (vain tässä esimerkissä) kanonisten muuttujien pari on ja . Jos ts. ja ovat täysin antikorreloituja, sitten ja , joten ensimmäinen (vain tässä esimerkissä) kanonisten muuttujien pari on ja . Huomaa, että molemmissa tapauksissa , mikä osoittaa, että kanoninen korrelaatioanalyysi toimii täsmälleen samalla tavalla korreloitujen muuttujien kanssa kuin antikorreloitujen muuttujien kanssa.

Suhde pääkulmiin

Oletetaan, että ja meillä on nolla matemaattista odotusta , ts. . Niiden kovarianssimatriisit ja niitä voidaan pitää Gram-matriiseina , joissa on sisätulo ja vastaavasti . Tässä tulkinnassa satunnaismuuttujia, vektorin elementtejä ja vektorin alkioita käsitellään vektoriavaruuden elementteinä kovarianssin antamalla skalaaritulolla .

Kanonisten muuttujien määritelmä ja vastaa sitten juurivektorien määritelmää aliavaruuksien parille, jotka ulottuvat ja , kun otetaan huomioon tämä skalaaritulo . Kanoninen korrelaatio on yhtä suuri kuin aliavaruuksien välisen kulman kosini .

Valkaisu ja todennäköisyyspohjainen kanoninen korrelaatioanalyysi

CCA:ta voidaan pitää myös erityisenä valkaisumuunnoksena [10] , jossa satunnaisvektorit ja ovat samanaikaisesti muunnettu siten, että ristikorrelaatiomatriisi valkaistujen vektorien ja ja on diagonaalinen [11] .

Kanoniset korrelaatiot tulkitaan sitten regressiokertoimiksi, jotka liittyvät , ja , ja ne voivat olla negatiivisia. CCA:n tarkastelu regressiona tarjoaa tavan rakentaa piilevän muuttujan generatiivinen todennäköisyysmalli CCA:lle, jossa korreloimattomat piilevät muuttujat edustavat kokonais- ja osittaista varianssia.

Katso myös

Muistiinpanot

  1. Härdle, Simar, 2007 , s. 321-330.
  2. Knapp, 1978 , s. 410–416.
  3. Hotelling, 1936 , s. 321-377.
  4. Hsu, Kakade, Zhang, 2012 , s. 1460.
  5. Huang, Lee, Hsiao, 2009 , s. 2162.
  6. Mardia, Kent, Bibby, 1979 .
  7. Sieranoja, Sahidullah, Kinnunen, Komulainen, Hadid, 2018 .
  8. Tofallis, 1999 , s. 371-378.
  9. Degani, Shafto, Olson, 2006 , s. 93.
  10. Valkaisumuunnos muuntaa satunnaismuuttujien vektorin käyttämällä lineaarista muunnosta valkoiseksi kohinaksi
  11. Jendoubi, Strimmer, 2018 .

Kirjallisuus

Linkit