Canonical Correlation Analysis ( CCA ) on tapa saada tietoa ristikorrelaatiomatriiseista [ . Jos meillä on kaksi vektoria ja satunnaismuuttujia ja näiden muuttujien välillä on korrelaatioita , niin kanoninen korrelaatioanalyysi löytää X :n ja Y :n lineaarisen yhdistelmän, jolla on suurin korrelaatio [1] . T. R. Knapp totesi, että "käytännössä kaikki yleisesti käytetyt parametriset testit merkitsevyyttä voidaan käsitellä kanonisen korrelaatioanalyysin erikoistapauksena, joka on yleinen menettely kahden muuttujajoukon välisten suhteiden tutkimiseksi” [2] . Harold Hotelling esitteli menetelmän ensimmäisen kerran vuonna 1936 [3] .
Kun on annettu kaksi sarakevektoria ja satunnaismuuttujat, joilla on äärellinen toinen momentti , ristikorrelaatio voidaan määritellä matriisiksi, jonka alkiot ovat kovariansseja . Käytännössä arvioimme kovarianssimatriisin otosdatan perusteella ja (eli datamatriisin parista).
Kanoninen korrelaatioanalyysi etsii vektoreita ( ) ja ( ) siten, että satunnaismuuttujat maksimoivat korrelaation . Satunnaismuuttujat ja ovat kanonisten muuttujien ensimmäinen pari . Sitten etsitään vektoreita, jotka maksimoivat saman korrelaation rajoituksella, että ne eivät korreloi kanonisten muuttujien ensimmäisen parin kanssa, jolloin saadaan toinen kanonisten muuttujien pari . Tätä menettelyä voidaan jatkaa jopa kertaa.
( a ′ , b ′ ) = argmax a , b korr ( a T X , b T Y ) {\displaystyle (a',b')={\underset {a,b}{\operaattorinimi {argmax} }}\operaattorinimi {corr} (a^{T}X,b^{T}Y)}Anna ja . Maksimoitu parametri
Ensimmäisessä vaiheessa muutamme perustetta ja määritämme
Sitten meillä on
Cauchyn ja Bunyakovskyn epätasa-arvolla saamme
Epäyhtälöstä tulee tasa-arvo, jos vektorit ja ovat kollineaarisia . Lisäksi maksimikorrelaatio saavutetaan, kun on ominaisvektori , jolla on matriisin suurin ominaisarvo (katso Rayleigh-relaatio ). Seuraava pari löydetään käyttämällä seuraavaksi suurinta ominaisarvoa . Ortogonaalisuuden takaa korrelaatiomatriisien symmetria.
Ratkaisu:
Vastaavasti myös
Koordinaattien käänteisellä muutoksella saamme
Kanoniset muuttujat määritellään yhtälöillä:
CCA voidaan laskea käyttämällä korrelaatiomatriisin singulaariarvojakelua [4] . Kanoninen korrelaatio on saatavana ominaisuutena seuraavissa järjestelmissä [5] .
Jokaisen rivin merkitys testataan seuraavalla menetelmällä. Koska korrelaatiot on lajiteltu, väite, että rivi on nolla, tarkoittaa, että kaikki muut korrelaatiot ovat myös nolla. Jos meillä on riippumattomia havaintoja otoksessa ja se on arvioitu korrelaatio arvolle , -: nnelle riville merkitsevyyskriteeri on:
joka on asymptoottisesti jakautunut khi-neliöön , jolla on vapausasteita suurille [6] . Koska kaikki korrelaatiot välillä - ovat nollia, termien tulo tämän pisteen jälkeen on merkityksetön.
Tyypillinen kanonisen korrelaation käyttö kokeellisessa kontekstissa on tarkastella kahta muuttujajoukkoa ja tutkia, mitä yhteistä näillä kahdella joukolla on [7] . Esimerkiksi psykologisessa tutkimuksessa voidaan suorittaa kaksi vakiintunutta monimuuttujapersoonallisuustestiä [ , kuten Minnesota Multidimensional Personality Inventory (MMPI-2) ja NEO . Tarkastelemalla, kuinka MMPI-2-tekijät liittyvät NEO-tekijöihin, voidaan selvittää, mitkä ominaisuudet havaittiin olevan yhteisiä näiden kahden testin välillä ja kuinka paljon muuttujat ovat yhteisiä. Voidaan esimerkiksi havaita, että ominaisuudet, kuten ekstraversio tai neuroottisuus , muodostavat olennaisen osan näiden kahden testin yhteisistä muuttujista.
Voit myös käyttää kanonista korrelaatioanalyysiä saadaksesi yhtälön, joka yhdistää kahta muuttujajoukkoa, kuten suoritusmittausjoukon ja selittävien muuttujien joukon tai tulosjoukon ja syöttöjoukon. Tällaiselle mallille voidaan asettaa rajoittavia ehtoja teoreettisten tai intuitiivisesti ilmeisten vaatimusten tarjoamiseksi. Tämän tyyppinen malli tunnetaan maksimikorrelaatiomallina [8] .
Kanonisen korrelaation tulosten visualisointi tehdään yleensä pylväsdiagrammin avulla kahden muuttujajoukon kertoimista kanonisten muuttujien parille, mikä osoittaa merkittävän korrelaation. Jotkut kirjoittajat ehdottavat, että tulokset on parempi visualisoida heliografilla, joka on ympyräkaavio, jossa on pylväitä säteinä, joista puolet edustaa yhtä muuttujajoukkoa ja toinen puoli toista joukkoa [9] .
Olkoon nolla matemaattinen odotus , ts. . Jos ts. ja ovat täysin korreloituneita, niin esimerkiksi ja , joten ensimmäinen (vain tässä esimerkissä) kanonisten muuttujien pari on ja . Jos ts. ja ovat täysin antikorreloituja, sitten ja , joten ensimmäinen (vain tässä esimerkissä) kanonisten muuttujien pari on ja . Huomaa, että molemmissa tapauksissa , mikä osoittaa, että kanoninen korrelaatioanalyysi toimii täsmälleen samalla tavalla korreloitujen muuttujien kanssa kuin antikorreloitujen muuttujien kanssa.
Oletetaan, että ja meillä on nolla matemaattista odotusta , ts. . Niiden kovarianssimatriisit ja niitä voidaan pitää Gram-matriiseina , joissa on sisätulo ja vastaavasti . Tässä tulkinnassa satunnaismuuttujia, vektorin elementtejä ja vektorin alkioita käsitellään vektoriavaruuden elementteinä kovarianssin antamalla skalaaritulolla .
Kanonisten muuttujien määritelmä ja vastaa sitten juurivektorien määritelmää aliavaruuksien parille, jotka ulottuvat ja , kun otetaan huomioon tämä skalaaritulo . Kanoninen korrelaatio on yhtä suuri kuin aliavaruuksien välisen kulman kosini .
CCA:ta voidaan pitää myös erityisenä valkaisumuunnoksena [10] , jossa satunnaisvektorit ja ovat samanaikaisesti muunnettu siten, että ristikorrelaatiomatriisi valkaistujen vektorien ja ja on diagonaalinen [11] .
Kanoniset korrelaatiot tulkitaan sitten regressiokertoimiksi, jotka liittyvät , ja , ja ne voivat olla negatiivisia. CCA:n tarkastelu regressiona tarjoaa tavan rakentaa piilevän muuttujan generatiivinen todennäköisyysmalli CCA:lle, jossa korreloimattomat piilevät muuttujat edustavat kokonais- ja osittaista varianssia.
Koneoppiminen ja tiedon louhinta | |
---|---|
Tehtävät | |
Opettajan kanssa oppimista | |
ryhmäanalyysi | |
Mittasuhteiden vähentäminen | |
Rakenteellinen ennustaminen | |
Anomalian havaitseminen | |
Piirrä todennäköisyysmallit | |
Neuroverkot | |
Vahvistusoppiminen |
|
Teoria | |
Lehdet ja konferenssit |
|