Etäisyysmatriisi

Etäisyysmatriisi  on neliömäinen objektien välinen matriisi (luokkaa n ), joka sisältää elementteinä metrisen tilan kohteiden väliset etäisyydet .

Ominaisuudet

Matriisin ominaisuudet heijastavat itse etäisyyksien ominaisuuksia [1] :

  1. symmetria diagonaalin suhteen, eli ;
  2. etäisyyden identiteettiominaisuuden heijastus etäisyysmatriisissa ilmenee 0:n läsnäolossa matriisin diagonaalia pitkin, koska kohteen etäisyys itseensä on ilmeisesti 0, ja myös nolla-arvojen läsnä ollessa ehdottoman samanlaisille esineitä;
  3. etäisyysarvot matriisissa ovat aina ei-negatiivisia
  4. kolmion epätasa-arvo saa muodon kaikille Ja .

Yleisesti ottaen matriisi näyttää tältä:


Laajassa merkityksessä etäisyydet ovat heijastus sellaisesta käsitteestä kuin ero , joka on kaksoiskäsite samankaltaisuuden kanssa, ja eromatriisin elementit (yleisesti divergenssimatriisit) ovat duaalisia samankaltaisuusmatriisin elementtien kanssa ( yleensä konvergenssimatriisit ). Samankaltaisuusmitan ja eron suuren välinen suhde voidaan kirjoittaa muodossa , jossa F  on eron mitta; K  on samankaltaisuuden mitta. Siksi kaikki samankaltaisuusmitan ominaisuudet voidaan ekstrapoloida niitä vastaaviksi eromittauksiksi yksinkertaisella muunnolla ja päinvastoin. Visuaalisesti objektien väliset suhteet voidaan esittää käyttämällä graafiklusterointialgoritmeja . Voidaan sanoa, että etäisyyksiä käytetään paljon useammin kuin samankaltaisuusmittauksia: ne toteutetaan useammin tilastoohjelmissa ( Statistica , SPSS jne.) klusterianalyysimoduulissa .

Etäisyydet

Tiedetään [2] , että Hermann Minkowskin ehdottama etäisyyksille on yleinen mitta :

Yllä oleva etäisyysperhe sisältää:

Tämän perheen ulkopuolella on käytettyjä etäisyyksiä. Tunnetuin on Mahalanobiksen etäisyys .

Mielenkiintoinen esimerkkinä samankaltaisuuden ja eron välisestä yhteydestä on myös Yurtsevin etäisyys , joka on kaksinkertainen Brown-Blanquen samankaltaisuusmitan kanssa [5] :

Esimerkki

Tasossa on kuusi eri pistettä (katso kuva). Mittariksi valittiin euklidinen etäisyys pikseleinä .

Vastaava etäisyysmatriisi on yhtä suuri kuin

a b c d e f
a 0 184 222 177 216 231
b 184 0 45 123 128 200
c 222 45 0 129 121 203
d 177 123 129 0 46 83
e 216 128 121 46 0 83
f 231 200 203 83 83 0

Tuloksena oleva matriisi voidaan esittää lämpökartana . Tässä tummempi väri vastaa pienempää pisteiden välistä etäisyyttä.

Muistiinpanot

  1. Schrader, Yu. A. Mikä on etäisyys? . — M .: Fizmatgiz , 1963. — 76 s.
  2. Kim, J.-O. , Muller, C.W., Klekka , W.R. , Oldenderfer, M.S. , Blashfield, R.K. Factor, diskriminant and cluster analysis. - M. : Talous ja tilastot, 1989. - 215 s. — ISBN 5-279-00247-X .
  3. Sokal, R. R. , Sneath, P. H. A. Numeerisen  taksonomian periaatteet . - San Francisco, Lontoo: W. H. Freeman and Co., 1963. — 359 s.
  4. Godron, M. Quelques applications de la conception de fréquence en ecologie végétale  (ranska)  // Oecol. Plant.. - 1968. - Voi. 3 , n o 3 . - s. 185-212 .
  5. Semkin, B. I. Erikokoisten sarjojen analyysimenetelmään vertailevassa kukkakaupassa // Komarov Readings. - 2009. - Ongelma. LVI . - S. 170-185 .