Etäisyysmatriisi on neliömäinen objektien välinen matriisi (luokkaa n ), joka sisältää elementteinä metrisen tilan kohteiden väliset etäisyydet .
Matriisin ominaisuudet heijastavat itse etäisyyksien ominaisuuksia [1] :
Yleisesti ottaen matriisi näyttää tältä:
Laajassa merkityksessä etäisyydet ovat heijastus sellaisesta käsitteestä kuin ero , joka on kaksoiskäsite samankaltaisuuden kanssa, ja eromatriisin elementit (yleisesti divergenssimatriisit) ovat duaalisia samankaltaisuusmatriisin elementtien kanssa ( yleensä konvergenssimatriisit ). Samankaltaisuusmitan ja eron suuren välinen suhde voidaan kirjoittaa muodossa , jossa F on eron mitta; K on samankaltaisuuden mitta. Siksi kaikki samankaltaisuusmitan ominaisuudet voidaan ekstrapoloida niitä vastaaviksi eromittauksiksi yksinkertaisella muunnolla ja päinvastoin.
Visuaalisesti objektien väliset suhteet voidaan esittää käyttämällä graafiklusterointialgoritmeja . Voidaan sanoa, että etäisyyksiä käytetään paljon useammin kuin samankaltaisuusmittauksia: ne toteutetaan useammin tilastoohjelmissa ( Statistica , SPSS jne.) klusterianalyysimoduulissa .
Tiedetään [2] , että Hermann Minkowskin ehdottama etäisyyksille on yleinen mitta :
Yllä oleva etäisyysperhe sisältää:
Tämän perheen ulkopuolella on käytettyjä etäisyyksiä. Tunnetuin on Mahalanobiksen etäisyys .
Mielenkiintoinen esimerkkinä samankaltaisuuden ja eron välisestä yhteydestä on myös Yurtsevin etäisyys , joka on kaksinkertainen Brown-Blanquen samankaltaisuusmitan kanssa [5] :
Tasossa on kuusi eri pistettä (katso kuva). Mittariksi valittiin euklidinen etäisyys pikseleinä .
Vastaava etäisyysmatriisi on yhtä suuri kuin
a | b | c | d | e | f | |
---|---|---|---|---|---|---|
a | 0 | 184 | 222 | 177 | 216 | 231 |
b | 184 | 0 | 45 | 123 | 128 | 200 |
c | 222 | 45 | 0 | 129 | 121 | 203 |
d | 177 | 123 | 129 | 0 | 46 | 83 |
e | 216 | 128 | 121 | 46 | 0 | 83 |
f | 231 | 200 | 203 | 83 | 83 | 0 |
Tuloksena oleva matriisi voidaan esittää lämpökartana . Tässä tummempi väri vastaa pienempää pisteiden välistä etäisyyttä.