Evoluutioetäisyys on suure, joka luonnehtii kahden organismin välisiä geneettisiä eroja. Se löydetään vertaamalla homologisten geenien nukleotidisekvenssejä. Geneettisten erojen mitta on nukleotidien yhteensopimattomuuksien prosenttiosuus geenin vastaavissa paikoissa [1] .
Yksinkertaisin arvo, joka kuvaa evoluutioetäisyyttä, on yhteensopimattomien nukleotidien osuus geenin vastaavien paikkojen parittaisessa vertailussa. Tätä suuruutta kutsutaan "pariväliksi" (yleensä merkitty symbolilla p ).
Esimerkiksi kun verrataan kahta seuraavaa geenin aluetta
CAGACAGTCA CA C AC T G C CAon kolme yhteensopimattomuutta 10 nukleotidia kohti, p = 0,3.
Pareittainen etäisyys ei kuvaa riittävästi organismien välisiä evoluutioeroja:
Parittaisen etäisyyden haitat poistetaan käyttämällä monimutkaisempia kaavoja etäisyyden määrittämiseen:
ja muita menetelmiä.
Jukes-Cantor-menetelmä [ 2] on yksinkertaisin yritys sulkea pois satunnaiset nukleotidisovitukset tarkastelusta, jonka todennäköisyys on 25 %. Tämä on yhden parametrin menetelmä, joka käyttää parametrina nukleotidien yhteensopimattomuuksien osuutta (eli parittaista etäisyyttä p ). Etäisyys lasketaan seuraavalla kaavalla
Menetelmässä oletetaan, että kaikki neljä nukleotidiä (A, C, T, D) ovat läsnä DNA:ssa samoissa suhteissa ja todennäköisyys korvata yksi nukleotidi toisella on sama millä tahansa nukleotidiparilla.
Kuten kaavasta voidaan nähdä, jos p > 0,75, lausekkeella ei ole järkeä (negatiivinen lauseke logaritmin merkin alla). Tämä on menetelmän haittapuoli, koska tilanteet, joissa p > 0,75 (yli 75 % eri nukleotideista), eivät ole periaatteessa poissuljettuja.
Kalifornian yliopiston kemian professori Thomas Jukes ehdotti kaavaa vuonna 1965, molekyylibiologian tutkimuksen kynnyksellä.ja saman tiedekunnan opiskelija Charles Cantor. 1960-luvun puolivälissä biokemiallinen tekniikka saavutti tason, jossa oli mahdollista tulkita yksittäisiä DNA-fragmentteja ja proteiinien aminohapposekvenssejä. Tämä mahdollisti nukleotidisekvenssejä vertailemalla eri organismien evolutionaarisen läheisyyden ja yksittäisten lajien evoluutiopolun jäljittämisen. Jukes ja Kantor olivat edelläkävijöitä tämän menetelmän formalisoinnissa, ja Kantorista tuli yksi ensimmäisistä tietokoneohjelmista nukleotidisekvenssien analysointiin [3] .
Esimerkkinä kaavan soveltamisesta voidaan mainita ihmisen a- ja p-hemoglobiinia koodaavien geenien fragmentit. Uskotaan, että noin 400 miljoonaa vuotta sitten molemmat geenit olivat peräisin samasta esi-isän geenistä [3] .
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobiini) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobiini)Fragmenttien vertailu paljastaa 12 eroa 30 nukleotidia kohden ( p = 0,4). Yksinkertainen ristiriitalaskelma ei kuitenkaan ota huomioon todennäköisyyttä, että joissakin kohdissa esiintyi useita mutaatioita, mukaan lukien ne, jotka johtivat alkuperäisen nukleotidin palauttamiseen. Jukes-Cantor-kaava antaa etäisyyttä
Siten kaavasta seuraa, että useat substituutiot huomioon ottaen tarkasteltavassa DNA-fragmentissa esiintyi 0,572·30=17 mutaatiota.
Motoo Kimura ehdotti menetelmää etäisyyden laskemiseen, jota kutsuttiin "Kimura 2-parameter distance" ( englanniksi Kimura 2-parameter distance, K2P ). Kimura-malli olettaa, että nukleotidisubstituutioiden eri variantit eivät ole yhtä todennäköisiä, ja siinä otetaan huomioon kahden tyyppiset substituutiot:
Kimura-mallissa etäisyys määräytyy kaavan mukaan
missä P on siirtymien osuus, Q on transversioiden osuus.
Kun otetaan esimerkkinä evoluutioetäisyys α- ja β-hemoglobiinigeenifragmenttien välillä, saadaan:
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobiini) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobiini) Q PPQ P QQ QPQ QQTajima- Ney -mallissa etäisyys määräytyy seuraavilla suhteilla [4] :
missä
x ij — nukleotidiparien suhteelliset taajuudet; g i - nukleotidien suhteelliset taajuudet.Esimerkkinä lasketaan ihmisen α- ja β-hemoglobiinia koodaavien geenifragmenttien välinen etäisyys.
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobiini) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobiini)Nukleotidi _ |
xij _ | gi_ _ | ||
---|---|---|---|---|
A | T | C | ||
A | 10/60 = 0,167 | |||
T | 1/30 = 0,0333 | 13/60 = 0,217 | ||
C | 2/30 = 0,0667 | 3/30 = 0,100 | 15/60 = 0,250 | |
G | 1/30 = 0,0333 | 3/30 = 0,100 | 2/30 = 0,0667 | 22/60 = 0,367 |
Joissakin lähteissä Tajima-Nei-etäisyyttä kutsutaan laskennaksi yksinkertaisemmalla kaavalla
missä
Siinä tapauksessa, että kaikki nukleotidit esiintyvät samalla taajuudella ( gi = 0,25 ), tämä kaava on sama kuin Jukes-Cantor-kaava ( b = 0,75).
Näitä kaavoja käyttävät laskelmat antavat saman esimerkin