Az evolúciós távolság két szervezet közötti genetikai különbségeket jellemző mennyiség. A homológ gének nukleotidszekvenciájának összehasonlításával állapítható meg. A genetikai különbségek mértéke a gén megfelelő pozícióiban a nukleotid eltérések százalékos aránya [1] .
A legegyszerűbb érték, amely az evolúciós távolságot jellemzi, a nem illeszkedő nukleotidok aránya a gén megfelelő pozícióinak páronkénti összehasonlításában. Ezt a mennyiséget "páronkénti távolságnak" nevezik (általában p szimbólummal jelöljük ).
Például a gén következő két régiójának összehasonlításakor
CAGACAGTCA CA C AC T G C CA10 nukleotidonként három eltérés van, p = 0,3.
A páronkénti távolság nem írja le megfelelően az élőlények közötti evolúciós különbségeket:
A páronkénti távolság hátrányait kiküszöböljük, ha bonyolultabb képleteket használunk a távolság meghatározásához:
és egyéb módszerek.
A Jukes-Cantor módszer [ 2] a legegyszerűbb kísérlet a véletlenszerű nukleotid egyezések kizárására, ennek valószínűsége 25%. Ez egy egyparaméteres módszer, amely a nukleotid eltérések arányát (azaz a páronkénti távolságot p ) használja paraméterként. A távolságot a következő képlet segítségével számítjuk ki
A módszer feltételezi, hogy mind a négy nukleotid (A, C, T, D) azonos arányban van jelen a DNS-ben, és az egyik nukleotid másikkal való helyettesítésének valószínűsége bármely nukleotidpár esetében azonos.
A képletből látható, hogy p > 0,75 esetén a kifejezésnek nincs értelme (negatív kifejezés a logaritmus előjele alatt). Ez a módszer hátránya, mivel a p > 0,75 helyzetek (a különböző nukleotidok több mint 75%-a) elvben nem kizártak.
A képletet 1965-ben, a molekuláris biológia kutatásának hajnalán Thomas Jukes , a Kaliforniai Egyetem kémiaprofesszora javasolta.és ugyanennek a karnak a hallgatója, Charles Cantor. Az 1960-as évek közepén a biokémiai technológia elérte azt a szintet, hogy lehetővé vált az egyes DNS-fragmensek és a fehérjék aminosavszekvenciáinak megfejtése. Ez lehetővé tette a nukleotidszekvenciák összehasonlításával a különféle organizmusok evolúciós közelségének és az egyes fajok evolúciós útjainak nyomon követését. Jukes és Kantor az úttörők közé tartozott e módszer formalizálásában, és Kantor lett az egyik első számítógépes program szerzője a nukleotidszekvenciák elemzésére [3] .
A képlet alkalmazására példaként említhetők a humán α- és β-hemoglobint kódoló gének fragmentumai. Úgy gondolják, hogy körülbelül 400 millió évvel ezelőtt mindkét gén ugyanabból az ősi génből származik [3] .
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobin)A töredékek összehasonlítása 30 nukleotidonként 12 különbséget mutat ( p = 0,4). Egy egyszerű eltérés-számítás azonban nem veszi figyelembe annak valószínűségét, hogy bizonyos pozíciókban többszörös mutációk fordulnak elő, beleértve azokat is, amelyek az eredeti nukleotid visszaállításához vezettek. A Jukes-Cantor formula távolságot ad
A képletből tehát az következik, hogy többszörös szubsztitúciót is figyelembe véve 0,572·30=17 mutáció fordult elő a vizsgált DNS-fragmensben.
A Motoo Kimura egy módszert javasolt a távolság kiszámítására, amelyet "Kimura 2-parameter distance"-nak ( angolul Kimura 2-parameter distance, K2P ) neveztek el. A Kimura modell feltételezi, hogy a nukleotidszubsztitúciók különböző változatai nem egyformán valószínűek, és kétféle szubsztitúciót vesz figyelembe:
A Kimura modellben a távolságot a képlet határozza meg
ahol P az átmenetek aránya, Q a transzverziók aránya.
Példaként figyelembe véve az α- és β-hemoglobin génfragmensek közötti evolúciós távolságot, a következőt kapjuk:
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobin) Q PPQ P QQ QPQ QQA Tajima- Ney modellben a távolságot a következő összefüggések határozzák meg [4] :
ahol
x ij – a nukleotidpárok relatív gyakorisága; g i - a nukleotidok relatív gyakorisága.Példaként számítsuk ki a távolságot a humán α- és β-hemoglobint kódoló gének fragmentumai között.
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobin)Nukleotid _ |
xij _ | gi_ _ | ||
---|---|---|---|---|
A | T | C | ||
A | 10/60 = 0,167 | |||
T | 1/30 = 0,0333 | 13/60 = 0,217 | ||
C | 2/30 = 0,0667 | 3/30 = 0,100 | 15/60 = 0,250 | |
G | 1/30 = 0,0333 | 3/30 = 0,100 | 2/30 = 0,0667 | 22/60 = 0,367 |
Egyes forrásokban a Tajima-Nei távolságot egyszerűbb képlet alapján történő számításnak nevezik
ahol
Abban az esetben, ha minden nukleotid azonos gyakorisággal fordul elő ( gi = 0,25 ), ez a képlet egybeesik a Jukes-Cantor képlettel ( b = 0,75).
Az ezekkel a képletekkel végzett számítások ugyanazt a példát adják