Metody analizy zależności filogenetycznych
description
Transcript of Metody analizy zależności filogenetycznych
Metody analizy zależności filogenetycznych
Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean)
dij A B C D E
B 2
C 4 4
D 6 6 6
E 6 6 6 4
F 8 8 8 8 8
Macierz odległości miedzy 6 OTU
Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami)
Punkt rozgałęzienia sytuujemy w odległości równej dAB/2, czyli 1substytucja
A
B
1
1
Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący całość):
Drugi cykl : Znajdujemy nową parę o
najmniejszej odległości (DE)
dij AB C D E
C 4
D 6 6
E 6 6 4
F 8 8 8 8
2)(BCAC
CAB
ddd
D
E
2
2
dij AB C DE
C 4
DE 6 6
F 8 8 8
Trzecia iteracja
Czwarta iteracja
A
B
1
1
C
1
2
dij AB,C DE
DE 6
F 8 8
A
B
1
1
C
1
2
D
E
1
12
2
dij ABC, DE
F 8
Ostatni krok-przyłączanie OTU F i ukorzenianie drzewa
A
B
1
1
C
1
2
D
E
1
12
2
F
4
1
ROOT
Midpoint rooting – teoretyczny wspólny przodek powinien być równoodległy od wszystkich OTU, czyli ;
d(ABCDE,F)/2 = 8/2 =4
Założenia i ograniczenia metody UPGMA
Jednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa Są spełnione założenia „three point conditions”;
Dla każdych trzech taksonów A,B, C prawdziwy jest warunek że: dAC<=max(dAB,dBC)
Analiza skupień działa dobrze tylko jeżeli dane są ultrameryczne
Metoda NJ (Neighbor Joining)
OTU – operational taxonomic unit Pair of neighbors- para sąsiadów – dwie jednostki taksonomiczne połączone
jednym wewnętrznym węzłem na nieukorzenionym bifurkacyjnym drzewie filogenetycznym
2
1
3
4
87
5
6
A
B
C
DE
F
Para sąsiadów
Względem węzła A
1,2,3 4
Para sąsiadów względem węzła B
Macierz odległości N OTU = 6 A,B,C,D,E,F
Elementy macierzy (dij ) -odległości między OTU liczone jako
liczba różnic między każda parą dopasowanych sekwencji (np. liczba substytucji zaobserwowanych między sekwencja A i B)
Net divergence- r i– suma odległości miedzy OTU i-tym a wszystkimi pozostałymi OTU
Kalkulacja nowej macierzy odległości wg formuły:
dij A B C D E
B 5
C 4 7
D 7 10 7
E 6 9 6 5
F 8 11 8 9 8
R(X) 30 42 32 38 34)2/(][ NrrdM jiijij
Nowa macierz odległościMij A B C D E
B -13
C -11.5 -11.5
D -10 -10 -10.5
E -10 -10 -10.5 -13
F -10.5 -10.5 -11 -11.5 -11.5
Drzewko wyjściowe- star tree
A
B
CD
E
F
1 wspólny węzeł
Wybieramy 1 z dwóch par o minimalnej wartości Mij
Dodawanie węzła
AUABBU SdS
)2(2/][2/ NrrdS BAABAU
U C D E
C 3
D 6 7
E 5 6 5
F 7 8 9 8
A
B
CD
E
F
USAU
Kalkulujemy odległości między węzłem U a pozostałymi OUTu
32
574
2
ABBCAC
CU
dddd
Iteracja powtórzenie całej
procedury dla NOTU=N-1=5 i macierzy odległości ;
Liczymy r(X) i nową macierz Mij
wyznaczamy parę OTU o minimalnej wartości Mij
wstawiamy kolejny węzeł W
U C D E
C 3
D 6 7
E 5 6 5
F 7 8 9 8
Metoda FM (Fitch-Margoliash)A B C
A - 22 39
B - - 41
C - - -
Algebraiczna kalkulacja długości gałęzi
a+b=22
a+c=39
b+c=41
a=10
b-=12
c=29c
a
b
A
B
C
A B C D E
A - 22 39 39 41
B - - 41 41 43
C - - - 18 20
D - - - - 10
E - - - - -
2)(BCAC
CAB
ddd
A B C DE
A - 22 39 40
B - - 41 42
C - - - 19
DE - - - -
C
D E ABC sr
D - 10 32.7E - - 34.7
ABC sr - - -A
B D
E
a
b
c
e
d
f
g
średnia odległość między D i ABC= 32.7 =d+m, gdzie m=g+[(c+2f+a+b)/2]
E i ABC = 34.7 = e + m
10=d+e
układ trzech równań z trzema niewiadomymi – wyliczamy m, d i e
(39+41+18)/3
(41+43+20)/3
SSQ suma kwadratów odchyleń
i j obs
obs2
2exp)(min
100))2/(( 2
1
NSSQAPSDAverage percent standard deviation