Metody analizy zależności filogenetycznych

15
Metody analizy zależności filogenetycznych

description

Metody analizy zależności filogenetycznych. 1. A. B. 1. Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean). Macierz odległości miedzy 6 OTU Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami). - PowerPoint PPT Presentation

Transcript of Metody analizy zależności filogenetycznych

Page 1: Metody analizy zależności filogenetycznych

Metody analizy zależności filogenetycznych

Page 2: Metody analizy zależności filogenetycznych

Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean)

dij A B C D E

B 2

C 4 4

D 6 6 6

E 6 6 6 4

F 8 8 8 8 8

Macierz odległości miedzy 6 OTU

Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami)

Punkt rozgałęzienia sytuujemy w odległości równej dAB/2, czyli 1substytucja

A

B

1

1

Page 3: Metody analizy zależności filogenetycznych

Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący całość):

Drugi cykl : Znajdujemy nową parę o

najmniejszej odległości (DE)

dij AB C D E

C 4

D 6 6

E 6 6 4

F 8 8 8 8

2)(BCAC

CAB

ddd

D

E

2

2

dij AB C DE

C 4

DE 6 6

F 8 8 8

Page 4: Metody analizy zależności filogenetycznych

Trzecia iteracja

Czwarta iteracja

A

B

1

1

C

1

2

dij AB,C DE

DE 6

F 8 8

A

B

1

1

C

1

2

D

E

1

12

2

dij ABC, DE

F 8

Page 5: Metody analizy zależności filogenetycznych

Ostatni krok-przyłączanie OTU F i ukorzenianie drzewa

A

B

1

1

C

1

2

D

E

1

12

2

F

4

1

ROOT

Midpoint rooting – teoretyczny wspólny przodek powinien być równoodległy od wszystkich OTU, czyli ;

d(ABCDE,F)/2 = 8/2 =4

Page 6: Metody analizy zależności filogenetycznych

Założenia i ograniczenia metody UPGMA

Jednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa Są spełnione założenia „three point conditions”;

Dla każdych trzech taksonów A,B, C prawdziwy jest warunek że: dAC<=max(dAB,dBC)

Analiza skupień działa dobrze tylko jeżeli dane są ultrameryczne

Page 7: Metody analizy zależności filogenetycznych

Metoda NJ (Neighbor Joining)

OTU – operational taxonomic unit Pair of neighbors- para sąsiadów – dwie jednostki taksonomiczne połączone

jednym wewnętrznym węzłem na nieukorzenionym bifurkacyjnym drzewie filogenetycznym

2

1

3

4

87

5

6

A

B

C

DE

F

Para sąsiadów

Względem węzła A

1,2,3 4

Para sąsiadów względem węzła B

Page 8: Metody analizy zależności filogenetycznych

Macierz odległości N OTU = 6 A,B,C,D,E,F

Elementy macierzy (dij ) -odległości między OTU liczone jako

liczba różnic między każda parą dopasowanych sekwencji (np. liczba substytucji zaobserwowanych między sekwencja A i B)

Net divergence- r i– suma odległości miedzy OTU i-tym a wszystkimi pozostałymi OTU

Kalkulacja nowej macierzy odległości wg formuły:

dij A B C D E

B 5

C 4 7

D 7 10 7

E 6 9 6 5

F 8 11 8 9 8

R(X) 30 42 32 38 34)2/(][ NrrdM jiijij

Page 9: Metody analizy zależności filogenetycznych

Nowa macierz odległościMij A B C D E

B -13

C -11.5 -11.5

D -10 -10 -10.5

E -10 -10 -10.5 -13

F -10.5 -10.5 -11 -11.5 -11.5

Drzewko wyjściowe- star tree

A

B

CD

E

F

1 wspólny węzeł

Wybieramy 1 z dwóch par o minimalnej wartości Mij

Page 10: Metody analizy zależności filogenetycznych

Dodawanie węzła

AUABBU SdS

)2(2/][2/ NrrdS BAABAU

U C D E

C 3

D 6 7

E 5 6 5

F 7 8 9 8

A

B

CD

E

F

USAU

Kalkulujemy odległości między węzłem U a pozostałymi OUTu

32

574

2

ABBCAC

CU

dddd

Page 11: Metody analizy zależności filogenetycznych

Iteracja powtórzenie całej

procedury dla NOTU=N-1=5 i macierzy odległości ;

Liczymy r(X) i nową macierz Mij

wyznaczamy parę OTU o minimalnej wartości Mij

wstawiamy kolejny węzeł W

U C D E

C 3

D 6 7

E 5 6 5

F 7 8 9 8

Page 12: Metody analizy zależności filogenetycznych

Metoda FM (Fitch-Margoliash)A B C

A - 22 39

B - - 41

C - - -

Algebraiczna kalkulacja długości gałęzi

a+b=22

a+c=39

b+c=41

a=10

b-=12

c=29c

a

b

A

B

C

Page 13: Metody analizy zależności filogenetycznych

A B C D E

A - 22 39 39 41

B - - 41 41 43

C - - - 18 20

D - - - - 10

E - - - - -

2)(BCAC

CAB

ddd

A B C DE

A - 22 39 40

B - - 41 42

C - - - 19

DE - - - -

Page 14: Metody analizy zależności filogenetycznych

C

D E ABC sr

D - 10 32.7E - - 34.7

ABC sr - - -A

B D

E

a

b

c

e

d

f

g

średnia odległość między D i ABC= 32.7 =d+m, gdzie m=g+[(c+2f+a+b)/2]

E i ABC = 34.7 = e + m

10=d+e

układ trzech równań z trzema niewiadomymi – wyliczamy m, d i e

(39+41+18)/3

(41+43+20)/3

Page 15: Metody analizy zależności filogenetycznych

SSQ suma kwadratów odchyleń

i j obs

obs2

2exp)(min

100))2/(( 2

1

NSSQAPSDAverage percent standard deviation