Mapowanie genów człowieka i badania asocjacji · Asocjacja i sprzężenie ! Sprzężenie -...

52
Mapowanie genów człowieka i badania asocjacji podstawy

Transcript of Mapowanie genów człowieka i badania asocjacji · Asocjacja i sprzężenie ! Sprzężenie -...

Mapowanie genów człowieka i badania asocjacji

podstawy

Sprzężenie }  Geny leżące na różnych chromosomach spełniają II prawo

Mendla

W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005

Dla 2 genów: 4 równoliczne klasy gamet

Sprzężenie }  Allele genów leżących na tym samym chromosomie

dziedziczą się razem – sprzężenie

W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005

Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich

Sprzężenie }  Crossing-over (rekombinacja chromatyd niesiostrzanych)

W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005

Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich 2 równoliczne klasy gamet zrekombinowanych Klasy zrekombinowane mniej liczne od rodzicielskich

Mapowanie genów }  Aby powstały gamety zrekombinowane, crossing-over

musi zajść pomiędzy genami (loci)

W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005

powstają gamety zrekombinowane

Mapowanie genów }  Prawdopodobieństwo crossing-over pomiędzy genami

jest proporcjonalne do odległości między nimi na chromosomie

}  Liczebność klas zrekombinowanych w potomstwie jest miarą odległości genetycznej

}  U Drosophila najlepiej mapować za pomocą heterozygotycznej samicy i samca recesywnego

}  A u człowieka?

Asocjacje

7

}  Nieprzypadkowe współwystępowanie czynników (alleli i fenotypów) na poziomie populacji (korelacja)

}  Czy zawsze asocjacja oznacza zależność przyczynową? }  Czy każda asocjacja ma wartość diagnostyczną? }  Czy asocjacja odkrywa “gen na ....”? }  Czy zawsze czynnik ryzyka?

Geny na...?

8

Asocjacja

Przyczyny asocjacji • losowa (i nieprawidłowe obliczanie p) • relacja przyczynowa

§ związek bezpośredni (plejotropizm, jednym z efektów allelu A jest podatność na chorobę) § dobór naturalny (allel A zwiększa fitness u chorych)

§ nie zawsze czynnik ryzyka • struktura populacji i efekty statystyczne

§ zależności etniczne § paradoks Simpsona (dodatkowa zmienna ukryta)

• bliskie sprzężenie + historia (nierównowaga sprzężeń)

9

Struktura populacji

}  Lander & Schork, 1994 - w rejonie San Francisco jest wyraźna asocjacja między allelem HLA-A1 a umiejętnością jedzenia pałeczkami

•  HLA-A1 jest częstszy u Azjatów niż u Europejczyków

10

Asocjacje mogą być zwodne

}  Allel 3A4 cytochromu P450 (CYP3A) i rak prostaty (bardziej zaawansowana postać w momencie diagnozy)

}  CYP3A może w pływać na tempo hydroksylowania testosteronu - związek przyczynowy?

•  Nie ma wpływu allelu 3A4 na kinetykę metabolizmu testosteronu •  Allel 3A4 częściej występuje u ludzi pochodzenia afrykańskiego

(Afroamerykanie), niż europejskiego •  Podobne korelacje dla raka prostaty dla innych alleli częstszych w

populacji afrykańskiej •  Bardziej zaawansowany rak prostaty u Afroamerykanów (przyczyny

społeczne)?

11

Przyczyny asocjacji alleli

Należy badać populacje jednorodne etnicznie, a nawet tylko pojedyncze duże rodziny

Struktura populacji (ukryta zmienna)

Jest to przyczyna artefaktów

Paradoks Simpsona: Jeżeli zmieszamy dwie populacje, w których nie występuje asocjacja markera i choroby, ale są różne częstości występowania choroby (oraz markera), w zmieszanej populacji pojawi się asocjacja markera z chorobą (problem ukrytej zmiennej).

12

Paradoks Simpsona

}  Prosty przykład: uniwersytet powinien faworyzować kobiety przy przyjmowaniu na studia doktoranckie:

Mężczyźni Kobiety Wydział historii 1/5 (20%) 2/8 (25%)

Wydział geografii 6/8 (75%) 4/5 (80%)

Razem 7/13 (54%)

6/13 (46%)

13

University of California, Berkeley, 1973

Kierunek Mężczyźni (przyjęci) Kobiety (przyjęte) A 825 62%

108 82% B 560 63%

25 68% C 325 37%

593 34% D 417 33%

375 35% E 191 28%

393 24% F 272 6%

341 7% Razem 8442 44%

4321 35%

Więcej kobiet zgłaszało się na trudniejsze kierunki.

Przyjęcia na studia doktoranckie

14

Przykład medyczny Porównywano dwie terapie kamieni nerkowych

Terapia A Terapia B

78 % (273/350) 83% (289/350)

Ale:

Terapia A Terapia B Małe kamienie 93% (81/87) 87% (234/270)

Duże kamienie 73% (192/263) 69% (55/80)

Razem 78 % (273/350) 83% (289/350)

Terapię A częściej stosowano u pacjentów z dużymi kamieniami, które trudniej się leczy.

15

Podwójna ślepa próba

16

}  Przy badaniach działania leków. terapii itp. }  Terapia vs. placebo; nowa terapia vs. dotychczasowa, itp.

}  Ani pacjent, ani lekarz oceniający efekty nie wie, do której grupy należy dany pacjent

Asocjacja }  Zależności funkcjonalne

}  często z allelami MHC (HLA) - związane z funkcjonowaniem układu odpornościowego

}  poszukuje się asocjacji dla bardzo intensywnie poznawanych polimorfizmów SNP w genomie człowieka

}  farmakogenetyka i farmakogenomika – polimorfizmy a działanie leków }  CRHR1 (receptor kortykotropiny) - skuteczność terapii

kortykosteroidami w leczeniu astmy }  HLA-B27 - nadwrażliwość na skutki uboczne Abcaviru }  HTR2A (serotonina 2A) - reakcja na środki antydepresyjne

17

Asocjacja - przykład }  HLA-B27 i choroby autoimmunologiczne, np.

zesztywniające zapalenie stawów

Chorzy Zdrowi

HLA-B27 + 90 1000

HLA-B27 - 10 9000

test statystyczny Fishera (Fisher exact test):

p≈2·10-76

18

Ryzyko 8%

Ryzyko 0,11%

Ryzyko dla całej populacji ~1%

19

Geny na...?

20

A w rzeczywistości...

21

A w rzeczywistości...

Ryzyko  schizofrenii  u  posiadaczy  wariantu  wzrasta  z  ~2%  (w  populacji)  do  ~4,5%  (posiadający  wariant)  >95%  posiadających  wariant  nie  zachoruje    (dla  choroby  dwubiegunowej,  odpowiednio  ~4%  i  ~10%)  

22

Dla przypomnienia }  HLA-B27 i choroby autoimmunologiczne, np.

zesztywniające zapalenie stawów

Chorzy Zdrowi

HLA-B27 +

90 1000

HLA-B27 - 10 9000

test statystyczny Fishera (Fisher exact test):

p≈2·10-76

OR =

901000

109000

= 81

23

Asocjacja i sprzężenie }  Sprzężenie - wspólna segregacja alleli genów leżących blisko

siebie na chromosomie }  dotyczy loci, nie konkretnych alleli }  proste podłoże biologiczne (chromosomy, rekombinacja) }  badana w rodowodach i/lub parach krewnych

}  Asocjacja - korelacja występowania konkretnych alleli genów w populacji }  dotyczy konkretnych alleli }  często złożone i/lub niejasne podłoże biologiczne - zjawisko statystyczne,

niekiedy bez związku przyczynowego }  dotyczy populacji lub grupy, ale bez wymogu pokrewieństwa }  może niekiedy być związana ze sprzężeniem (nierównowaga sprzężeń)

Metody

}  Sprzężenie - analiza sprzężeń (mapowanie) }  metody parametryczne }  metody nieparametryczne

}  Asocjacje - badania korelacji (testy statystyczne)

Jeżeli odległość A do d jest niewielka, wówczas większość chromosomów w

populacji niosących D niesie też A1 '

Ale nie odwrotnie!'

Nierównowaga sprzężeń (linkage disequilibrium) – nieprzypadkowe skojarzenie

alleli w sprzężonych loci – efekt założycielski. Maleje z czasem.'

Allel genu d w pobliżu markera A zmutował dając związany z chorobą allel D wiele pokoleń temu'

mutacja A1 d A1 D

Asocjacja a sprzężenie

Asocjacja alleli' Sprzężenie'

•  Na poziomie populacji' W rodzinie'

•  Wskazuje konkretne allele' Wskazuje loci'

Sprzężenie markera i genu choroby

}  Asocjacja w obrębie rodziny

}  Z reguły brak asocjacji w populacji

}  Niezależne od struktury populacji

}  Asocjacja populacyjna dla rzadkiego allelu i bardzo bliskiego sprzężenia – nierównowaga sprzężeń

Metody mapowania

}  Parametryczna (oparte na modelach) analiza lod }  dwupunktowa }  wielopunktowa

}  Nieparametryczna analiza sprzężeń }  współwystępowanie alleli }  klucz: IBD (identity by descent) vs. IBS (identity by state)

Analiza nieparametryczna

Dwa allele są identyczne przez pochodzenie (IBD) jeżeli są kopiami tego samego allelu rodzicielskiego

A1A1 A1A2

A1A2 A1A2

IBD

Analiza nieparametryczna

} Korelacja względnego podobieństwa u par mapowanej cechy z podobieństwem markera

} Badania bliźniąt } Badania chorego rodzeństwa (affected siblings

method) } Badania rodzin (2-3 pokoleniowe)

Analiza chorych krewniaków: czy w parach chorych krewnych allele markera (nieważne które) są wspólne częściej, niż w reszcie populacji?'

Miarą odległości jest częstość rekombinacji }  częstość rekombinacji θ=prawdopodobieństwo przekazania

zrekombinowanej gamety

}  Loci na różnych chromosomach segregują niezależnie => θ = 0,5

}  Loci blisko sprzężone segregują razem => θ = 0

}  Terminologia }  θ<0,5 sprzężenie }  θ=0,5 brak sprzężenia

Mapowanie }  Jednostka cM (centymorgan) = 1% rekombinacji }  W rzeczywistości zależność nie jest liniowa

}  Podwójny crossing-over – gamety typu rodzicielskiego }  Interferencja – zajście crossing-over w danym miejscu

wpływa na prawdopodobieństwo zajścia kolejnego w pobliżu

Podwójny c-o – jeszcze bardziej złożony

}  Powstanie średnio 50% rekombinantów. Podobnie dla potrójnych itp. W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005

Funkcja mapowa – zależność odległości genetycznej od częstości rekombinacji

}  Funkcja mapowa Haldane’a

}  nie uwzględnia interferencji w crossing-over

}  Funkcja mapowa Kosambiego

}  uwzględnia interferencję }  crossing-over zmniejsza prawdopodobieństwo drugiego w pobliżu

}  szeroko stosowana

}  Dla małych wartości θ: d≈θ

d =ln(1−2θ )

2

d =ln 1+ 2θ

1−2θ$

% &

'

( )

4

Funkcja mapowa

}  Wraz ze wzrostem odległości częstość c-o dąży do 0,5 }  Dla genów niesprzężonych “rekombinantów” jest 50%,

podobnie jak dla genów leżących w dużej odległości

36

Mapy genetyczne a płeć }  Całkowita mapa mężczyzny = 2851cM }  Całkowita mapa kobiety = 4296cM (wyłączając X) }  Dla ~3000Mb genomu autosomalnego

¨  1 cM u mężczyzny ≈ 1.05 Mb ¨  1 cM u kobiety ≈ 0.88Mb

Wiarygodność (likelihood) }  Wiarygodność=prawdopodobieństwo uzyskania danych przy założeniach

modelu i jego określonych parametrach }  W układzie w pełni informatywnym

}  dane: R=liczba rekombinantów, NR=liczba genotypów rodzicielskich }  parametr: częstość rekombinacji θ=prawd. rekombinacji

}  Hipoteza zerowa – brak sprzężenia (θ=0,5) }  Stosunek wiarygodności L(θ)/L(θ=0,5) }  lod score (Z) = logarithm of odds – logarytm (dziesiętny) stosunku

wiarygodności

Jak obliczać lod score

 

Dla każdego rodowodu (i) lod wynosi: Dla danej wartości θ, sumuje się wartości lod-score z różnych rodowodów (F):

Zi( ˆ θ ) = log10L(ped _ data / ˆ θ )

L(ped _ data /θ = 0,5)

Z( ˆ θ ) = Zi( ˆ θ )i=1

F

Wynik dwupunktowej analizy sprzężeń

Tabela θ= 0.01, 0.10, 0.20, 0.30, 0.35, 0.40, 0.45, 0.50 lod= -5.0, -2.0, 1.0, 3.3, 4.0, 3.0, 1.0, 0.0

0.0 0.1 0.2 0.3 0.4 0.5

-4-2

02

4

theta

lod

Lod score curve

znaczące

wykluczone

Markery w analizie sprzężeń człowieka }  Sprzężenie dwóch genów o obserwowalnym fenotypie –

praktycznie niespotykane }  wyjątek – zespół paznokciowo-rzepkowy (NPS – Nail Patella

Syndrome) i grupy krwi AB0 }  Loci w obrębie kompleksów MHC

}  Markery molekularne }  PCR, RFLP

Markery

Lokalizowanie genu }  I etap – zgrubne (markery co 8-20 cM) – ustalenie

chromosomu, czy 1 locus itp. }  II etap – dokładne (co 1-4 cM)

The Cooperative Human Linkage Center, www.chlc.org

1,2 1,1

1,2 2,2

1,2 1,2 1,2 2,2 2,2

1,2 1,1

1,2 2,2

1,2 1,2 1,2 2,2 2,2

*

1 rekombinant (R); 4 rodzicielskie (NR)

Przy braku sprzężenia (θ=0,5) prawdopodobieństwo uzyskania R i NR jest równe i wynosi ½

L(θ=0,5)= (½)5

1,2 1,1

1,2 2,2

1,2 1,2 1,2 2,2 2,2

*

1 rekombinant (R); 4 rodzicielskie (NR)

Dla sprzężenia θ prawdopodobieństwo uzyskania R wynosi θ (z definicji), więc prawdopodobieństwo uzyskania NR wynosi 1- θ

L(θ)= θ·(1- θ)4

1R 4NR

1,2 1,1

1,2 2,2

1,2 1,2 1,2 2,2 2,2

*

1 rekombinant (R); 4 rodzicielskie (NR)

L(θ)= θ·(1- θ)4 L(θ=0,5)= (½)5 Dla θ=0,1 L(θ=0,1) = 0,1·(0,9)4

Z(θ = 0,1) = log100,1⋅ 0,94

0,55$

% &

'

( ) ≈ 0,32

0' 0,02' 0,1' 0,2' 0,3' 0,4' 0,5'

-∞ -0,23 0,32 0,42 0,36 0,22 0

0' 0,02' 0,1' 0,2' 0,3' 0,4' 0,5'-∞' -0,23' 0,32' 0,42' 0,36' 0,22' 0'

1,2 1,1

1,2 2,2

1,2 1,2 1,2 2,2 2,2

Nieznana faza u ojca

1,2 2,2

1,2 1,2 1,2 2,2 2,2

1 +

2 -

2 +

1 -

1R 4NR 1NR 4R

albo

Z(θ = 0,2) = log10

0,2 ⋅ 0,82

4

+0,24 ⋅ 0,8

20,55

$

%

& & & &

'

(

) ) ) ) ≈ 0,12€

L(θ = 0,2) =0,2 ⋅ 0,84

2$

% &

'

( )

L(θ = 0,2) =0,24 ⋅ 0,8

2$

% &

'

( ) +

}  Nail-patella syndrome