GENOMIKA. MAPOWANIE GENOMÓW MAPY...
Transcript of GENOMIKA. MAPOWANIE GENOMÓW MAPY...
„Gen”
???Biologiczne bazy danych –
historia
Biologiczne bazy danych – „najważniejsze”
tydzień temu…
Wykład 3 – spis treści
GenomikaMapy genomoweMarkery genetyczne, mapy genetyczneMapowanie fizyczneBazy danych map genomowych
GENOMIKA GENOMIKA –– badanie struktury i funkcjonowania genombadanie struktury i funkcjonowania genomóóww
GENOMIKA
GENOMIKA STRUKTURALNA
GENOMIKA PORÓWNAWCZA
GENOMIKA FUNKCJONALNA
MAPOWANIE GENOMU: •Mapy genetyczne •Mapy fizyczne
SEKWENCJONOWANIE
• Ewolucja genomów
• Ewolucja genów
• Transkryptom
•Regulacja tranckrypcji
• Proteom
Structural
genomics Comparative
genomics
Functional genomics
GENOMIKA GENOMIKA –– badanie struktury i funkcjonowania genombadanie struktury i funkcjonowania genomóóww
GENOMIKA
GENOMIKA STRUKTURALNA
GENOMIKA PORÓWNAWCZA
GENOMIKA FUNKCJONALNA
MAPOWANIE GENOMU: •Mapy genetyczne •Mapy fizyczne
SEKWENCJONOWANIE
• Ewolucja genomów
• Ewolucja genów
• Transkryptom
•Regulacja tranckrypcji
• Proteom
Structural
genomics Comparative
genomics
Functional genomics
II znaczenie: =proteomika
strukturalna
Biolog
ia mo
lekula
rna
& bio
infor
maty
ka
Zmienność genomu ludzkiego
Nature, 2008
•1695 sites
of
structural
variation
(> 6kbp)
•4 million
SNPs
•800000 small
indels
(< 100 bp)
Zmienność genomu ludzkiego
PubMed stats [Oct 2008]
Genomics[MAJR]
12,606Bioinformatics[MAJR] 8,257
Genomics
43,415Bioinformatics
34,610
Bioinformatics
(Google) 12,200,000 Genomics
(Google) 12,100,000
Mapa genomu –
graficzna prezentacja położenia markerów/genów na chromosomie
MAPYGENETYCZNE MAPY
FIZYCZNE
cM bp
Mapy genomowe
MAPY GENETYCZNE MAPY
FIZYCZNE•
powstają
w oparciu o analizę
częstości rekombinacji między badanymi markerami•
pokazują
rozmieszczenie
markerów na chromosomie oraz odległości genetyczne między nimi
•
powstają
poprzez bezpośrednią lokalizację, technikami biologii
molekularnej, badanej sekwencji DNA w genomie• jednostka:
pary zasad –
pz (ang. bp, kbp)• jednostka:
1cM = 1% rekombinacji (1 crossing
–
over
na 100 mejoz)
u ludzi to ok.0,7 –
1 Mb
Mapy genetyczne Rekombinacje
Jeżeli
markery A i B są
na
tym
samym
chromosomie, częstość
rekombinacji
jest > 0 i < 0.5
Jeżeli
markery
A i B są
na
różnych
chromosomach,częstość
rekombinacji
jest = 0.5.
Ten sam
chromosom Różne chromosomy
Bardzo bliskoBlisko Daleko
Częstość CROSSING-OVER Rzadko Kilka Często Często
Sprzężenie TAK TAK NIE NIE
θ 0% 1-4% 50% 50%
Częstość rekombinacji (θ)
From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY
Marker genetyczny
–
polimorficzna sekwencja DNA (specyficzna) z jednego miejsca na chromosomie, używana do mapowania genetycznego,
może być
związana z fenotypem.
Jest to podstawowe narzędzie genetyka
Marker genetyczny
klasa I
(markery fenotypowe)
•są
to geny kodujące cechy jakościowe organizmu np. antygeny erytrocytarne, antygeny głównego układu zgodności tkankowej (Major Histocompatibility
Complex
-
MHC).
•markery tej klasy indentyfikowane
są metodami serologicznymi lub metodami
elektroforetycznymi.
klasa II
(markery DNA)
•są
to sekwencje DNA, niekoniecznie kodujące, np. RFLP, SSLP, SNP
•markery
takie
jako markery
genetycze muszą
mieć
przynajmniej dwie alleliczne
formy.
•markery tego typu identyfikowane są przy użyciu technik analizy molekularnej.
Markery DNA
RFLPs
(Restriction
Fragment Lenght Polymorphisms)
MinisatelityMikrosatelitySNPs (Single Nucleotide
Polymorphisms)
Markery
genetyczne cd.RFLPs
(Restriction Fragment Lenght Polymorphisms) --
polimorfizm długości fragmentów restrykcyjnych
Miejsce cięcia enzymu restrykcyjnego HindIII.
Markery
RFLP:
Restriction
Fragment Length Polymorphism
Żel
Markery genetyczne cd.
Wady
markerów RFLP:
- tylko dwie formy alleliczne
- dużo miejsc cięcia w dużych genomach
SSLPs
(Simple Sequence Length Polymorphisms) – polimorfizm długości prostych sekwencji
-minisatelity
-mikrosatelity
Markery genetyczne cd.
Minisatelitarny
DNA VNTRs
(Variable Number of Tandem Repeats) –
zmienna liczba powtórzeń
tandemowych•
sekwencje zawierające zmienną
liczbę
tandemowych powtórzeń
motywu
(11 –
60 pz) • z reguły występują
przy końcach chromosomów -
telomerach
•
liczba powtórzeń
motywu:
2 do 1000,
w zależności od ilości powtórzeń
dany fragment DNA ma charakterystyczną
długość
(polimorfizm długości widoczny
podczas elektroforezy)•
VNTR może być
badane metodą
PCR wraz z elektroforezą, połączoną
z hybrydyzacją
z wyznakowaną
sondą. Liczba powtórzeń
decyduje o długości fragmentu, co z kolei wpływa na szybkości jego przemieszczania się
podczas
elektroforezy.• w danym locus VNTR występuje znaczna zmienność
osobnicza
Przykładowy motyw sekwencji minisatelitarnej: AGGGCTGGAGG Allel
1.
AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG
Allel
2. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG
Allel
3.
AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG
itd.
Przykładowa analiza VNTRs
Mikrosatelitarny
DNA STRs
(Short Tandem Repeats) – krótkie sekwencje powtórzone tandemowo
•
sekwencje zawierające zmienną
liczbę
tandemowych powtórzeń kilkunukleotydowego
motywu (1 –
4 pz)
• motyw równomiernie rozmieszczony w genomie
•
liczba powtórzeń
motywu minisatelitarnego:
10 do 50 i w zależności od ilości powtórzeń
dany fragment DNA ma charakterystyczną
długość
(polimorfizm długości widoczny podczas elektroforezy)
• często motyw taki może być
regularnie przerywany inną
sekwencją.
•
ulokowane są
zazwyczaj w intronach (czasami również
w eksonach [egzonach] w postaci mniejszej liczby powtórzeń).
STR (Short
Tandem Repeats) a analiza restrykcyjna
A1A1
A1A2
A3A4
Zalety:- duża zmienność-
często tworząmulti-locus patterns
charakterystyczne dla danego osobnikaWady:-
nie nadają
się
do
dokładnego mapowania z powodu ich nielosowego rozkładu w genomie
A1A1 A1A2 A3A4
…ACGACGACGACG…
SNPs
(Single Nucleotide Polymorphisms) – polimorfizm pojedynczych nukleotydów
Genom ludzki: 56 mln
SNPs (6,5 mln
„validated”
SNPs) -dbSNP
@ NCBI
Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na amplifikacji określonego fragmentu genomu w reakcji PCR i sekwencjonowaniu
uzyskanego produktu.
Zaletą
tej techniki jest wysoka wydajność
identyfikacji polimorfizmu w obrębie badanej sekwencji, wadą
jest wysoki koszt analizy.
Markery genetyczne cd.
Analiza SNP
SNP microarraysmolecular
beacons
Analiza sprzężeń
zaburzenia w analizach:-
gorące miejsca
rekombinacji
-
podwójny crossing
–
over
Type of marker No. of loci FeaturesBlood groups ~20 May need fresh blood
1910-1960 No easy physical localizationElectrophoretic mobility variants of serum proteins
~30 May need fresh serum, specialized assays
1960-1975 No easy physical localizationOften limited polymorphism
HLA tissue types 1 One linked set1970- Can only test for linkage to 6p21.3DNA RFLPs >105 Two allele markers, maximum heterozygosity 0.51975- (potentially) Initially required Southern blotting, now PCR
Easy physical localizationDNA VNTRs >104 Many alleles, highly informative
(minisatellites) (potentially) Tend to cluster near ends of chromosomes1985- Easy physical localizationDNA VNTRs >105 Many alleles, highly informative
(microsatellites) (potentially) Can type by automated multiplex PCREasy physical localization
1989- Distributed throughout genomeDNA SNPs >106 Less informative than microsatellites(single nucleotide polymorphisms)
(potentially) Can be typed on a very large scale by automated equipment without gel electrophoresis
1998-
Markery fenotypowe
Markery DNA
Mapa
Cytogenetyczna
(chromosome bands) –
rozróżnialne zabarwione
fragmenty chromosomów
(mikroskop
optyczny)
Mbps
NiskaNiska
rozdzielczorozdzielczośćść
WysokaWysoka
rozdzielczorozdzielczośćść
Sequence “map”
-
całkowicie
zsekwencjonowany chromosom
1bp.
STS sequence
mapping
–
kolejność
unikalnych
w genomie markerów
DNA (STS)
100 kbp
Mapowanie Fizyczne
Restriction mapping
–
kolejność
i odległości
pomiędzy
punktami trawienia
enzymami
DNA.
100s kbp
Fluorescence
in
situ hybridisation
–
hybrydyzacja fluorescencyjnych sond do chromosomów 100s kbp
Mapy fizyczneFISH (Fluorescent in situ hybridization) –
hybrydyzacja fluorescencyjna in situ
Mapa fizyczna genomu Medicago truncatula
(lucerny) skonstruowana metodą
FISH
Mapy fizyczne cd.STS
(Sequence tagged site) mapping
-
-
mapowanie
miejsc znakowanych sekwencją
Analiza STS
A
B
Mapa restrykcyjna
A B
Sekwencjonowanie genomów
WGS (whole
genome
shotgun)Clone contig
Przeglądarki genomowe - Genome Browsers
NCBI Map ViewerUCSC Genome
Browser
(University
of
Calif., Santa Cruz)Ensembl Map View
Ensembl
Ensembl
UCSC
NCBI
NCBI