wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11....
Transcript of wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11....
Bioinformatyka
wykłady dla I r. studiów magisterskich, biologia (SGGW)
2010/2011
Krzysztof Pawłowski
Wykład 5.X.2010
Co to jest bioinformatyka?Program wykładówZastosowanie bioinformatyki:sekwencjonowanie genomów
Rozwiązywanie problemów biologicznych metodami obliczeniowymi
Solving biological problems by computational means
Some synonyms:In silico biologyComputational biology / Biocomputing Theoretical biology
Substantial overlaps:Computational chemistry / cheminformaticsSystems biologyStructural biologyTheoretical biophysics
„definicja” bioinformatyki / biologii obliczeniowej
•
Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms
•
Objects’
attributes: sequences,
3-D structures, expression data, clinical data, publications,….
Zakres zainteresowań bioinformatyki
„oficjalne” definicje NIH
Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data.Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.
Bioinformatics (wikipedia)
Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.
Bioinformatics
(wikipedia, contd.)
The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.
Bioinformatyka (wikipedia)
Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatykąpowiązane są: genomika, proteomika, metabolomika i transkryptomika.
„bioinformatyka”
–
nowa dyscyplina?
…ale pod innymi nazwami rozwijała się przynajmniej od lat 60.
Publikacje bioinformatyczne (PubMed)
1
10
100
1000
10000
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
bioinformatics[Text Word]
bioinformatics[MeSH Heading]
Bioinformatyka w Google
17 500 000
47 300 241 000 1 160 000 1 140 000 1 730 000
126 000 000
27 700 000
bioin
formati
cs bi
oinfor
matyka
bioin
formati
ka bi
oinfor
matik
bioin
formati
ca bi
oinfor
matiqu
e
biolo
gy
biolo
gia
bioinformatyka
BIOINFORMATYKA BIOINFORMATYKA --
dziedzina interdyscyplinarnadziedzina interdyscyplinarna
biologia (molekularna)dane biologiczne
informatyka narzędzia,metody
i obliczenia komputerowe= +
dane dotyczące kwasów nukleinowych, białek,
lipidów, węglowodanów i innych makrocząsteczek
nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria
prawdopodobieństwa
fizyka i chemia
BIOINFORMATYKA BIOINFORMATYKA --
celecele
Organizowanie i zarządzanie informacjami o
makrocząsteczkach i innych danych biologicznych w formie skomputeryzowanych (cyfrowych) zapisów -
baz danych
Analiza tych danych
za
pomocą
metod obliczeniowych, rozwój metod i algorytmów
DNA
BIOINFORMATYKA BIOINFORMATYKA --
poziomy analizpoziomy analiz
mRNA
białka
interakcje i metabolizm
genom
BIOINFORMATYKA BIOINFORMATYKA --
poziomy analizpoziomy analiz
wszystkie sekwencje DNA zawarte w organizmie, geny,
sekwencje regulatorowe
genomikagenomika
poziom badań przedmiot badań dziedzina badań
poszukiwanie sekwencji kodujących, rozpoznawanie
eksonów i intronów, organizacja genomów,porównanie sekwencji
tematy badań
transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomikatranskryptomika analiza ekspresji genów
proteom wszystkie białka zawarte w organizmie
proteomikaproteomikaporównanie sekwencji,
identyfikacja zachowanych regionów, przewidywannie struktury, oddziaływania
metabolom wszystkie procesy metaboliczne zachodzące w organizmie,
metabolity
metabolomikametabolomika określanie sieci i szlaków metabolicznych, symulacje
Program wykładów
Genomy Sekwencje biologiczneBiologiczne bazy danychStruktury makrocząsteczek biologicznychElementy biologii systemowejElementy epigenetyki
…dygresje w stronę biologii, fizyki, chemii
zaliczenie
Ćwiczenia:lista obecności & kolokwium (a)
Wykład:kolokwium (b)
Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2
LiteraturaLiteratura
LiteraturaLiteratura
http://www.ncbi.nlm.nih.gov/books
Baxevanis, Ouelette
Sekwencjonowanie DNASekwencjonowanie DNA1977Sanger i współpr.
–
metoda terminacji łańcucha, dideoksy1987Prober i współpr.
–
znakowanie fluorescencyjne i zautomatyzowanie metody
analizator DNA (sekwenser) ABI PRISM 3700
Etapy sekwencjonowania genomEtapy sekwencjonowania genomóóww
Wybór zachodzących pojedynczych klonów do sekwencjonowania
Oczyszczanie chromosomów
Pofragmentowanie metodą
sonikacji na odcinki o długości 100 kpz (kbp) lub większe
Klonowanie fragmentów w wektorach (YAC, BAC)
Tworzenie mapy chromosomu
ObrObróóbka sekwencji HTGSbka sekwencji HTGSFaza 0
Faza 1
Faza 2
Faza 3
contigs
1977Sanger i współpr. -
fag ΦX 174 (5,4 tys. pz)
Sekwencjonowanie genomSekwencjonowanie genomóóww
1995Fleischmann i współpr. -
Haemophilus influenzae (1.8 mln pz)
1981Anderson i współpr. -
mtDNA człowieka (17 tys. pz)
Fraser i współpr. -
Mycoplasma genitalium (0.6 mln pz)
1997Blattner i współpr. –
Escherichia coli (4.6 mln pz)
Kunst i współpr. –
Bacillus subtilis (4.2 mln pz)
19961997Goffeau i współpr. Saccharomyces cerevisiae
(13 mln pz)
Sekwencjonowanie genomSekwencjonowanie genomóóww
1998The C. elegans Sequencing ConsortiumCaenorhabditis elegans
(100 mln pz)
Human Genome Projectod 1990
Celera Genomicsod 1998
VI 2000OIgłoszenie zakończenie prac nad wstępną
wersją
genomu ludzkiego; zsekwencjonowano:
85 %99 %Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą
współpracować
w końcowej fazie badań
po okresie zażartej konkurencji.
Sekwencjonowanie genomu czSekwencjonowanie genomu człłowiekaowieka
Francis CollinsCraig Venter
Human Genome ProjectCelera Genomics
II 2001niezależna publikacja wyników w:
Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM
GenBank GenBank ––
statystykastatystyka
Grupa
liczba genomów zsekwencjonowanych
(5.10.2010)
Archaea
91
Bacteria
1153
Eucaryota
36
GenBank GenBank ––
statystykastatystyka
Grupa liczba genomów zsekwencjonowanych oraz „draft assembly”
oraz „in progress” (5.10.2010)
Archaea
151
Bacteria
5138
Eucaryota
559
Kompletnie zsekwencjonowane genomyKompletnie zsekwencjonowane genomyEucaryota:
Drosophila melanogaster
Saccharomyces cerevisiaeSchizosaccharomyces pombeCandida glabrathaEncephalitozoon cuniculi GB-M1….
Caenorhabditis elegans
Entamoeba histolytica Plasmodium falciparumTrypanosoma cruzi….
Homo sapiens Mus musculus
Arabidopsis thalianaOryza sativa
KRĘGOWCE (2)
ROŚLINY (6)
OWADY (2)
GRZYBY (16)
PIERWOTNIAKI (9)
NICIENIE (1)
„Prywatne”
genomy medycyna zindywidualizowana?
James Watson (2008)
Craig Venter (2007)
Genomy indywidualne - c.d.
Genomy indywidualne - c.d.
Genomy indywidualne - c.d.
12 genomów z rodzaju Drosophila
2007