wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11....

37
Bioinformatyka wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011 Krzysztof Pawłowski

Transcript of wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11....

Page 1: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Bioinformatyka

wykłady dla I r. studiów magisterskich, biologia (SGGW)

2010/2011

Krzysztof Pawłowski

Page 2: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Wykład 5.X.2010

Co to jest bioinformatyka?Program wykładówZastosowanie bioinformatyki:sekwencjonowanie genomów

Page 3: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Rozwiązywanie problemów biologicznych metodami obliczeniowymi

Solving biological problems by computational means

Some synonyms:In silico biologyComputational biology / Biocomputing Theoretical biology

Substantial overlaps:Computational chemistry / cheminformaticsSystems biologyStructural biologyTheoretical biophysics

„definicja” bioinformatyki / biologii obliczeniowej

Page 4: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms

Objects’

attributes: sequences,

3-D structures, expression data, clinical data, publications,….

Zakres zainteresowań bioinformatyki

Page 5: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

„oficjalne” definicje NIH

Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data.Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.

Page 6: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Bioinformatics (wikipedia)

Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.

Page 7: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Bioinformatics

(wikipedia, contd.)

The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.

Page 8: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Bioinformatyka (wikipedia)

Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatykąpowiązane są: genomika, proteomika, metabolomika i transkryptomika.

Page 9: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

„bioinformatyka”

nowa dyscyplina?

…ale pod innymi nazwami rozwijała się przynajmniej od lat 60.

Publikacje bioinformatyczne (PubMed)

1

10

100

1000

10000

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

bioinformatics[Text Word]

bioinformatics[MeSH Heading]

Page 10: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Bioinformatyka w Google

17 500 000

47 300 241 000 1 160 000 1 140 000 1 730 000

126 000 000

27 700 000

bioin

formati

cs bi

oinfor

matyka

bioin

formati

ka bi

oinfor

matik

bioin

formati

ca bi

oinfor

matiqu

e

biolo

gy

biolo

gia

Page 11: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

bioinformatyka

BIOINFORMATYKA BIOINFORMATYKA --

dziedzina interdyscyplinarnadziedzina interdyscyplinarna

biologia (molekularna)dane biologiczne

informatyka narzędzia,metody

i obliczenia komputerowe= +

dane dotyczące kwasów nukleinowych, białek,

lipidów, węglowodanów i innych makrocząsteczek

nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria

prawdopodobieństwa

fizyka i chemia

Page 12: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

BIOINFORMATYKA BIOINFORMATYKA --

celecele

Organizowanie i zarządzanie informacjami o

makrocząsteczkach i innych danych biologicznych w formie skomputeryzowanych (cyfrowych) zapisów -

baz danych

Analiza tych danych

za

pomocą

metod obliczeniowych, rozwój metod i algorytmów

Page 13: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

DNA

BIOINFORMATYKA BIOINFORMATYKA --

poziomy analizpoziomy analiz

mRNA

białka

interakcje i metabolizm

Page 14: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

genom

BIOINFORMATYKA BIOINFORMATYKA --

poziomy analizpoziomy analiz

wszystkie sekwencje DNA zawarte w organizmie, geny,

sekwencje regulatorowe

genomikagenomika

poziom badań przedmiot badań dziedzina badań

poszukiwanie sekwencji kodujących, rozpoznawanie

eksonów i intronów, organizacja genomów,porównanie sekwencji

tematy badań

transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomikatranskryptomika analiza ekspresji genów

proteom wszystkie białka zawarte w organizmie

proteomikaproteomikaporównanie sekwencji,

identyfikacja zachowanych regionów, przewidywannie struktury, oddziaływania

metabolom wszystkie procesy metaboliczne zachodzące w organizmie,

metabolity

metabolomikametabolomika określanie sieci i szlaków metabolicznych, symulacje

Page 15: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Program wykładów

Genomy Sekwencje biologiczneBiologiczne bazy danychStruktury makrocząsteczek biologicznychElementy biologii systemowejElementy epigenetyki

…dygresje w stronę biologii, fizyki, chemii

Page 16: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

zaliczenie

Ćwiczenia:lista obecności & kolokwium (a)

Wykład:kolokwium (b)

Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2

Page 17: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

LiteraturaLiteratura

Page 18: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

LiteraturaLiteratura

http://www.ncbi.nlm.nih.gov/books

Page 19: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Baxevanis, Ouelette

Page 20: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)
Page 21: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Sekwencjonowanie DNASekwencjonowanie DNA1977Sanger i współpr.

metoda terminacji łańcucha, dideoksy1987Prober i współpr.

znakowanie fluorescencyjne i zautomatyzowanie metody

analizator DNA (sekwenser) ABI PRISM 3700

Page 22: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Etapy sekwencjonowania genomEtapy sekwencjonowania genomóóww

Wybór zachodzących pojedynczych klonów do sekwencjonowania

Oczyszczanie chromosomów

Pofragmentowanie metodą

sonikacji na odcinki o długości 100 kpz (kbp) lub większe

Klonowanie fragmentów w wektorach (YAC, BAC)

Tworzenie mapy chromosomu

Page 23: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

ObrObróóbka sekwencji HTGSbka sekwencji HTGSFaza 0

Faza 1

Faza 2

Faza 3

contigs

Page 24: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

1977Sanger i współpr. -

fag ΦX 174 (5,4 tys. pz)

Sekwencjonowanie genomSekwencjonowanie genomóóww

1995Fleischmann i współpr. -

Haemophilus influenzae (1.8 mln pz)

1981Anderson i współpr. -

mtDNA człowieka (17 tys. pz)

Fraser i współpr. -

Mycoplasma genitalium (0.6 mln pz)

1997Blattner i współpr. –

Escherichia coli (4.6 mln pz)

Kunst i współpr. –

Bacillus subtilis (4.2 mln pz)

Page 25: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

19961997Goffeau i współpr. Saccharomyces cerevisiae

(13 mln pz)

Sekwencjonowanie genomSekwencjonowanie genomóóww

1998The C. elegans Sequencing ConsortiumCaenorhabditis elegans

(100 mln pz)

Page 26: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Human Genome Projectod 1990

Celera Genomicsod 1998

VI 2000OIgłoszenie zakończenie prac nad wstępną

wersją

genomu ludzkiego; zsekwencjonowano:

85 %99 %Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą

współpracować

w końcowej fazie badań

po okresie zażartej konkurencji.

Sekwencjonowanie genomu czSekwencjonowanie genomu człłowiekaowieka

Francis CollinsCraig Venter

Page 27: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Human Genome ProjectCelera Genomics

II 2001niezależna publikacja wyników w:

Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM

Page 28: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

GenBank GenBank ––

statystykastatystyka

Grupa

liczba genomów zsekwencjonowanych

(5.10.2010)

Archaea

91

Bacteria

1153

Eucaryota

36

Page 29: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

GenBank GenBank ––

statystykastatystyka

Grupa liczba genomów zsekwencjonowanych oraz „draft assembly”

oraz „in progress” (5.10.2010)

Archaea

151

Bacteria

5138

Eucaryota

559

Page 30: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)
Page 31: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Kompletnie zsekwencjonowane genomyKompletnie zsekwencjonowane genomyEucaryota:

Drosophila melanogaster

Saccharomyces cerevisiaeSchizosaccharomyces pombeCandida glabrathaEncephalitozoon cuniculi GB-M1….

Caenorhabditis elegans

Entamoeba histolytica Plasmodium falciparumTrypanosoma cruzi….

Homo sapiens Mus musculus

Arabidopsis thalianaOryza sativa

KRĘGOWCE (2)

ROŚLINY (6)

OWADY (2)

GRZYBY (16)

PIERWOTNIAKI (9)

NICIENIE (1)

Page 32: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

„Prywatne”

genomy medycyna zindywidualizowana?

James Watson (2008)

Craig Venter (2007)

Page 33: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Genomy indywidualne - c.d.

Page 34: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Genomy indywidualne - c.d.

Page 35: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)
Page 36: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

Genomy indywidualne - c.d.

Page 37: wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11. 19. · Analiza tych danych za ... Klonowanie fragmentów w wektorach (YAC, BAC)

12 genomów z rodzaju Drosophila

2007