wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11....

Post on 19-Jan-2021

0 views 0 download

Transcript of wykł biologia (SGGW) 2010/2011agrobiol.sggw.waw.pl/biometria/media/pawlowski/Bioin... · 2010. 11....

Bioinformatyka

wykłady dla I r. studiów magisterskich, biologia (SGGW)

2010/2011

Krzysztof Pawłowski

Wykład 5.X.2010

Co to jest bioinformatyka?Program wykładówZastosowanie bioinformatyki:sekwencjonowanie genomów

Rozwiązywanie problemów biologicznych metodami obliczeniowymi

Solving biological problems by computational means

Some synonyms:In silico biologyComputational biology / Biocomputing Theoretical biology

Substantial overlaps:Computational chemistry / cheminformaticsSystems biologyStructural biologyTheoretical biophysics

„definicja” bioinformatyki / biologii obliczeniowej

Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms

Objects’

attributes: sequences,

3-D structures, expression data, clinical data, publications,….

Zakres zainteresowań bioinformatyki

„oficjalne” definicje NIH

Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data.Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.

Bioinformatics (wikipedia)

Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.

Bioinformatics

(wikipedia, contd.)

The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.

Bioinformatyka (wikipedia)

Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatykąpowiązane są: genomika, proteomika, metabolomika i transkryptomika.

„bioinformatyka”

nowa dyscyplina?

…ale pod innymi nazwami rozwijała się przynajmniej od lat 60.

Publikacje bioinformatyczne (PubMed)

1

10

100

1000

10000

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

bioinformatics[Text Word]

bioinformatics[MeSH Heading]

Bioinformatyka w Google

17 500 000

47 300 241 000 1 160 000 1 140 000 1 730 000

126 000 000

27 700 000

bioin

formati

cs bi

oinfor

matyka

bioin

formati

ka bi

oinfor

matik

bioin

formati

ca bi

oinfor

matiqu

e

biolo

gy

biolo

gia

bioinformatyka

BIOINFORMATYKA BIOINFORMATYKA --

dziedzina interdyscyplinarnadziedzina interdyscyplinarna

biologia (molekularna)dane biologiczne

informatyka narzędzia,metody

i obliczenia komputerowe= +

dane dotyczące kwasów nukleinowych, białek,

lipidów, węglowodanów i innych makrocząsteczek

nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria

prawdopodobieństwa

fizyka i chemia

BIOINFORMATYKA BIOINFORMATYKA --

celecele

Organizowanie i zarządzanie informacjami o

makrocząsteczkach i innych danych biologicznych w formie skomputeryzowanych (cyfrowych) zapisów -

baz danych

Analiza tych danych

za

pomocą

metod obliczeniowych, rozwój metod i algorytmów

DNA

BIOINFORMATYKA BIOINFORMATYKA --

poziomy analizpoziomy analiz

mRNA

białka

interakcje i metabolizm

genom

BIOINFORMATYKA BIOINFORMATYKA --

poziomy analizpoziomy analiz

wszystkie sekwencje DNA zawarte w organizmie, geny,

sekwencje regulatorowe

genomikagenomika

poziom badań przedmiot badań dziedzina badań

poszukiwanie sekwencji kodujących, rozpoznawanie

eksonów i intronów, organizacja genomów,porównanie sekwencji

tematy badań

transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomikatranskryptomika analiza ekspresji genów

proteom wszystkie białka zawarte w organizmie

proteomikaproteomikaporównanie sekwencji,

identyfikacja zachowanych regionów, przewidywannie struktury, oddziaływania

metabolom wszystkie procesy metaboliczne zachodzące w organizmie,

metabolity

metabolomikametabolomika określanie sieci i szlaków metabolicznych, symulacje

Program wykładów

Genomy Sekwencje biologiczneBiologiczne bazy danychStruktury makrocząsteczek biologicznychElementy biologii systemowejElementy epigenetyki

…dygresje w stronę biologii, fizyki, chemii

zaliczenie

Ćwiczenia:lista obecności & kolokwium (a)

Wykład:kolokwium (b)

Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2

LiteraturaLiteratura

LiteraturaLiteratura

http://www.ncbi.nlm.nih.gov/books

Baxevanis, Ouelette

Sekwencjonowanie DNASekwencjonowanie DNA1977Sanger i współpr.

metoda terminacji łańcucha, dideoksy1987Prober i współpr.

znakowanie fluorescencyjne i zautomatyzowanie metody

analizator DNA (sekwenser) ABI PRISM 3700

Etapy sekwencjonowania genomEtapy sekwencjonowania genomóóww

Wybór zachodzących pojedynczych klonów do sekwencjonowania

Oczyszczanie chromosomów

Pofragmentowanie metodą

sonikacji na odcinki o długości 100 kpz (kbp) lub większe

Klonowanie fragmentów w wektorach (YAC, BAC)

Tworzenie mapy chromosomu

ObrObróóbka sekwencji HTGSbka sekwencji HTGSFaza 0

Faza 1

Faza 2

Faza 3

contigs

1977Sanger i współpr. -

fag ΦX 174 (5,4 tys. pz)

Sekwencjonowanie genomSekwencjonowanie genomóóww

1995Fleischmann i współpr. -

Haemophilus influenzae (1.8 mln pz)

1981Anderson i współpr. -

mtDNA człowieka (17 tys. pz)

Fraser i współpr. -

Mycoplasma genitalium (0.6 mln pz)

1997Blattner i współpr. –

Escherichia coli (4.6 mln pz)

Kunst i współpr. –

Bacillus subtilis (4.2 mln pz)

19961997Goffeau i współpr. Saccharomyces cerevisiae

(13 mln pz)

Sekwencjonowanie genomSekwencjonowanie genomóóww

1998The C. elegans Sequencing ConsortiumCaenorhabditis elegans

(100 mln pz)

Human Genome Projectod 1990

Celera Genomicsod 1998

VI 2000OIgłoszenie zakończenie prac nad wstępną

wersją

genomu ludzkiego; zsekwencjonowano:

85 %99 %Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą

współpracować

w końcowej fazie badań

po okresie zażartej konkurencji.

Sekwencjonowanie genomu czSekwencjonowanie genomu człłowiekaowieka

Francis CollinsCraig Venter

Human Genome ProjectCelera Genomics

II 2001niezależna publikacja wyników w:

Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM

GenBank GenBank ––

statystykastatystyka

Grupa

liczba genomów zsekwencjonowanych

(5.10.2010)

Archaea

91

Bacteria

1153

Eucaryota

36

GenBank GenBank ––

statystykastatystyka

Grupa liczba genomów zsekwencjonowanych oraz „draft assembly”

oraz „in progress” (5.10.2010)

Archaea

151

Bacteria

5138

Eucaryota

559

Kompletnie zsekwencjonowane genomyKompletnie zsekwencjonowane genomyEucaryota:

Drosophila melanogaster

Saccharomyces cerevisiaeSchizosaccharomyces pombeCandida glabrathaEncephalitozoon cuniculi GB-M1….

Caenorhabditis elegans

Entamoeba histolytica Plasmodium falciparumTrypanosoma cruzi….

Homo sapiens Mus musculus

Arabidopsis thalianaOryza sativa

KRĘGOWCE (2)

ROŚLINY (6)

OWADY (2)

GRZYBY (16)

PIERWOTNIAKI (9)

NICIENIE (1)

„Prywatne”

genomy medycyna zindywidualizowana?

James Watson (2008)

Craig Venter (2007)

Genomy indywidualne - c.d.

Genomy indywidualne - c.d.

Genomy indywidualne - c.d.

12 genomów z rodzaju Drosophila

2007