Podstawy i zastosowania bioinformatyki II

Post on 13-Jan-2016

42 views 0 download

description

Podstawy i zastosowania bioinformatyki II. Marek Kudła. BLAST. Jak działa BLAST?. AGI. podobne. np. AGI AGL AGV. niepodobny. np. FGT. BAZA DANYCH. BLAST. Sekwencja białkowa. Sekwencja DNA. blastn. blastx. tblastn. blastp. tblastx. Pfam – Protein families. - PowerPoint PPT Presentation

Transcript of Podstawy i zastosowania bioinformatyki II

Podstawy i zastosowania bioinformatyki II

Marek Kudła

BLAST

Jak działa BLAST?

BAZA

DANYCH

podobne

np.

AGI

AGL

AGV

niepodobny

AGI

np. FGT

BLAST Sekwencja białkowa

Sekwencja DNA

blastn

blastp

blastx

tblastn

tblastx

Pfam – Protein families

• Białka można grupować w rodziny na podstawie podobieństwa JEDNAK

• Często można wyróżnić określony motyw – domenę, czy sekwencję peptydową, która występuje u różnych, niespokrewnionych ze sobą pod innym względem białek.

• Taka domena często ma określoną specyficzną funkcję, np. aktywność helikazy, czy rybonukleazy

Baza danych Pfam zawiera informacje o takich domenach – opis funkcjonalny domeny, linki do struktur krystalograficznych oraz prawdopodobną sekwencję domeny w postaci multiple alignment lub Position Specific Score Matrix

Znanych jest 7600 takich domen.

74% białek posiada przynajmniej jedną domenę w bazie Pfam.

Multiple alignment dla domen

Position Specific Score Matrix

Pozycja 1: V 0,3 ; G 0,02 ; L 0,68

Pozycja 2: L 0,6 ; M 0,2 ; C 0,2

Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88

………

………

………

Pozycja N: A 0,99 ; G 0,01

PSI-BLAST