Post on 13-Jan-2016
description
Podstawy i zastosowania bioinformatyki II
Marek Kudła
BLAST
Jak działa BLAST?
BAZA
DANYCH
podobne
np.
AGI
AGL
AGV
niepodobny
AGI
np. FGT
BLAST Sekwencja białkowa
Sekwencja DNA
blastn
blastp
blastx
tblastn
tblastx
Pfam – Protein families
• Białka można grupować w rodziny na podstawie podobieństwa JEDNAK
• Często można wyróżnić określony motyw – domenę, czy sekwencję peptydową, która występuje u różnych, niespokrewnionych ze sobą pod innym względem białek.
• Taka domena często ma określoną specyficzną funkcję, np. aktywność helikazy, czy rybonukleazy
Baza danych Pfam zawiera informacje o takich domenach – opis funkcjonalny domeny, linki do struktur krystalograficznych oraz prawdopodobną sekwencję domeny w postaci multiple alignment lub Position Specific Score Matrix
Znanych jest 7600 takich domen.
74% białek posiada przynajmniej jedną domenę w bazie Pfam.
Multiple alignment dla domen
Position Specific Score Matrix
Pozycja 1: V 0,3 ; G 0,02 ; L 0,68
Pozycja 2: L 0,6 ; M 0,2 ; C 0,2
Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88
………
………
………
Pozycja N: A 0,99 ; G 0,01
PSI-BLAST