Download - Podstawy i zastosowania bioinformatyki II

Transcript
Page 1: Podstawy i zastosowania bioinformatyki II

Podstawy i zastosowania bioinformatyki II

Marek Kudła

Page 2: Podstawy i zastosowania bioinformatyki II

BLAST

Page 3: Podstawy i zastosowania bioinformatyki II

Jak działa BLAST?

BAZA

DANYCH

podobne

np.

AGI

AGL

AGV

niepodobny

AGI

np. FGT

Page 4: Podstawy i zastosowania bioinformatyki II

BLAST Sekwencja białkowa

Sekwencja DNA

blastn

blastp

blastx

tblastn

tblastx

Page 5: Podstawy i zastosowania bioinformatyki II
Page 6: Podstawy i zastosowania bioinformatyki II

Pfam – Protein families

• Białka można grupować w rodziny na podstawie podobieństwa JEDNAK

• Często można wyróżnić określony motyw – domenę, czy sekwencję peptydową, która występuje u różnych, niespokrewnionych ze sobą pod innym względem białek.

• Taka domena często ma określoną specyficzną funkcję, np. aktywność helikazy, czy rybonukleazy

Page 7: Podstawy i zastosowania bioinformatyki II

Baza danych Pfam zawiera informacje o takich domenach – opis funkcjonalny domeny, linki do struktur krystalograficznych oraz prawdopodobną sekwencję domeny w postaci multiple alignment lub Position Specific Score Matrix

Znanych jest 7600 takich domen.

74% białek posiada przynajmniej jedną domenę w bazie Pfam.

Page 8: Podstawy i zastosowania bioinformatyki II
Page 9: Podstawy i zastosowania bioinformatyki II

Multiple alignment dla domen

Page 10: Podstawy i zastosowania bioinformatyki II

Position Specific Score Matrix

Pozycja 1: V 0,3 ; G 0,02 ; L 0,68

Pozycja 2: L 0,6 ; M 0,2 ; C 0,2

Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88

………

………

………

Pozycja N: A 0,99 ; G 0,01

Page 11: Podstawy i zastosowania bioinformatyki II
Page 12: Podstawy i zastosowania bioinformatyki II

PSI-BLAST