Proteiny (bia sekwencjonowanie - MALDI ToFmaldi.ch.pw.edu.pl/pomiary/Artykuly/sekwencjonowanie...

Proteiny (białka)sekwencjonowanie

Skład chemiczny białek

• Liniowe łańcuchy tworzone przez reagująceze sobą L-aminokwasy– Szkielet

• Identyczny• trans-peptydowe (amidowe) wiązania

– Mniej naprężeń sterycznych– 1000-krotnie korzystniejsze w stosunku do cis

– Łańcuchy boczne

Łańcuch polipeptydowy

szkielet polipeptyduPrzedstawienieschematyczne

SEKWENCJA

AMINOKWASÓW

niepolarnagrupa boczna

polarna grupa boczna

Wiązaniepeptydowe

C

O

N

H

formowanie wiązaniapeptydowego zusunięciem wody

woda

glicyna alanina

wiązanie peptydowe międzyglicyna a alaniną

Powstawanie wiązania peptydowego

N końcowa częśćbiałka- z grupąaminową

C końcowa częśćbiałka z grupąkarboksylową

szkielet polipeptydułańcuchy boczne

wiązaniepeptydowe

wiązaniepeptydowe

Aminkwasy i Stereochemia

• Na Cα są 4 różne podstawniki:– Łańcuch boczny (specyficzny dla

poszczególnych aminokwasów)– Grupa aminowa– Grupa karboksylowa– Proton

• Podstawniki mogą przyjąć dwiekonfiguracje wokół tetraedrycznego węgla

R C

H

CO2H

NH2

α-Carbon

Budowa aminokwasów

grupaaminowa

grupakarboksylowa

węgiel αłańcuch boczny

forma niezjonizowana forma zjonizowana

jon obojnaczy

Klasyfikacja popularnychAminokwasów

• Łańcuch boczny (R) różni się polarnością:– Hydrofilowy

• Obojętny polarny– Stosunkowo dobrze rozpuszczalne w wodzie

• Obdarzony ładunkiem– kwasowy– zasadowy

– Hydrofobowy• Raczej nierozpuszczalne w wodzie• Skłonne do samoasocjacji

R C

H

CO2H

NH2

α-Carbon

Aminokwasy polarne i niepolarne

aminokwas łańcuch boczny

AMINOKWASY POLARNE AMINOKWASY NIEPOLARNE

aminokwas łańcuch boczny

naładowane ujemnie

naładowane dodatnio

bez ładunku, polarne

niepolarne =hydrofobowe

4 poziomy struktury białek

• I-rzędowa (Primary)– > 200 kJ/mol

• II-rzędowa (Secondary)– 10 kJ/mol

• III-rzędowa (Tertiary)– < 5 kJ/mol

• IV-rzędowa (Quaternary) – tylko oligomery(więcej niż 1 łancuch)

Struktura białek

• Pierwszorzędowa– kolejność aminokwasów w łańcuchu

• N - koniec (start, umownie)• C- koniec (zakończenie)

• Drugorzędowa– Fragmenty łańcucha złożone w regularnej konformacji

• α-helisa• β-arkusz (harmonijka)• Inne struktury: β- lub powrotne skręty, pętle omega, kłębek

α-Helisa• Kształt cylindra• Stabilizowana wiązaniami wodorowymi

między grupą C=O i-tej reszty i protonemamidowym reszty i+3

• Zwykle 10 -15 reszt aminokwasowych i 3-4zwoje– Każdy zwój

• zawiera 3.6 reszt aminokwasowych• Długość ok. 5.41 Å

• Tworzą ją aminokwasy z rozbudowanymi łańcuchami bocznymi• Hydrofilowe i hydrofobowe aminokwasy znajdują się na

przeciwległych powierzchniach cylindra

β-arkusz

• Struktura harmonijkowa (arkusza)• Składa się z 2-6 nici (3-10 aminokwasów

każda) stabilizowanych wiązaniami wodorowymi– Równolegle ułożenie nici– Antyrównoległe (bardziej powszechne)

• Zawiera aminokwasy z rozgałęzionym węglem β– np., izoleucyna, treonina, alanina, glicyna

• Włókna jedwabiu (poli Ala-Gly) (teoretycznie)• Wysoka zawartość β-arkuszy• 400,000 Da

• Trzeciorzędowa– Kształt przestrzenny

• Czwartorzędowa– W białkach

zamierających kilkałańcuchów

– np.: hemoglobina(tetramer)

Struktura białek

Międzymolekularne oddziaływania stabilizujace

• Wiązania wodorowe (3 kcal/mol)• Oddziaływania elektrostatyczne - między łańcuchami

bocznymi obdarzonymi ładunkiem– Mostki solne

• Wiązania disiarczkowe 2 S-H = S-S + 2H+

• Oddziaływania hydrofobowe (3-5 kcal/mol; udział entropii)

Białka - przykłady

Protein MW Number ofResidues

Number ofSubunits

Insulin(bovine)

5,733 51 2

Myoglobin(horse)

16,890 153 1

Fatty acidsynthetase

(yeast)

2,300,000 20,000 21

Tobaccomosaic virus

40,000,000 336,500 2,130

Białka – różnorodne funkcje

Białka globularne (rozp.) Funkcja, przykład

Enzymy Biochemiczne katalizatory

Antyciała System immunologiczny

Hormony białkowe Stymulatory, przekaźniki

Białka transportującei magazynujące

Hemoglobina, ferrytyna

Białka włókniste (nierozp.) Strukturalna konstrukcja(kolagen, keratyna)

• Left-hand single helix, 3residues/turn

• 1/3 Gly, 1/5 Pro or Hyp• Triplet Gly-X-Pro (or Gly-X-

Hyp) repeats• Supertwisted coiled coil is

right-handed, made of 3left-handed α-chains

Włóknisty Kolagen -nierozpuszczalny

18

Globularna strukturarozpuszczalnego białka

Rozpuszczalność białek

• Zmienna– Zależy od równowagi

hydrofilowo/hydrofobowej powierzchni białka(łańcuchy boczne aminokwasów)

• Zależy of pH środowiska– Niższa rozpuszczalność w okolicach pI

• Białka zwierzęce: pI w zakresie 5.5-6.0• Białka roślinne/bakterii: pI w zakresie 4.5-5.0

pI

• pH, w którym białko ma sumarycznyładunek równy zeru

• Białka są słabo rozpuszczalne w pHzbliżonym do pI

• Dodatek surfaktanta poprawia rozpuszczalność– Powstają micele

• Np., sodium dodecyl sulfate (SDS) lub Triton-X(niejonowy)

– Etanol / aceton mogą rozpuścić lub wytrącić białko– Wady: trzeba oczyszczać; możliwa denaturacja

Rozpuszczalność białek

Absorpcja UV przez białka• 3 aromatyczne aminokwasy (π-π* chromofory)

– tyrozyna– tryptofan– fenyloalanina

COOHH2N

COOHH2N

HO

NH

COOHH2N

Phenylalanine Tyrosine Tryptophan

ε(280) =5.6E3ε(274) =1.4E3ε(257) =0.2E3

Amino Acid λλλλmax, nm εεεε x 10-3 at λλλλmax,M-1 cm-1

Tryptophan 280 5.6

Tyrosine 274 1.4

Tyrosinate 295 2.6

Phenylalanine 257 0.2

NB: pKa tyrosine 9.5

Absorpcja promieniowania UVprzez białka

Kofaktory

Absorpcja UV przez białka

• Dinukleotyd nikotynoamidoadeninowy (NADH)

• Dinukleotyd flawinoadeninowy (FADH)

• Hem – ugrupowanie prostetyczne (niebiałkowaczęść) wielu enzymów

Kofaktory - Absorpcja UV Vis• Dinukleotyd nikotynoamidoadeninowy (NADH)

NADH (ε260=14 x 103 M-1 cm-1 ; ε340=6.2 x 103 M-1 cm-1)NAD+ (ε260=18 x 103 M-1 cm-1)

• UV Vis– Hem (ε400=105 M-1 cm-1)

Układydelokalizowanychelektronów π

Kofaktory

Cyt c

• Funkcja:Białko redoks bierzeudział w oddychaniukomórki i apoptozie

• Struktura:białko z grupą hemu– MW 12,384 (horse)

Widmo UV-vis 10 µMCytochromu c

• Dwa pasma:– Pasmo Soreta– Pasmo Q

– Intensywność ipołożenie pasm zależneod procesów redoks

Wavelength (nm)300 350 400 450 500 550 600

Abs

orba

nce

(AU

)0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8 408

360

528

Wavelength (nm)300 350 400 450 500 550 600

Abso

rban

ce (A

U)

0

0.2

0.4

0.6

0.8

1 414

316

550

520

Metody Spektroskopowe analizybiałek

Method Information ProvidedIR secondary structure

Raman secondary structure, foldingCD secondary structure

NMR tertiary structure, foldingUV concentration, specific activity

Fluorescence concentration

Dichroizm Kołowy Circular Dichroism (CD)

• Informacje o strukturze drugorzędowej• Bazuje na różnicy w absorbancji światła polaryzowanego kołowo prawoskrętnie

i lewoskrętniet przez chromofory

Fluorescencja

• Naturalne fluorofory– Aromatyczne

aminokwasy– Kofaktory

• FADH• NADH

Me

Me

N

OH

OHN

OH

N

O

O

NH

O

PO

OHOP

O

O

HO

O

OH

N

HO

N

N

NH2

N

SSR

RS

RR

FADH

HO

N O

OH

N

N

OP

NH2

N

O

O OH

P

O

O

O

O

HO

N

OH

NH2

O-

+

RR

SR

RS

RR

NADH

Dinukleotyd flawinoadeninowy

Dinukleotyd nikotynoamidoadeninowy

Naturalne Fluorofory

Amino Acid λλλλem, nm φφφφF

Trp 348 0.20

Tyr 303 0.10

Phe 282 0.04

Note: ϕ is the quantum yield; think of this as analogous to ε in UV-vis spectroscopy

Sondy Fluorescencyjne

Probe Reagent

Point of Attachment

λλλλem, nm φφφφF

Dansyl chloride

Lys, Cys 510 0.10

0.30Fluorescein isothiocyanate

(FITC)

Lys 516

N(CH3)2

S

O

O Cl

O

COOH

OH

NCS

ONote: extensively delocalized π-systems

Białka - bogactwo

• E. coli - 1000 różnych protein

• Całkowita liczba białek > 1010

PROTEin complement of the genOME

białkowe dopełnienie genomu

Całość białek obecnych w komórce (organizmie)podczas kompletnego cyklu życiowego

Proteom

DNA RNA mRNA BiałkoTranskrypcja Dojrzewanie

SplicingRedagowanieAlternatywnapoliadenylacja

Translacja

>200 potranslacyjnych modyfikacji

• aktywność katalityczna

• oddziaływanie• stabilność• czas życia• lokalizacja

Genomika Transkryptomika Proteomika Metabolomika

Zależność pomiędzy genomem a proteomem

Organizm Wielkość genomu Szacowana (zasady) ilość genów

Człowiek (Homo sapiens) 3 mld 30 000Mysz (M. musculus) 2,6 mld 30 000Rzodkiewnik (A. thaliana) 100 mln 25 000Nicień (C. elegans) 97 mln 19 000Muszka owocowa (D. melanogaster) 137 mln 13 000Drożdże (S. cerevisiae) 12,1 mln 6 000Bakteria (E. coli) 4,6 mln 3 200Wirus (HIV) 9700 9

Wielkość genomu oraz proteomu

• około 1x1014 komórek

• 250 typów komórek

• szacowana ilość białek 25 000 - 30 000

• 8 000 - 10 000 różnych białek w komórce

• od kilku do kilku milionów kopii danego białka w komórce (większość białek w komórce to białka konstytutywne występujące w ponad 10 000 kopii)

• Kilkadziesiąt - kilkaset białek specyficznych dla danego typu komórki lub tkanki

• brak liniowej zależności pomiędzy ilością mRNA a proteomem

Organizacja proteomu człowieka

• Proteomika obejmuje systematyczną analizę białek występujących w komórce, tkance lub całym organizmie.

• Głównym celem proteomiki jest jakościowy oraz ilościowy opis białek występujących w komórkach lub tkankach.

Proteomika

• Poznanie funkcjonowania proteomu

• Badanie modyfikacji potranslacyjnch

• Poznanie szlaków przekazywania sygnałów

• Zrozumienie molekularnych przyczyn chorób

• Projektowanie nowych leków

• Terapie „personalne”

Zastosowania proteomiki

�Rozdzielanie białek (elektroforeza, chromatografia)�Identyfikacja białek (spektrometria masowa)

�Ilościowe pomiary białek (spektrometria masowa,

chromatografia)

�Analiza sekwencji białka (bioinformatyka)

�Proteomika strukturalna (krystalografia i spektroskopia

NMR)

�Proteomika interakcyjna

�Badanie modyfikacji białek (modyfikacje posttranslacyjne)

Proteomika - narzędzia

42

Oddziaływania białko-białko

Lokalizacja białka w komórce

Modyikacje posttranslacyjne

Oddziaływania białko-DNA/RNA

Proteomika komórkowa

43

Proteomika kliniczna

Oznaczanie biomarkerów w surowicy, osoczu, ślinie i innych płynach ustrojowych lub tkankach:

- ułatwia wczesne wykrycie choroby

- umożliwia przewidywanie reakcji pacjenta na terapię (terapia personalna)

Anderson, N. L. (2003) Mol. Cell. Proteomics 2: 50

Referencyjne zawartości 70 protein (bioanalitów) w osoczu krwi

PSA

Przygotowanie próbki białka do sekwencjonowania

Sekwencjonowanie poszczególnych frakcji HPLC

1. Metody chemiczne

2. Spektrometria mas

Strategies for protein sequence analysisProtein / Protein complex

2D GESDS-PAGE/IEF

In-gel digestion

HPLC peptide mapping

Edman degradation

MALDI TOF MS

LC-MS/MS

Proteolytic digestion

47

Analiza ekstraktu białkowego z ludzkiej wątrobymetodą dwukierunkowej elektroorezy żelowej

Punkt izoelektryczny

Mas

a

Ekstrakcja

Proteoliza

Separacja

Identyfikacja

K-X and R-X except when X = PTrypsin

X-MCyanogen Bromide

X-L, X-F, X-Y and X-WChymotrypsin

E-X except when X = PEndoprotease Glu-C

X-DEndoprotease Asp-N

R-X except when X = PEndoprotease Arg-C

K-X except when X = PEndoprotease Lys-C

Enzymes for Proteome Research

K – lizyna R – arginina P – prolina D – kwas asparaginowyL – leucyna Y – tyrozyna W – tryptoan E – kwas glutaminowyF – fenyloalanina M - metionina

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52Time, min

0.0

5.0e7

1.0e8

1.5e8

2.0e8

2.5e8

3.0e8

3.5e8

4.0e8

4.5e8

5.0e8

5.5e8

6.0e8

6.5e8

7.0e8

7.5e8In

ten s

ity (c

ps)

β-Kazeina produkty trawieniaChromatogram produktów trawienia białka

SEKWENCJONOWANIE

Sekwencjonowanie peptydu metodą Edmana

Degradacja Edmana (chemiczna) Mass spectrometry

Różnice w metodach sekwencjonowania

Edman degradation chemically removes amino acids from the amino terminus of a peptide one at a time and determines the sequence from the N-terminus of the peptide.

mass spectrometric methods match the masses of fragmented peptides with the calculated masses from fragments of proteins in the DNA-Protein sequence database.

A B C D E F G H - - - -

Analyze PTH-amino acid derivatives

A B C D E F

G H I K L M N P Q R

mass

massmass

Search the match in the databases(peptide mass fingerprinting)

> ~ 2 pmol of protein 5~50 fmol of protein (LC-MS/MS)56

Spektrometria mas

Technika analityczna polegająca na destrukcyjnej jonizacji badanej substancji a następnie, analizie utworzonych produktów ze względu na ich masę i ładunek.

M: � M.+ + e

PODSTAWYCztery etapy związane z eksperymentem spektrometrii mas:

1. generowanie cząsteczek w fazie gazowej z próbki (ciecz, roztwór, c. stałe, itd.)

2. jonizacja tych cząsteczek

3. rozdzielanie jonów na podstawie ich masy

4. detekcja strumienia jonów

Z uwagi na rozwiązania etapu 1 spotyka się różne techniki MS: (LC-MS, GC-MS, SIMS, MALDI-TOF, itd.)

Rozróżnia się różne typy aparatury MS z uwagi na rozwiązania etapu 2 i etapu 3.

Etap 4 jest z reguły wspólny dla większości spektrometrów mas – nie ma zasadniczych różnic.

Otrzymywanie jonów - metody desorpcyjno -jonizacyjne

Nowe techniki – analiza trudnolotnych substancji: polimery, biocząsteczki (proteiny, kwasy nukleinowe)

• Elektrorozpylanie Electrospray Ionization (ESI)

• Desorpcja laserem w obecności matrycy Matrix Assisted Laser Desorption Ionization (MALDI)

Eksperyment identyfikacji białka metodą MS Fingerprint

Separated Proteins

Enzymatic Digestion and Extraction

Peptide Mass FingerprintMALDI-TOF

Database Search

ProteinIdentification

Peptide Mass Fingerprint - procedura

• Izolacja białka• Enzymatyczne trawienie w określonych pozycjach

aminokwasów• MALDI-TOF analiza powstałych polipeptydów• Lista mas polipeptydów – na podstawie widma

MALDI-TOF• Przeszukiwanie bazy danych w celu odnalezienia

białka z identyczną fragmentacją “peptide mass fingerprint”

Peptide Mass Fingerprint

Cut out2D-Gel

Spot


Trypsin or/and chymotrypsin

Digest


MALDI TOFMS

Peptide Mass Fingerprint (myoglobin)

GLS

DG

EWQ

QVL

NVW

GK

VEA

DIA

GH

GQ

EVLI

R

LFTG

HPE

TLEK

HG

TVVL

TALG

GIL

K

KG

HH

EAEL

KPL

AQ

SHA

TK

GH

HEA

ELK

PLA

QSH

ATK

YLEF

ISD

AIIH

VLH

SK

HPG

DFG

AD

AQ

GA

MTK

ALE

LFR

Peptide Masses

1811.90 GLSDGEWQQVLNVWGK 1606.85 VEADIAGHGQEVLIR1271.66 LFTGHPETLEK1378.83 HGTVVLTALGGILK1982.05 KGHHEAELKPLAQSHATK1853.95 GHHEAELKPLAQSHATK1884.01 YLEFISDAIIHVLHSK1502.66 HPGDFGADAQGAMTK748.43 ALELFR

Protein Sequence

• Myoglobin GLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG

Micro-Sequencing by Tandem Mass Spectrometry (MS/MS)

• Analizowany jon jest wybierany w pierwszym segmencie MS

• Jonizacja CID (Collision Induced Dissociation) jest stosowana do fragmentacji wybranego jonu w pułapce jonowej (zwykle kolizja z atomami Argonu (FAB))

• Drugi segment MS rejestruje jony po fragmentacji• Fragmentatacja polipeptydów zachodzi wzdłuż łańcucha na wiązaniu peptydowego: odcinane są kolejne skrajne aminokwasy, zarówno z końca N jak i C (kierunki N->C i C->N).

Triple Quadrupole Mass Analyzer

Sample Inlet

Q2(Collision cell)

Q3

Ion Guide

Q1EM

Detector

Potrójny kwadrupol (Triple Quad)

Q-TOF Mass Analyzer

TOF

Sample Inlet

Q2(Collision cell)

Hexapole

Ion Guide

Q1

MCPDetector

Reflectron

Pusher

•Wybór jonu w Q1 (Product Scan)•Fragmentacja Q2•Analiza widma TOF

Peptide Fragmentation

• Peptides tend to fragment along the backbone.

• Fragments can also loose neutral chemical groups like NH3 and H2O.

H...-HN-CH-CO . . . NH-CH-CO-NH-CH-CO-…OH

Ri-1 Ri Ri+1

H+

Prefix Fragment Suffix Fragment

Collision Induced Dissociation

S#: 1708 RT: 54.47 AV: 1 NL: 5.27E6T: + c d Full ms2 638.00 [ 165.00 - 1925.00]

200 400 600 800 1000 1200 1400 1600 1800 2000m/z

0

5

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95

100

Rel

ativ

e A

bund

ance

850.3

687.3

588.1

851.4425.0

949.4

326.0524.9

589.2

1048.6397.1226.91049.6

489.1

629.0

N- and C-terminal Peptides

415

486

301

154

57

71

185

332

429

Reconstruct peptide from the set of masses of fragment ions

(mass-spectrum)


N-term

inal p

eptid

esC-te

rmina

l pep

tides

415

486

301

154

57

71

185

332

429

Terminal peptides and ion typesPeptide

Mass (D) 57 + 97 + 147 + 114 = 415

Peptide

Mass (D) 57 + 97 + 147 + 114 – 18 = 397

without


N-term

inal p

eptid

esC-te

rmina

l pep

tides

415

486

301

154

57

71

185

332

429

Tandem Mass Spectrometry in an Ion Trap

1) Widmo wyjściowe 2) Izolacja jonu: np. m/z 426.7 ± 1.5

300 900 1500 2000m/z

50

100

Rel

ativ

e Ab

unda

nce

426.7

852.3

1138.7700.2

426.7

3) Kolizja i fragmentacja

Fragmentation of426.7

4) Pomiar m/z fragmentów

SLNVALSLNVASLNVSLNSLS

RLR

ALRVALR

NVALRLNVALR

[For Peptide SLNVALR]

77

a-ionc-ionb-ion

-NH-CH-CO-NH-CH-CO-NH-

R1 R2

x-iony-ion

z-ion

Sequence Nomenclature for Mass Ladder

H2NHC C

O

R1

HN

HC

R2

C

OHN

HC

R3

C

OHN CH

R4

C

O

OH

a1 a3a2 b3b2b1 c2c2c1

x1 x3x2 y3y2y1 z2z2z1

1598

14241295

1166

1052

965852

723

586529

401Q G H E L S N E E R

+H

Protease digestion

Protein Sample Peptides

GDVEKGKKIFVQKCAQCHTVEKGGKHKTGPNLHGLFGRKTGQAPGFTYTDANKNKGITWKEETLMEYLENPKKYIPGTKMIFAGIKKKTEREDLIAYLKKATNE

m/z

First Stage Mass Spectrum

300 2200

TGPNLHGFGR

Selected Precursor mass and fragments

TGPNLHGLFGR

R

GR FGRGFGR etc

Protein Sequence

Peptides of precursors molecular weight fragmented

Peptides eluted from LC

Second Stage (fragmentation) Mass Spectrum

m/z75 2000

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52Time, min

0.0

5.0e7

1.0e8

1.5e8

2.0e8

2.5e8

3.0e8

3.5e8

4.0e8

4.5e8

5.0e8

5.5e8

6.0e8

6.5e8

7.0e8

7.5e8In

ten s

ity (c

ps)

β-Kazeina produkty trawienia

Courtesy of the MSCLS at the Univ. of Minn.

400 500 600 700 800 900 1000 1100 1200m/z, amu

100

300

500

700

900

1100

1300

1500

1700

1900

21001029.2

Inte

nsit y

, cp s

Widmo MS piku – tR = 30 min

100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500m/z, amu

2.0e5

6.0e5

1.0e6

1.4e6

1.8e6

2.2e6

2.6e6

3.0e6

3.4e6 F Q pS E E Q Q Q T E D E

a1-NH3b1-NH3

I

b2

a2-NH3

b2-NH3

b3b3-NH3

b4b4-NH3 a5

b5

y12y12-NH3b6

y11y11-NH3

b7

y10y10-NH3

b8

y9

b8-NH3

y9-NH3

y8

b9-NH3y8-NH3

y7

y7-NH3

y6

y6-NH3

y5

y5-NH3

y4

y4-NH3

y3

y3-NH3

y2

y2-NH3

y1

y1-NH3

a1

Inte

nsity

, cps

MSMS jonu 1031.3 –sekwencjonowanie

Courtesy of the MSCLS at the Univ. of Minn.

Sekwencjonowanie białek techniką MS/MS –

dwie metody znajdowania sekwencji

# Metoda przeszukiwania baz y danych fragmentów peptydowych

# Metoda De Novo

De Novo vs. Database Search S # : 1 7 0 8 R T : 5 4 .4 7 AV: 1 N L : 5 .2 7 E 6T : + c d F u l l m s 2 6 3 8 .0 0 [ 1 6 5 .0 0 - 1 9 2 5 .0 0 ]

2 0 0 4 0 0 6 0 0 8 0 0 1 0 0 0 1 2 0 0 1 4 0 0 1 6 0 0 1 8 0 0 2 0 0 0m /z

0

5

1 0

1 5

2 0

2 5

3 0

3 5

4 0

4 5

5 0

5 5

6 0

6 5

7 0

7 5

8 0

8 5

9 0

9 5

1 0 0

Rel

ativ

e Ab

unda

nce

8 5 0 .3

6 8 7 .3

5 8 8 .1

8 5 1 .44 2 5 .0

9 4 9 .4

3 2 6 .05 2 4 .9

5 8 9 .2

1 0 4 8 .63 9 7 .12 2 6 .91 0 4 9 .64 8 9 .1

6 2 9 .0

WR

A

C

VG

EK

DWL

P

T

L T

WR

A

C

VG

EK

DWL

P

T

L T

De Novo

AVGELTK

Database Search

Database of all peptides = 20n

AAAAAAAA,AAAAAAAC,AAAAAAAD,AAAAAAAE,AAAAAAAG,AAAAAAAF,AAAAAAAH,AAAAAAI,

AVGELTI, AVGELTK , AVGELTL, AVGELTM,

YYYYYYYS,YYYYYYYT,YYYYYYYV,YYYYYYYY

Database ofknown peptides

MDERHILNM, KLQWVCSDL, PTYWASDL, ENQIKRSACVM, TLACHGGEM, NGALPQWRT, HLLERTKMNVV, GGPASSDA, GGLITGMQSD, MQPLMNWE,

ALKIIMNVRT, AVGELTK,HEWAILF, GHNLWAMNAC,

GVFGSVLRA, EKLNKAATYIN..

Database ofknown peptides

MDERHILNM, KLQWVCSDL, PTYWASDL, ENQIKRSACVM, TLACHGGEM, NGALPQWRT, HLLERTKMNVV, GGPASSDA, GGLITGMQSD, MQPLMNWE, ALKIIMNVRT, AVGELTK,HEWAILF, GHNLWAMNAC,

GVFGSVLRA, EKLNKAATYIN..

Mass, Score

De novo Peptide Sequencing S#: 1708 RT: 54.47 AV: 1 NL: 5.27E6T: + c d Full ms2 638.00 [ 165.00 - 1925.00]

200 400 600 800 1000 1200 1400 1600 1800 2000m/z

0

5

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95

100

Rel

ativ

e A

bund

ance

850.3

687.3

588.1

851.4425.0

949.4

326.0524.9

589.2

1048.6397.1226.91049.6

489.1

629.0

SequenceSequence

Proteiny (bia sekwencjonowanie - MALDI ToFmaldi.ch.pw.edu.pl/pomiary/Artykuly/sekwencjonowanie...

Documents

Transcript of Proteiny (bia sekwencjonowanie - MALDI ToFmaldi.ch.pw.edu.pl/pomiary/Artykuly/sekwencjonowanie...