Proteiny (bia sekwencjonowanie - MALDI ToFmaldi.ch.pw.edu.pl/pomiary/Artykuly/sekwencjonowanie...
Transcript of Proteiny (bia sekwencjonowanie - MALDI ToFmaldi.ch.pw.edu.pl/pomiary/Artykuly/sekwencjonowanie...
Proteiny (białka)sekwencjonowanie
Skład chemiczny białek
• Liniowe łańcuchy tworzone przez reagująceze sobą L-aminokwasy– Szkielet
• Identyczny• trans-peptydowe (amidowe) wiązania
– Mniej naprężeń sterycznych– 1000-krotnie korzystniejsze w stosunku do cis
– Łańcuchy boczne
Łańcuch polipeptydowy
szkielet polipeptyduPrzedstawienieschematyczne
SEKWENCJA
AMINOKWASÓW
niepolarnagrupa boczna
polarna grupa boczna
Wiązaniepeptydowe
C
O
N
H
formowanie wiązaniapeptydowego zusunięciem wody
woda
glicyna alanina
wiązanie peptydowe międzyglicyna a alaniną
Powstawanie wiązania peptydowego
N końcowa częśćbiałka- z grupąaminową
C końcowa częśćbiałka z grupąkarboksylową
szkielet polipeptydułańcuchy boczne
wiązaniepeptydowe
wiązaniepeptydowe
Aminkwasy i Stereochemia
• Na Cα są 4 różne podstawniki:– Łańcuch boczny (specyficzny dla
poszczególnych aminokwasów)– Grupa aminowa– Grupa karboksylowa– Proton
• Podstawniki mogą przyjąć dwiekonfiguracje wokół tetraedrycznego węgla
R C
H
CO2H
NH2
α-Carbon
Budowa aminokwasów
grupaaminowa
grupakarboksylowa
węgiel αłańcuch boczny
forma niezjonizowana forma zjonizowana
jon obojnaczy
Klasyfikacja popularnychAminokwasów
• Łańcuch boczny (R) różni się polarnością:– Hydrofilowy
• Obojętny polarny– Stosunkowo dobrze rozpuszczalne w wodzie
• Obdarzony ładunkiem– kwasowy– zasadowy
– Hydrofobowy• Raczej nierozpuszczalne w wodzie• Skłonne do samoasocjacji
R C
H
CO2H
NH2
α-Carbon
Aminokwasy polarne i niepolarne
aminokwas łańcuch boczny
AMINOKWASY POLARNE AMINOKWASY NIEPOLARNE
aminokwas łańcuch boczny
naładowane ujemnie
naładowane dodatnio
bez ładunku, polarne
niepolarne =hydrofobowe
4 poziomy struktury białek
• I-rzędowa (Primary)– > 200 kJ/mol
• II-rzędowa (Secondary)– 10 kJ/mol
• III-rzędowa (Tertiary)– < 5 kJ/mol
• IV-rzędowa (Quaternary) – tylko oligomery(więcej niż 1 łancuch)
Struktura białek
• Pierwszorzędowa– kolejność aminokwasów w łańcuchu
• N - koniec (start, umownie)• C- koniec (zakończenie)
• Drugorzędowa– Fragmenty łańcucha złożone w regularnej konformacji
• α-helisa• β-arkusz (harmonijka)• Inne struktury: β- lub powrotne skręty, pętle omega, kłębek
α-Helisa• Kształt cylindra• Stabilizowana wiązaniami wodorowymi
między grupą C=O i-tej reszty i protonemamidowym reszty i+3
• Zwykle 10 -15 reszt aminokwasowych i 3-4zwoje– Każdy zwój
• zawiera 3.6 reszt aminokwasowych• Długość ok. 5.41 Å
• Tworzą ją aminokwasy z rozbudowanymi łańcuchami bocznymi• Hydrofilowe i hydrofobowe aminokwasy znajdują się na
przeciwległych powierzchniach cylindra
β-arkusz
• Struktura harmonijkowa (arkusza)• Składa się z 2-6 nici (3-10 aminokwasów
każda) stabilizowanych wiązaniami wodorowymi– Równolegle ułożenie nici– Antyrównoległe (bardziej powszechne)
• Zawiera aminokwasy z rozgałęzionym węglem β– np., izoleucyna, treonina, alanina, glicyna
• Włókna jedwabiu (poli Ala-Gly) (teoretycznie)• Wysoka zawartość β-arkuszy• 400,000 Da
• Trzeciorzędowa– Kształt przestrzenny
• Czwartorzędowa– W białkach
zamierających kilkałańcuchów
– np.: hemoglobina(tetramer)
Struktura białek
Międzymolekularne oddziaływania stabilizujace
• Wiązania wodorowe (3 kcal/mol)• Oddziaływania elektrostatyczne - między łańcuchami
bocznymi obdarzonymi ładunkiem– Mostki solne
• Wiązania disiarczkowe 2 S-H = S-S + 2H+
• Oddziaływania hydrofobowe (3-5 kcal/mol; udział entropii)
Białka - przykłady
Protein MW Number ofResidues
Number ofSubunits
Insulin(bovine)
5,733 51 2
Myoglobin(horse)
16,890 153 1
Fatty acidsynthetase
(yeast)
2,300,000 20,000 21
Tobaccomosaic virus
40,000,000 336,500 2,130
Białka – różnorodne funkcje
Białka globularne (rozp.) Funkcja, przykład
Enzymy Biochemiczne katalizatory
Antyciała System immunologiczny
Hormony białkowe Stymulatory, przekaźniki
Białka transportującei magazynujące
Hemoglobina, ferrytyna
Białka włókniste (nierozp.) Strukturalna konstrukcja(kolagen, keratyna)
• Left-hand single helix, 3residues/turn
• 1/3 Gly, 1/5 Pro or Hyp• Triplet Gly-X-Pro (or Gly-X-
Hyp) repeats• Supertwisted coiled coil is
right-handed, made of 3left-handed α-chains
Włóknisty Kolagen -nierozpuszczalny
18
Globularna strukturarozpuszczalnego białka
Rozpuszczalność białek
• Zmienna– Zależy od równowagi
hydrofilowo/hydrofobowej powierzchni białka(łańcuchy boczne aminokwasów)
• Zależy of pH środowiska– Niższa rozpuszczalność w okolicach pI
• Białka zwierzęce: pI w zakresie 5.5-6.0• Białka roślinne/bakterii: pI w zakresie 4.5-5.0
pI
• pH, w którym białko ma sumarycznyładunek równy zeru
• Białka są słabo rozpuszczalne w pHzbliżonym do pI
• Dodatek surfaktanta poprawia rozpuszczalność– Powstają micele
• Np., sodium dodecyl sulfate (SDS) lub Triton-X(niejonowy)
– Etanol / aceton mogą rozpuścić lub wytrącić białko– Wady: trzeba oczyszczać; możliwa denaturacja
Rozpuszczalność białek
Absorpcja UV przez białka• 3 aromatyczne aminokwasy (π-π* chromofory)
– tyrozyna– tryptofan– fenyloalanina
COOHH2N
COOHH2N
HO
NH
COOHH2N
Phenylalanine Tyrosine Tryptophan
ε(280) =5.6E3ε(274) =1.4E3ε(257) =0.2E3
Amino Acid λλλλmax, nm εεεε x 10-3 at λλλλmax,M-1 cm-1
Tryptophan 280 5.6
Tyrosine 274 1.4
Tyrosinate 295 2.6
Phenylalanine 257 0.2
NB: pKa tyrosine 9.5
Absorpcja promieniowania UVprzez białka
Kofaktory
Absorpcja UV przez białka
• Dinukleotyd nikotynoamidoadeninowy (NADH)
• Dinukleotyd flawinoadeninowy (FADH)
• Hem – ugrupowanie prostetyczne (niebiałkowaczęść) wielu enzymów
Kofaktory - Absorpcja UV Vis• Dinukleotyd nikotynoamidoadeninowy (NADH)
NADH (ε260=14 x 103 M-1 cm-1 ; ε340=6.2 x 103 M-1 cm-1)NAD+ (ε260=18 x 103 M-1 cm-1)
• UV Vis– Hem (ε400=105 M-1 cm-1)
Układydelokalizowanychelektronów π
Kofaktory
Cyt c
• Funkcja:Białko redoks bierzeudział w oddychaniukomórki i apoptozie
• Struktura:białko z grupą hemu– MW 12,384 (horse)
Widmo UV-vis 10 µMCytochromu c
• Dwa pasma:– Pasmo Soreta– Pasmo Q
– Intensywność ipołożenie pasm zależneod procesów redoks
Wavelength (nm)300 350 400 450 500 550 600
Abs
orba
nce
(AU
)0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8 408
360
528
Wavelength (nm)300 350 400 450 500 550 600
Abso
rban
ce (A
U)
0
0.2
0.4
0.6
0.8
1 414
316
550
520
Metody Spektroskopowe analizybiałek
Method Information ProvidedIR secondary structure
Raman secondary structure, foldingCD secondary structure
NMR tertiary structure, foldingUV concentration, specific activity
Fluorescence concentration
Dichroizm Kołowy Circular Dichroism (CD)
• Informacje o strukturze drugorzędowej• Bazuje na różnicy w absorbancji światła polaryzowanego kołowo prawoskrętnie
i lewoskrętniet przez chromofory
Fluorescencja
• Naturalne fluorofory– Aromatyczne
aminokwasy– Kofaktory
• FADH• NADH
Me
Me
N
OH
OHN
OH
N
O
O
NH
O
PO
OHOP
O
O
HO
O
OH
N
HO
N
N
NH2
N
SSR
RS
RR
FADH
HO
N O
OH
N
N
OP
NH2
N
O
O OH
P
O
O
O
O
HO
N
OH
NH2
O-
+
RR
SR
RS
RR
NADH
Dinukleotyd flawinoadeninowy
Dinukleotyd nikotynoamidoadeninowy
Naturalne Fluorofory
Amino Acid λλλλem, nm φφφφF
Trp 348 0.20
Tyr 303 0.10
Phe 282 0.04
Note: ϕ is the quantum yield; think of this as analogous to ε in UV-vis spectroscopy
Sondy Fluorescencyjne
Probe Reagent
Point of Attachment
λλλλem, nm φφφφF
Dansyl chloride
Lys, Cys 510 0.10
0.30Fluorescein isothiocyanate
(FITC)
Lys 516
N(CH3)2
S
O
O Cl
O
COOH
OH
NCS
ONote: extensively delocalized π-systems
Białka - bogactwo
• E. coli - 1000 różnych protein
• Całkowita liczba białek > 1010
PROTEin complement of the genOME
białkowe dopełnienie genomu
Całość białek obecnych w komórce (organizmie)podczas kompletnego cyklu życiowego
Proteom
DNA RNA mRNA BiałkoTranskrypcja Dojrzewanie
SplicingRedagowanieAlternatywnapoliadenylacja
Translacja
>200 potranslacyjnych modyfikacji
• aktywność katalityczna
• oddziaływanie• stabilność• czas życia• lokalizacja
Genomika Transkryptomika Proteomika Metabolomika
Zależność pomiędzy genomem a proteomem
Organizm Wielkość genomu Szacowana (zasady) ilość genów
Człowiek (Homo sapiens) 3 mld 30 000Mysz (M. musculus) 2,6 mld 30 000Rzodkiewnik (A. thaliana) 100 mln 25 000Nicień (C. elegans) 97 mln 19 000Muszka owocowa (D. melanogaster) 137 mln 13 000Drożdże (S. cerevisiae) 12,1 mln 6 000Bakteria (E. coli) 4,6 mln 3 200Wirus (HIV) 9700 9
Wielkość genomu oraz proteomu
• około 1x1014 komórek
• 250 typów komórek
• szacowana ilość białek 25 000 - 30 000
• 8 000 - 10 000 różnych białek w komórce
• od kilku do kilku milionów kopii danego białka w komórce (większość białek w komórce to białka konstytutywne występujące w ponad 10 000 kopii)
• Kilkadziesiąt - kilkaset białek specyficznych dla danego typu komórki lub tkanki
• brak liniowej zależności pomiędzy ilością mRNA a proteomem
Organizacja proteomu człowieka
• Proteomika obejmuje systematyczną analizę białek występujących w komórce, tkance lub całym organizmie.
• Głównym celem proteomiki jest jakościowy oraz ilościowy opis białek występujących w komórkach lub tkankach.
Proteomika
• Poznanie funkcjonowania proteomu
• Badanie modyfikacji potranslacyjnch
• Poznanie szlaków przekazywania sygnałów
• Zrozumienie molekularnych przyczyn chorób
• Projektowanie nowych leków
• Terapie „personalne”
Zastosowania proteomiki
�Rozdzielanie białek (elektroforeza, chromatografia)�Identyfikacja białek (spektrometria masowa)
�Ilościowe pomiary białek (spektrometria masowa,
chromatografia)
�Analiza sekwencji białka (bioinformatyka)
�Proteomika strukturalna (krystalografia i spektroskopia
NMR)
�Proteomika interakcyjna
�Badanie modyfikacji białek (modyfikacje posttranslacyjne)
Proteomika - narzędzia
42
Oddziaływania białko-białko
Lokalizacja białka w komórce
Modyikacje posttranslacyjne
Oddziaływania białko-DNA/RNA
Proteomika komórkowa
43
Proteomika kliniczna
Oznaczanie biomarkerów w surowicy, osoczu, ślinie i innych płynach ustrojowych lub tkankach:
- ułatwia wczesne wykrycie choroby
- umożliwia przewidywanie reakcji pacjenta na terapię (terapia personalna)
Anderson, N. L. (2003) Mol. Cell. Proteomics 2: 50
Referencyjne zawartości 70 protein (bioanalitów) w osoczu krwi
PSA
Przygotowanie próbki białka do sekwencjonowania
Sekwencjonowanie poszczególnych frakcji HPLC
1. Metody chemiczne
2. Spektrometria mas
Strategies for protein sequence analysisProtein / Protein complex
2D GESDS-PAGE/IEF
In-gel digestion
HPLC peptide mapping
Edman degradation
MALDI TOF MS
LC-MS/MS
Proteolytic digestion
47
Analiza ekstraktu białkowego z ludzkiej wątrobymetodą dwukierunkowej elektroorezy żelowej
Punkt izoelektryczny
Mas
a
Ekstrakcja
Proteoliza
Separacja
Identyfikacja
K-X and R-X except when X = PTrypsin
X-MCyanogen Bromide
X-L, X-F, X-Y and X-WChymotrypsin
E-X except when X = PEndoprotease Glu-C
X-DEndoprotease Asp-N
R-X except when X = PEndoprotease Arg-C
K-X except when X = PEndoprotease Lys-C
Enzymes for Proteome Research
K – lizyna R – arginina P – prolina D – kwas asparaginowyL – leucyna Y – tyrozyna W – tryptoan E – kwas glutaminowyF – fenyloalanina M - metionina
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52Time, min
0.0
5.0e7
1.0e8
1.5e8
2.0e8
2.5e8
3.0e8
3.5e8
4.0e8
4.5e8
5.0e8
5.5e8
6.0e8
6.5e8
7.0e8
7.5e8In
ten s
ity (c
ps)
β-Kazeina produkty trawieniaChromatogram produktów trawienia białka
SEKWENCJONOWANIE
Sekwencjonowanie peptydu metodą Edmana
Degradacja Edmana (chemiczna) Mass spectrometry
Różnice w metodach sekwencjonowania
Edman degradation chemically removes amino acids from the amino terminus of a peptide one at a time and determines the sequence from the N-terminus of the peptide.
mass spectrometric methods match the masses of fragmented peptides with the calculated masses from fragments of proteins in the DNA-Protein sequence database.
A B C D E F G H - - - -
Analyze PTH-amino acid derivatives
A B C D E F
G H I K L M N P Q R
mass
massmass
Search the match in the databases(peptide mass fingerprinting)
> ~ 2 pmol of protein 5~50 fmol of protein (LC-MS/MS)56
Spektrometria mas
Technika analityczna polegająca na destrukcyjnej jonizacji badanej substancji a następnie, analizie utworzonych produktów ze względu na ich masę i ładunek.
M: � M.+ + e
PODSTAWYCztery etapy związane z eksperymentem spektrometrii mas:
1. generowanie cząsteczek w fazie gazowej z próbki (ciecz, roztwór, c. stałe, itd.)
2. jonizacja tych cząsteczek
3. rozdzielanie jonów na podstawie ich masy
4. detekcja strumienia jonów
Z uwagi na rozwiązania etapu 1 spotyka się różne techniki MS: (LC-MS, GC-MS, SIMS, MALDI-TOF, itd.)
Rozróżnia się różne typy aparatury MS z uwagi na rozwiązania etapu 2 i etapu 3.
Etap 4 jest z reguły wspólny dla większości spektrometrów mas – nie ma zasadniczych różnic.
Otrzymywanie jonów - metody desorpcyjno -jonizacyjne
Nowe techniki – analiza trudnolotnych substancji: polimery, biocząsteczki (proteiny, kwasy nukleinowe)
• Elektrorozpylanie Electrospray Ionization (ESI)
• Desorpcja laserem w obecności matrycy Matrix Assisted Laser Desorption Ionization (MALDI)
Eksperyment identyfikacji białka metodą MS Fingerprint
Separated Proteins
Enzymatic Digestion and Extraction
Peptide Mass FingerprintMALDI-TOF
Database Search
ProteinIdentification
Peptide Mass Fingerprint - procedura
• Izolacja białka• Enzymatyczne trawienie w określonych pozycjach
aminokwasów• MALDI-TOF analiza powstałych polipeptydów• Lista mas polipeptydów – na podstawie widma
MALDI-TOF• Przeszukiwanie bazy danych w celu odnalezienia
białka z identyczną fragmentacją “peptide mass fingerprint”
Peptide Mass Fingerprint
Cut out2D-Gel
Spot
Peptide Mass Fingerprint
Trypsin or/and chymotrypsin
Digest
Peptide Mass Fingerprint
MALDI TOFMS
Peptide Mass Fingerprint (myoglobin)
GLS
DG
EWQ
QVL
NVW
GK
VEA
DIA
GH
GQ
EVLI
R
LFTG
HPE
TLEK
HG
TVVL
TALG
GIL
K
KG
HH
EAEL
KPL
AQ
SHA
TK
GH
HEA
ELK
PLA
QSH
ATK
YLEF
ISD
AIIH
VLH
SK
HPG
DFG
AD
AQ
GA
MTK
ALE
LFR
Peptide Masses
1811.90 GLSDGEWQQVLNVWGK 1606.85 VEADIAGHGQEVLIR1271.66 LFTGHPETLEK1378.83 HGTVVLTALGGILK1982.05 KGHHEAELKPLAQSHATK1853.95 GHHEAELKPLAQSHATK1884.01 YLEFISDAIIHVLHSK1502.66 HPGDFGADAQGAMTK748.43 ALELFR
Protein Sequence
• Myoglobin GLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG
Micro-Sequencing by Tandem Mass Spectrometry (MS/MS)
• Analizowany jon jest wybierany w pierwszym segmencie MS
• Jonizacja CID (Collision Induced Dissociation) jest stosowana do fragmentacji wybranego jonu w pułapce jonowej (zwykle kolizja z atomami Argonu (FAB))
• Drugi segment MS rejestruje jony po fragmentacji• Fragmentatacja polipeptydów zachodzi wzdłuż łańcucha na wiązaniu peptydowego: odcinane są kolejne skrajne aminokwasy, zarówno z końca N jak i C (kierunki N->C i C->N).
Triple Quadrupole Mass Analyzer
Sample Inlet
Q2(Collision cell)
Q3
Ion Guide
Q1EM
Detector
Potrójny kwadrupol (Triple Quad)
Q-TOF Mass Analyzer
TOF
Sample Inlet
Q2(Collision cell)
Hexapole
Ion Guide
Q1
MCPDetector
Reflectron
Pusher
•Wybór jonu w Q1 (Product Scan)•Fragmentacja Q2•Analiza widma TOF
Peptide Fragmentation
• Peptides tend to fragment along the backbone.
• Fragments can also loose neutral chemical groups like NH3 and H2O.
H...-HN-CH-CO . . . NH-CH-CO-NH-CH-CO-…OH
Ri-1 Ri Ri+1
H+
Prefix Fragment Suffix Fragment
Collision Induced Dissociation
S#: 1708 RT: 54.47 AV: 1 NL: 5.27E6T: + c d Full ms2 638.00 [ 165.00 - 1925.00]
200 400 600 800 1000 1200 1400 1600 1800 2000m/z
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Rel
ativ
e A
bund
ance
850.3
687.3
588.1
851.4425.0
949.4
326.0524.9
589.2
1048.6397.1226.91049.6
489.1
629.0
N- and C-terminal Peptides
415
486
301
154
57
71
185
332
429
Reconstruct peptide from the set of masses of fragment ions
(mass-spectrum)
N- and C-terminal Peptides
N-term
inal p
eptid
esC-te
rmina
l pep
tides
415
486
301
154
57
71
185
332
429
Terminal peptides and ion typesPeptide
Mass (D) 57 + 97 + 147 + 114 = 415
Peptide
Mass (D) 57 + 97 + 147 + 114 – 18 = 397
without
N- and C-terminal Peptides
N-term
inal p
eptid
esC-te
rmina
l pep
tides
415
486
301
154
57
71
185
332
429
Tandem Mass Spectrometry in an Ion Trap
1) Widmo wyjściowe 2) Izolacja jonu: np. m/z 426.7 ± 1.5
300 900 1500 2000m/z
50
100
Rel
ativ
e Ab
unda
nce
426.7
852.3
1138.7700.2
426.7
3) Kolizja i fragmentacja
Fragmentation of426.7
4) Pomiar m/z fragmentów
SLNVALSLNVASLNVSLNSLS
RLR
ALRVALR
NVALRLNVALR
[For Peptide SLNVALR]
77
a-ionc-ionb-ion
-NH-CH-CO-NH-CH-CO-NH-
R1 R2
x-iony-ion
z-ion
Sequence Nomenclature for Mass Ladder
H2NHC C
O
R1
HN
HC
R2
C
OHN
HC
R3
C
OHN CH
R4
C
O
OH
a1 a3a2 b3b2b1 c2c2c1
x1 x3x2 y3y2y1 z2z2z1
1598
14241295
1166
1052
965852
723
586529
401Q G H E L S N E E R
+H
Protease digestion
Protein Sample Peptides
GDVEKGKKIFVQKCAQCHTVEKGGKHKTGPNLHGLFGRKTGQAPGFTYTDANKNKGITWKEETLMEYLENPKKYIPGTKMIFAGIKKKTEREDLIAYLKKATNE
m/z
First Stage Mass Spectrum
300 2200
TGPNLHGFGR
Selected Precursor mass and fragments
TGPNLHGLFGR
R
GR FGRGFGR etc
Protein Sequence
Peptides of precursors molecular weight fragmented
Peptides eluted from LC
Second Stage (fragmentation) Mass Spectrum
m/z75 2000
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52Time, min
0.0
5.0e7
1.0e8
1.5e8
2.0e8
2.5e8
3.0e8
3.5e8
4.0e8
4.5e8
5.0e8
5.5e8
6.0e8
6.5e8
7.0e8
7.5e8In
ten s
ity (c
ps)
β-Kazeina produkty trawienia
Courtesy of the MSCLS at the Univ. of Minn.
400 500 600 700 800 900 1000 1100 1200m/z, amu
100
300
500
700
900
1100
1300
1500
1700
1900
21001029.2
Inte
nsit y
, cp s
Widmo MS piku – tR = 30 min
100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500m/z, amu
2.0e5
6.0e5
1.0e6
1.4e6
1.8e6
2.2e6
2.6e6
3.0e6
3.4e6 F Q pS E E Q Q Q T E D E
a1-NH3b1-NH3
I
b2
a2-NH3
b2-NH3
b3b3-NH3
b4b4-NH3 a5
b5
y12y12-NH3b6
y11y11-NH3
b7
y10y10-NH3
b8
y9
b8-NH3
y9-NH3
y8
b9-NH3y8-NH3
y7
y7-NH3
y6
y6-NH3
y5
y5-NH3
y4
y4-NH3
y3
y3-NH3
y2
y2-NH3
y1
y1-NH3
a1
Inte
nsity
, cps
MSMS jonu 1031.3 –sekwencjonowanie
Courtesy of the MSCLS at the Univ. of Minn.
Sekwencjonowanie białek techniką MS/MS –
dwie metody znajdowania sekwencji
# Metoda przeszukiwania baz y danych fragmentów peptydowych
# Metoda De Novo
De Novo vs. Database Search S # : 1 7 0 8 R T : 5 4 .4 7 AV: 1 N L : 5 .2 7 E 6T : + c d F u l l m s 2 6 3 8 .0 0 [ 1 6 5 .0 0 - 1 9 2 5 .0 0 ]
2 0 0 4 0 0 6 0 0 8 0 0 1 0 0 0 1 2 0 0 1 4 0 0 1 6 0 0 1 8 0 0 2 0 0 0m /z
0
5
1 0
1 5
2 0
2 5
3 0
3 5
4 0
4 5
5 0
5 5
6 0
6 5
7 0
7 5
8 0
8 5
9 0
9 5
1 0 0
Rel
ativ
e Ab
unda
nce
8 5 0 .3
6 8 7 .3
5 8 8 .1
8 5 1 .44 2 5 .0
9 4 9 .4
3 2 6 .05 2 4 .9
5 8 9 .2
1 0 4 8 .63 9 7 .12 2 6 .91 0 4 9 .64 8 9 .1
6 2 9 .0
WR
A
C
VG
EK
DWL
P
T
L T
WR
A
C
VG
EK
DWL
P
T
L T
De Novo
AVGELTK
Database Search
Database of all peptides = 20n
AAAAAAAA,AAAAAAAC,AAAAAAAD,AAAAAAAE,AAAAAAAG,AAAAAAAF,AAAAAAAH,AAAAAAI,
AVGELTI, AVGELTK , AVGELTL, AVGELTM,
YYYYYYYS,YYYYYYYT,YYYYYYYV,YYYYYYYY
Database ofknown peptides
MDERHILNM, KLQWVCSDL, PTYWASDL, ENQIKRSACVM, TLACHGGEM, NGALPQWRT, HLLERTKMNVV, GGPASSDA, GGLITGMQSD, MQPLMNWE,
ALKIIMNVRT, AVGELTK,HEWAILF, GHNLWAMNAC,
GVFGSVLRA, EKLNKAATYIN..
Database ofknown peptides
MDERHILNM, KLQWVCSDL, PTYWASDL, ENQIKRSACVM, TLACHGGEM, NGALPQWRT, HLLERTKMNVV, GGPASSDA, GGLITGMQSD, MQPLMNWE, ALKIIMNVRT, AVGELTK,HEWAILF, GHNLWAMNAC,
GVFGSVLRA, EKLNKAATYIN..
Mass, Score
De novo Peptide Sequencing S#: 1708 RT: 54.47 AV: 1 NL: 5.27E6T: + c d Full ms2 638.00 [ 165.00 - 1925.00]
200 400 600 800 1000 1200 1400 1600 1800 2000m/z
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Rel
ativ
e A
bund
ance
850.3
687.3
588.1
851.4425.0
949.4
326.0524.9
589.2
1048.6397.1226.91049.6
489.1
629.0
SequenceSequence