Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski
description
Transcript of Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski
Piotr A. ZiółkowskiGrzegorz Koczyk
Jan Sadowski
Mechanizmy Ekspansji i Redukcji Genomów RoślinnychUjawnione w Analizie Mutacji „Indel”
Instytut Genetyki RoślinInstytut Genetyki RoślinPolskiej Akademii NaukPolskiej Akademii Nauk
Wykorzystanie zasobów obliczeniowych Krajowej Sieci Naukowej
do analizy zdarzeń insercji-delecji u Arabidopsis thaliana
Genom Arabidopsis thaliana
30.5 Mb 19.7 Mb 23.5 Mb 18.6 Mb 27.0 Mb
1 2 3 4 5
Zestawy klonów BAC dla linii Columbia (115 Mb)
Kontigi klonów plazmidowychdla linii Landsberg erecta
(95 Mb)
Przypisaniekontigów Ler do chromosomów Col
30.5 Mb 19.7 Mb 23.5 Mb 18.6 Mb 27.0 Mb
1 2 3 4 5
Poszukiwanieindeli pomiędzy sekwencjami obu linii
30.5 Mb 19.7 Mb 23.5 Mb 18.6 Mb 27.0 Mb
1 2 3 4 5
Poszukiwanieindeli pomiędzy sekwencjami obu linii
Identyfikacjamechanizmu odpowiedzialnego za powstanie mutacji
rekombinacja niewyrównana
wstawienie/wycięcie transpozonu
BLASTZ
Użyty do porównywania genomów mysiego i ludzkiego
Łączy rezultaty BLASTA tworząc większe grupy dopasowanych sekwencji
Genome Res. 2003 Jan;13(1):103-7.
Human-mouse alignments with BLASTZ
Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller
W.
Niewystarczająco dokładny
Wyszukiwanie insercji-delecji
Problem:Odwzorowanie wzajemnie jednoznaczne contigów ekotypu Ler na pseudochromosomy ekotypu Col-0
Uproszczenie:Każdemu contigowi odpowiada dokładnie jedno miejsce na chromosomie
Uproszczenie jest możliwe ze względu na bliskie pokrewieństwo genomów
Rekonstrukcja odwzorowania - przykład
Podział dopasowanych obszarów kontiga według jakości i unikalności ich dopasowania
Obszar unikalnie dopasowany; o dobrej jakości
Obszary wątpliwe;
dopasowane wiele razy; o
kiepskiej jakości
Rekonstrukcja odwzorowania dla każdego kontiga:
Mechanizm rekonstrukcji
BLASTZ (wyszukanie wszystkich pokrewnych obszarów pomiędzy genomami)
RepeatMasker (analiza obszarów powtarzalnych i transpozonów)
Poszukiwanie zaufanych obszarów (>60nt, identyczność >90%, tylko jeden alignment)
Uzupełnianie luk w powstałym pokryciu za pomocą pozostałych alignmentów),
faworyzowane jak najmniejsze indele
Poprawki - odrzucane rekonstrukcje o niewystarczającej jakości (m.in. kontigi złożone z sekwencji powtarzalnych, kontigi o indelach
przekraczających 100’000 nt)
Zrealizowane przy użyciu własnego oprogramowania dedykowanego
Wyszukiwanie indeli
Zrekonstruowane odwzorowanie kontiga
Czy indel to TE (transposable element) ? (kryterium: wyniki z RepeatMaskera)
Czy indel powstał w wyniku crossing/over ?(kryterium: obecność zdegenerowanych kopii
wewnątrz indela)
Czy indel powstał w illegitimate recombination ?
(kryterium: obecność zdegenerowanych powtórzeń na krańcach indela)
Czy indel zachodzi w obrębie exonu/intronu ?
(kryterium: dane Arabidopsis Genome Initiative)
Insercje w liniachColumbia i Landsberg erecta
Różne mechanizmymutacji „indel”
Wielkość „indeli”
przypisano 55 280 (68%) kontigów Ler do chromosomów Col
wykryto 3025 „indeli nieterminalnych” (i 3743 „indeli terminalnych”)
stwierdzono 2355 insercji w linii Col
stwierdzono 670 insercji w linii Ler
650 (21%) „indeli” powstało na drodze wstawienia/wycięcia TE (liczba może być niedoszacownana ze względu na brak przypisanych kontigów w obszarach przycentromerowych)
885 (29%) „indeli” powstało w wyniku rekombinacji niewyrównanej (wynik prawdopodobnie nadszacowany)
1606 (50%) „indeli” powstało w wyniku innych mechanizmów włączając w to rekombinację nieuprawnioną
Podsumowanie analizy
Rozkład „indeli” wzdłuż chromosomów nie jest jednolity;
Podstawowe mechanizmy powstawania „indeli” w genomie Arabidopsis obejmują działalność transpozonów, niewyrównaną rekombinację i rekombinację nieuprawnioną;
Wstawienie/wycięcie transpozonów zachodzi głównie w obszarach przycentromerowych, natomiast inne typy „indeli” wykazują bardziej złożony rozkład wzdłuż chromosomów;
„Indele” >1 kb powstają w wyniku działalności TE oraz rekombinacji niewyrównanej, natomiast „indele” <1 kb są spowodowane innymi mechanizmami, w tym rekombinacją nieuprawnioną;
Chromosom 1 ma wyraźnie odmienny wzór rozkładu „indeli” co sugeruje jego stosunkowo niedawne uformowanie;
Mutacje somatyczne mają prawdopodobnie znaczne większe znaczenie w ewolucji genomów roślinnych, niż wcześniej zakładano!
Wnioski