Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

16
Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski Mechanizmy Ekspansji i Redukcji Genomów Roślinnych Ujawnione w Analizie Mutacji „IndelInstytut Genetyki Roślin Instytut Genetyki Roślin Polskiej Akademii Nauk Polskiej Akademii Nauk Wykorzystanie zasobów obliczeniowych Krajowej Sieci Naukowej do analizy zdarzeń insercji-delecji u Arabidopsis thaliana

description

Instytut Genetyki Roślin Polskiej Akademii Nauk. Mechanizmy Ekspansji i Redukcji Genomów Roślinnych Ujawnione w Analizie Mutacji „Indel ”. Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski. - PowerPoint PPT Presentation

Transcript of Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Page 1: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Piotr A. ZiółkowskiGrzegorz Koczyk

Jan Sadowski

Mechanizmy Ekspansji i Redukcji Genomów RoślinnychUjawnione w Analizie Mutacji „Indel”

Instytut Genetyki RoślinInstytut Genetyki RoślinPolskiej Akademii NaukPolskiej Akademii Nauk

Wykorzystanie zasobów obliczeniowych Krajowej Sieci Naukowej

do analizy zdarzeń insercji-delecji u Arabidopsis thaliana

Page 2: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Genom Arabidopsis thaliana

30.5 Mb 19.7 Mb 23.5 Mb 18.6 Mb 27.0 Mb

1 2 3 4 5

Zestawy klonów BAC dla linii Columbia (115 Mb)

Kontigi klonów plazmidowychdla linii Landsberg erecta

(95 Mb)

Page 3: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Przypisaniekontigów Ler do chromosomów Col

30.5 Mb 19.7 Mb 23.5 Mb 18.6 Mb 27.0 Mb

1 2 3 4 5

Page 4: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Poszukiwanieindeli pomiędzy sekwencjami obu linii

30.5 Mb 19.7 Mb 23.5 Mb 18.6 Mb 27.0 Mb

1 2 3 4 5

Page 5: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Poszukiwanieindeli pomiędzy sekwencjami obu linii

Page 6: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Identyfikacjamechanizmu odpowiedzialnego za powstanie mutacji

rekombinacja niewyrównana

wstawienie/wycięcie transpozonu

Page 7: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

BLASTZ

Użyty do porównywania genomów mysiego i ludzkiego

Łączy rezultaty BLASTA tworząc większe grupy dopasowanych sekwencji

Genome Res. 2003 Jan;13(1):103-7.

Human-mouse alignments with BLASTZ

Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller

W.

Niewystarczająco dokładny

Page 8: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Wyszukiwanie insercji-delecji

Problem:Odwzorowanie wzajemnie jednoznaczne contigów ekotypu Ler na pseudochromosomy ekotypu Col-0

Uproszczenie:Każdemu contigowi odpowiada dokładnie jedno miejsce na chromosomie

Uproszczenie jest możliwe ze względu na bliskie pokrewieństwo genomów

Page 9: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Rekonstrukcja odwzorowania - przykład

Podział dopasowanych obszarów kontiga według jakości i unikalności ich dopasowania

Obszar unikalnie dopasowany; o dobrej jakości

Obszary wątpliwe;

dopasowane wiele razy; o

kiepskiej jakości

Page 10: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Rekonstrukcja odwzorowania dla każdego kontiga:

Mechanizm rekonstrukcji

BLASTZ (wyszukanie wszystkich pokrewnych obszarów pomiędzy genomami)

RepeatMasker (analiza obszarów powtarzalnych i transpozonów)

Poszukiwanie zaufanych obszarów (>60nt, identyczność >90%, tylko jeden alignment)

Uzupełnianie luk w powstałym pokryciu za pomocą pozostałych alignmentów),

faworyzowane jak najmniejsze indele

Poprawki - odrzucane rekonstrukcje o niewystarczającej jakości (m.in. kontigi złożone z sekwencji powtarzalnych, kontigi o indelach

przekraczających 100’000 nt)

Zrealizowane przy użyciu własnego oprogramowania dedykowanego

Page 11: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Wyszukiwanie indeli

Zrekonstruowane odwzorowanie kontiga

Czy indel to TE (transposable element) ? (kryterium: wyniki z RepeatMaskera)

Czy indel powstał w wyniku crossing/over ?(kryterium: obecność zdegenerowanych kopii

wewnątrz indela)

Czy indel powstał w illegitimate recombination ?

(kryterium: obecność zdegenerowanych powtórzeń na krańcach indela)

Czy indel zachodzi w obrębie exonu/intronu ?

(kryterium: dane Arabidopsis Genome Initiative)

Page 12: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Insercje w liniachColumbia i Landsberg erecta

Page 13: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Różne mechanizmymutacji „indel”

Page 14: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Wielkość „indeli”

Page 15: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

przypisano 55 280 (68%) kontigów Ler do chromosomów Col

wykryto 3025 „indeli nieterminalnych” (i 3743 „indeli terminalnych”)

stwierdzono 2355 insercji w linii Col

stwierdzono 670 insercji w linii Ler

650 (21%) „indeli” powstało na drodze wstawienia/wycięcia TE (liczba może być niedoszacownana ze względu na brak przypisanych kontigów w obszarach przycentromerowych)

885 (29%) „indeli” powstało w wyniku rekombinacji niewyrównanej (wynik prawdopodobnie nadszacowany)

1606 (50%) „indeli” powstało w wyniku innych mechanizmów włączając w to rekombinację nieuprawnioną

Podsumowanie analizy

Page 16: Piotr A. Ziółkowski Grzegorz Koczyk Jan Sadowski

Rozkład „indeli” wzdłuż chromosomów nie jest jednolity;

Podstawowe mechanizmy powstawania „indeli” w genomie Arabidopsis obejmują działalność transpozonów, niewyrównaną rekombinację i rekombinację nieuprawnioną;

Wstawienie/wycięcie transpozonów zachodzi głównie w obszarach przycentromerowych, natomiast inne typy „indeli” wykazują bardziej złożony rozkład wzdłuż chromosomów;

„Indele” >1 kb powstają w wyniku działalności TE oraz rekombinacji niewyrównanej, natomiast „indele” <1 kb są spowodowane innymi mechanizmami, w tym rekombinacją nieuprawnioną;

Chromosom 1 ma wyraźnie odmienny wzór rozkładu „indeli” co sugeruje jego stosunkowo niedawne uformowanie;

Mutacje somatyczne mają prawdopodobnie znaczne większe znaczenie w ewolucji genomów roślinnych, niż wcześniej zakładano!

Wnioski