Post on 12-Jan-2016
description
Drugdiscovery@home – projekt ochotniczego przetwarzania rozproszonego w zakresie raka,
starzenia się i komórek macierzystych.
Andrey Voronkov* and John Shultz
*av@drugdiscoveryathome.com
Czym jest VCSC I przetwarzanie rozproszone?
Jednostki obliczeniowe przesyłane są do lokalnych lub globalnie rozproszonych komputerów, a wyniki obliczeń są odsyłane do serwera.
Internetowe – ochotnicze Przetwarzanie
ProjectsOchotnicy
Pomaga nauce
Angażuje zwykłych ludzi w naukęhttp://boinc.berkeley.edu/trac/wiki/BoincPapers
Lokalna sieć – VCSC
Serwer BOINC
DRUGDISCOVERY@HOME PROJECT WORKFLOW
Metody projektu:• Przetwarzanie rozproszone, Przetwarzanie GPU• Virtualne obrazowanie z użyciem giętkich aminokwasów• Schemat odprężonych kompleksów dla dokowania• Dynamika molekularna z konkretnymi modelami rozpuszczalników
dla oceny stabilności kompleksów białko-ligand• Mapowanie interaktywne dróg z dynamicznym modelowaniem
zmianZakres badań:
• Biocele zaangażowane w drogach sygnałowych nisz komórek macierzystych
• Które są powiązane lecz nie ograniczone z rakiem i chorobami neurodegradacyjnymi. Biocele pasujące do regulacji raka/starzenia się zgodnie z hipotezą na rys. A
• Przykłady biocelów: Białka związane z ścieżkami sygnałowymi Wnt, Shh i Notch.
• Inne cele biologiczne, związane z rakiem, chorobami degeneratywnymi I biologią komórek macierzystych moga zostać rozpatrzone we współpracy z grupami biologów experymentalnych.
Robocza hipoteza raka/degeneracji oraz symetrycznego/niesymetrycznego podziału komórek macierzystych
Dokonania:– Wstępna integracja strony internetowej projektu z Drupal– Molekularne dokowanie CPU wysokiej przepustowości
• Dystrybuuje Python• Dystrybuuje niektóre pakiety narzędzi MGL• Zarządzane przez BOINC Wrapper
– Integracja GROMACS z wrapperem BOINC dla CPU• Symuluje 100 ps w 2.5 godziny• Zakres plików trajektorii od 10-40MB • Rezultaty kompresowane w formacie 7zip
– Integracja Autodock 4.0 z Wrapperem BOINC dla CPU– Dokowanie białko-ligand ->MD workflow setup (acpypi)– Integracja głównych platform
• Windows• Mac PPC i Intel• Linux
Drużyna:• Andrey Voronkov, doktor, uniwersytet moskiewski,
wydział chemii – szef projektu, modelowanie molekularne, projektowanie leków, setup serwera BOINC
• John Shultz, Narodowa akademia nauk, Washington D.C., IT, kodowanie, setup serwera BOINC
• Jorden van der Elst, główny tester oprogramowania• Współpracujemy także z wieloma ludźmi z
przemysłu, którzy opracowywują cześć systemów biologicznych, i którzy nie chcą na razie ujawniać swoich danych osobowych.
WSPÓŁPRACA
Opcja 1: Współpraca z biologami eksperymentalnymi
Opcja 2: Virtual Campus Super Computing dla uniwersytetów i organizacji
Zalety w stusunku do przetwarzania klastrowego:• Nowy zbiór mocy obliczeniowej w bardzo niskiej cenie• Podwyższona stabilnośc w porównaniu do klastrów I
superkomputerów• Aplikacja nie musi być dostosowywana do potrzeb środowiska
klastrowego• Pozytywny PR dla uniwersytetów
Zalety w stosunku do przetwarzania ochotniczego:• Czyste VCSC, brak ochotników na zewnątrz sieci
o Brak systemu kredytowego, brak oszustw, Tylko jeden rezultat per próbka (Lepsza wydajność per CPU), lepsze bezpieczeństwo, bardziej elastyczne jeśli chodzi o licencje oprogramowania
• Projekt ochotniczyo Trzeba zapobiegać cheatowaniu, walidować rezultaty, więcej
ograniczeń przy redystrybucji licencjonowanego oprogramowania
Przykłady aplikacji do projektowania leków
1 średni CPU Dynamika cząsteczkowa 100 aminokwasów kompleksów białek z małocząsteczkowym ligandem z konkretną wodą I solami podczas 2 dni
100 picosekund
VCSC
z 200 CPU
100 trajektorii na 100 ps dla jednego kompleksu lub 100 odmiennych kompleksów białko-ligand na jedną 100ps trajektorję
VCSC zwiększa zasoby przetwarzania o kilka rzędów i umożliwia zastosowanie istniejącego oprogramowania w stosunku do większej liczby obiektów.
Przykład 1. Wirtualne ekranowanie - dokowanie organicznych elementów do biocelów.
Przykład 2. molekularna dynamika kompleksów białko-ligand z wyszczególnionym modelem cząsteczek wody
1 średni CPU ~1 000 000 elementów ekranowanych przez model dokowania sztywnego białka z użyciem Autodock 4.0
100 dni
VCSC
z 200 CPU
~ 1 000 000 elementów Autodock 4.0. dokowanie do sztywnego modelu białka lub ~ 50 000 elementów dokujących do modelu elastycznego białka
1 dzień
Użycie GPU może zwiększyć zasoby obliczeniowe od 10 do 50 w stosunku do CPU
I. Stawianie serwera centrum Campus virtual supercomputing• I.1 Ocena potencjalnych zasobów obliczeniowych i wymagań dla serwera• I.2 Stawianie serwera BOINC
II. Komunikacja z właścicielami komputerów i administratorami systemu
III. Komunikacja z naukowcami obliczeniowymi• Rozpoznanie naukowców z wymagającymi-obliczeniowo aplikacjami które dobrze pasują do przetwarzania ochotniczego.• Portowanie aplikacji do BOINC• Kompilacja aplikacji dla CPU Windows/Linux• Kompilacja aplikacji dla GPU Nvidia/ATI AMD• Ustawianie opcji BOINC (system priorytetów, limity zadań) IV. Utrzymanie VCSC
Całkowity czas na VCSC: 2-3 osobo-miesięcy
Tworzenie centrum Virtual Campus Supercomputing
PLANY (2 lata):1) Programowanie GPU dla aplikacji I klienta BOINC – znaczący
wzrost mocy obliczeniowej dla ekranowania wirtualnego I dynamiki molekularnej z wyszczególnionymi modelami rozpuszczaliników.
2) Implikacje wielu metod elastyczności białka takich jak schemar odprężonego kompleksu I dynamika białek Monte Carlo.
3) Dynamiczne modelowanie sieci ścieżek sygnałowych które musi dac wynik w postaci interaktywnego mapowania I przewidywania najbardziej obiecujących biocelów dla zadanych chorób.
4) Projektowanie leków I testowanie elementów biologicznych dla obiecujących biocelów ze ścieżki sygnałowej Wnt (pierwszy rok) ~8-10 biocelów, i Shh, Notch oraz innych białek regulujących nisze komórek macierzystych w drugim roku (10-15 biocelów).
Wymaganie finansowanie 150 000$/rok:-Pensja na pełny etat dla 4 osób, hosting, cześć licencji na
oprogramowanie
Alternatywne źródła finansowania rozpatrywane teraz: - Granty dla małych jednostek – wymaga wykonania projektu jako
niekomercyjny (we współpracy z uniwersytetami)- Sprzedaż I usługi (Ochotnicze dzielenie zysków, wstępny ogólny
business plan dostępny na życzenie), Wymagane biuro, najlepiej w Maryland w USA
Dziękujemy za uwagę!