Wykaz zagadnieńflash.wwsi.edu.pl/wwsivideo/iplus/pdf/dchaladyniak... · Failover cluster – High...

Post on 18-Jul-2020

5 views 0 download

Transcript of Wykaz zagadnieńflash.wwsi.edu.pl/wwsivideo/iplus/pdf/dchaladyniak... · Failover cluster – High...

Wykaz zagadnień

• Wprowadzenie

• Klasyfikacje przetwarzania równoległego

• Klastry komputerowe

• Superkomputery

informatyka +

Wykaz zagadnień

• Wprowadzenie

• Klasyfikacje przetwarzania równoległego

• Klastry komputerowe

• Superkomputery

informatyka +

Wprowadzenie • Filozofia przetwarzania równoległego polega na podziale

programu na fragmenty, z których każdy wykonywany jest przez inny procesor (lub węzeł).

• Kod podzielony na „kawałki” wykonywane przez n procesorów

(węzłów), będzie się wykonywał n-razy szybciej niż analogiczny kod, realizowany na maszynie jednoprocesorowej.

• Idea obliczeń równoległych narodziła się pod koniec lat sześćdziesiątych.

• Lata osiemdziesiąte – gwałtowny rozwój technik komputerowych, umożliwił praktyczną realizację tego sposobu przetwarzania danych..

informatyka +

∂∂

∂+

∂∂

∂+

∂+

∂−

∂∂

−∂

∂∂

+∂∂

+∂∂

−=∂∂

−∂∂

yT

yv

xT

yu

fR

yu

pv

xu

pu

p

yT

fR

pu

py

vx

utp

vpf

yfRS

gggggg

ggg

ap

0

00

0

ω

( )

∇⋅

∂−∇⋅

∂−== T

ypRT

xpRQQ gg VV

Q ,, 21

∂−

∂∂

−= jiQx

ux

vyT

pR gg

Txx

Tt

Ttx

ggg ∇⋅

∂+

∂∂

∇⋅+∂∂

=

∇⋅+∂∂

∂∂ V

VV Q=

∇T

pR

DtDg

( ) 2

22

02

00

2 1p

fffp

fp g ∂

∂+

+Φ∇∇⋅

∂∂

−=∇∂∂ ωχ V

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

Zastosowania przetwarzania równoległego • Przemysł – skrócenie czasu projektowania i symulacji,

związanych z wprowadzeniem nowych produktów.

• Nauka – dostarczanie mocy obliczeniowej, pozostającej do tej pory w domenie specjalistów od science fiction.

• „Grand Challenge Problems” – pogoda i klimat, aktywność geologiczna i sejsmiczna, genom ludzki, reakcje jądrowe.

• Deep Blue – „pokaz siły” maszyny równoległej nad arcymistrzem szachowym Garry Kasparovem (1997 r.).

informatyka +

Wykaz zagadnień

• Wprowadzenie

• Klasyfikacje przetwarzania równoległego

• Klastry komputerowe

• Superkomputery

informatyka +

Podział systemów równoległych

• 1966 – klasyfikacja przetwarzania równoległego zwana „Flynn’s Taxonomy” (Michael Flynn), oparta na liczbie instrukcji i liczbie strumieni danych przesyłanych do procesora.

• SISD (Single Instruction stream Single Data stream) • SIMD (Single Instruction stream Multiple Data stream)

• MISD (Multiple Instruction stream Single Data stream) • MIMD (Multiple Instruction stream Multiple Data stream)

informatyka +

SISD (Single Instruction stream Single Data stream) • Tradycyjna (szeregowa) metoda przetwarzania danych (krok po kroku);

• Opracowana przez Johna von Neumanna;

• Pojedynczy zestaw instrukcji jest wykonywany sekwencyjnie w pojedynczym

strumieniu danych.

Krok 1

Load X

Krok 2

Load Y

Krok 3

Z = X + Y

CZAS

informatyka +

SIMD (Single Instruction stream Multiple Data stream)

• Wczesne implementacje systemów równoległych;

• Każdy z procesorów przetwarza ten sam zestaw instrukcji na własnym zestawie danych.

informatyka +

MISD (Multiple Instruction stream Single Data stream)

• Model niedostępny w systemach komercyjnych;

• Prace nad nim są prowadzone jedynie w ośrodkach naukowych.

informatyka +

MIMD (Multiple Instruction stream Multiple Data stream) • Każdy procesor pracuje z własnym zestawem instrukcji, operując na własnym

zestawie danych; • W ramach MIMD wyróżnia się trzy kategorie: - MIMD-SM (Shared Memory), - MIMD-DM (Distributed Memory), - MIMD-HDSM (Hybrid Distributed-Shared Memory).

informatyka +

MIMD-SM (Shared Memory)

• Procesory są połączone specjalizowaną siecią interconnect, poprzez którą

komunikują się ze wspólnym obszarem pamięci.

informatyka +

MIMD-DM (Distributed Memory)

• Każdy procesor posiada własny obszar pamięci;

• Sieć interconnect służy do wymiany komunikatów pomiędzy procesorami.

informatyka +

MIMD-HDSM (Hybrid Distributed-Shared Memory)

informatyka +

Klasyfikacja Jonhsona

• Ponieważ większość systemów przeznaczonych do obliczeń równoległych jest klasyfikowana jako maszyny MIMD, Johnson usystematyzował tę grupę, wprowadzając jako kryterium podziału strukturę pamięci.

SISD SIMD

MISD MIMD

GMSV GMMP

DMSV DMMP

STRUMIENIE INSTRUKCJIPOJEDYNCZE WIELOKROTNE

STRUMIENIE

DANYCH

POJEDYNCZE

WIELOKROTNE

informatyka +

Według Johnsona w ramach architektury MIMD możemy wyróżnić 4 grupy:

• GMSV (Global Memory Shared Variables)

• DMSV (Distributed Memory Shared Variables)

• DMMP (Distributed Memory Message Passing)

• GMMP (Global Memory Message Passing)

Klasyfikacja Jonhsona

informatyka +

• Systemy z pamięcią globalną i współdzielonymi zmiennymi.

• Maszyny tego typu stanowią ściśle powiązane wieloprocesory.

GMSV (Global Memory Shared Variables)

informatyka +

DMMP (Distributed Memory Message Passing)

• Systemy z pamięcią rozproszoną i przekazywaniem komunikatów między sobą.

informatyka +

DMSV (Distributed Memory Shared Variables) • Systemy z pamięcią rozproszoną i współdzielonymi zmiennymi.

informatyka +

• Systemy z pamięcią globalną i przekazywaniem wiadomości. • Brak praktycznych rozwiązań.

GMSV (Global Memory Message Passing)

informatyka +

Wykaz zagadnień

• Wprowadzenie

• Klasyfikacje przetwarzania równoległego

• Klastry komputerowe

• Superkomputery

informatyka +

Krajowy Klaster Linuksowy CLUSTERIX (National CLUSTER of LInuX Systems)

źródło: http://web.archive.org/web/20070726090439/http://clusterix.pcz.pl/witamy/

film/Clusterix14.mpg informatyka +

informatyka +

źródło: http://web.archive.org/web/20090528093426/http://clusterix.pcz.pl/

Klastry obliczeniowe • Klaster – zespół połączonych komputerów (węzłów), widoczny dla

użytkownika jako jeden system.

• Każdy węzeł pracuje pod kontrolą własnej kopii systemu operacyjnego.

• Klastry cechują się mocą obliczeniową superkomputerów, przy znacznie niższej cenie i wyższej skalowalności.

• Dwa podstawowe modele implementacji klastrów to:

– Failover cluster,

– Boewulf cluster.

informatyka +

Failover cluster – High Availability cluster

• Klaster budowany z myślą o zapewnieniu odporności na

uszkodzenia czy stabilność działania (failover, fault tolerance).

• Zastosowanie biznesowe:

– serwery dla platform e-commerce lub e-business (systemy bankowe,

billingowe, oprogramowanie dla firm ubezpieczeniowych).

• Obniżenie kosztów eksploatacji i podniesienie dostępności.

informatyka +

Beowulf cluster – Computational cluster

• Beowulf – tytuł pierwszego poematu heroicznego w języku angielskim (skandynawski bohater „wielkiej siły i odwagi” – Beowulf ratuje Duńczyków przed nieposkromionym potworem o imieniu Grendel);

• Przeznaczony do zastosowań w środowiskach naukowych i ośrodkach badawczych;

• Moc i wydajność klastra, kosztem jego odporności na awarie;

• Czas przestoju (ang. downtime) nie ma krytycznego znaczenia – nie powoduje istotnych strat finansowych. informatyka +

MOSIX (Multi-computer Operating System for UNIX)

• Oprogramowanie dostępne nieodpłatnie (również w postaci kodu

źródłowego);

• Oprogramowanie MOSIX powstało i jest rozwijane na Uniwersytecie

Hebrajskim w Jerozolimie;

• Pierwotnie projekt był rozwijany w systemie BSD UNIX;

• Idea twórców MOSIX jest taka, aby utworzyć oprogramowanie pozwalające

zbudować klaster, który zarówno z punktu widzenia użytkowników, jak

i uruchamianych programów będzie widoczny jako jedna maszyna. informatyka +

Wykaz zagadnień

• Wprowadzenie

• Klasyfikacje przetwarzania równoległego

• Klastry komputerowe

• Superkomputery

informatyka +

Intel® Xeon® Processor E7

informatyka + źródło: www.intel.com

Intel® Itanium® Processor

informatyka + źródło: www.intel.com

AMD Opteron™ 6200 series

informatyka + źródło: www.amd.com

informatyka +

AMD Opteron™ 6200 series

źródło: www.amd.com

POWER7® processors

informatyka + źródło: www.ibm.com

MIPS kontra FLOPS • MIPS (Million Instructions Per Second) - przestarzały i obecnie już

nieużywany współczynnik mierzący moc obliczeniową procesorów. Różne instrukcje

wymagają różnego zaangażowania się w nie procesora, a oprócz tego rzeczywista

szybkość komputera zależy jeszcze od innych czynników - takich jak szybkość

dysków twardych, pamięci RAM, magistrali.

• FLOPS (Floating Point Operations Per Second) - jednostka wydajności

obliczeniowej procesorów. Jeden FLOPS to jedna operacja zmiennopozycyjna

wykonana w ciągu jednej sekundy. Moc obliczeniową współczesnych procesorów

mierzy się w teraflopsach (TFLOPS) oraz w petaflopsach (PFLOPS).

informatyka +

Seymour Cray

1964 - amerykańska firma Control Data Corporation zaprezentowała skonstruowany przez Seymoura Craya komputer CDC-6600.

1976 - Cray-1 (160 milionów operacji zmiennoprzecinkowych na sekundę – kosztował prawie 9 milionów dolarów).

informatyka +

źródło: www.cray.com

K computer

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

Roadrunner

informatyka +

informatyka +

informatyka +

informatyka +

BlueGene/L

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

Earth Simulator

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

Najwydajniejsze superkomputery w Polsce

informatyka +

informatyka +

informatyka +

informatyka +

informatyka +

Superkomputer Galera • W CI TASK pojawił się nowy superkomputer – Galera (1 miejsce w regionie CEE

i 9 miejsce w Europie).

• Galera składa się z 336 serwerów 4-procesorowych Actina - łącznie daje to 1344 procesory 4-rdzeniowe Intel Xeon Quad-Core 2,33 GHz (w sumie 5376 rdzeni)

• Moc całego klastra została obliczona na 50 TFLOPS (4400 razy więcej niż moc obliczeniowa superkomputera IBM Deep Blue)

• Pojedynczy węzeł połączony jest z pozostałymi siecią InfiniBand pracującą w technologii DDR (Double Data Rate) z przepustowością 20 Gb/s.

• Do stworzenia sieci pomocniczej wykorzystano technologię Gigabit Ethernet.

• Galera dysponuje 5,3 TB RAM-u, a całkowita pamięć dyskowa to 107,5 TB. • Klaster pracuje pod kontrolą systemu operacyjnego Linux - Debian. • Całe rozwiązanie mierzy 17 m długości, waży 7 ton, łączna długość okablowania – ok. 8 km.

informatyka +

informatyka +

informatyka +

Galera PLUS

informatyka +