Technologie taśmowe – wprowadzenie i zastosowania Jacek Herold , WCSS

Post on 11-Jan-2016

27 views 2 download

description

Technologie taśmowe – wprowadzenie i zastosowania Jacek Herold , WCSS. Zagadnienia. Czym są urządzenia taśmowe Czym różnią się od dysków twardych Podstawowe parametry urządzeń Parametry streamerów Parametry taśm Najczęściej używane technologie i kompatybilność - PowerPoint PPT Presentation

Transcript of Technologie taśmowe – wprowadzenie i zastosowania Jacek Herold , WCSS

Technologie taśmowe – wprowadzenie i zastosowania

Jacek Herold, WCSS

Zagadnienia

Czym są urządzenia taśmowe Czym różnią się od dysków twardych Podstawowe parametry urządzeń

• Parametry streamerów

• Parametry taśm Najczęściej używane technologie i kompatybilność Kiedy i dlaczego używamy technologii taśmowych Trochę głębiej w technologię

• Systemy kodowania

• Sposób zapisu Line Serpentine vs. Helical Track

• Urządzenia blokowe vs znakowe

• sposób dostępu do danych - szeregowe układanie danych. Zagadnienie kompresji - kompresja automatyczna vs. Konfigurowana Systemy automatyczne: autloadery, biblioteki RAIT

Zagadnienia c.d. Oprogramowanie do archiwizacji

tar, dump/restore IBM TSMAmanda, BaculaVeritas

Czym są urządzenia taśmowe - historia

Urządzenia taśmowe to napędy pozwalające na zapisywanie informacji na taśmach magnetycznych (nośnikach taśmowych). Służą przede wszystkim do archiwizacji i tworzenia kopii zapasowych.

Ich historia sięga roku 1951 kiedy to firma Remington Rand wyprodukowała pierwszy na świecie napęd taśmowy. Napęd obsługiwał taśmy o „zawrotnej” ilości ośmiu ścieżek (6 użytecznych) i gęstości 128bpi. Taśma przesuwała się z prędkością ok. 2,5m/s a szybkość odczytu wynosiła 7200 znaków na sekundę.

W 1984 roku firma DEC wprowadziła na rynek pierwszy napęd korzystający z technologii zapisu Line Serpentine. Co znacznie przyspieszyło szybkość wymiany danych pomiędzy taśmą a urządzeniem.

Kolejnym krokiem było wprowadzenie w roku 1987 przez konsorcjum SONY i Exabyte technologii zapisu Helical Track, co przy ówczesnych prędkościach przesuwu taśm stanowiło kolejną rewolucję w prędkości zapis / odczyt.

Czym są urządzenia taśmowe – c.d.

Kasety do napędów dzielą się na dwa rodzaje – z dwoma szpulami i z jedną szpulą:

Obecnie w zastosowaniach profesjonalnych stosuje się najczęściej taśmy z jedną szpulą: LTO, SDLT, natomiast w pozostałych taśmy z dwoma szpulami: DAT72, QIC.

Czym są urządzenia taśmowe – c.d.

Różne rodzaje napędów taśmowych:

Czym są urządzenia taśmowe – c.d.

Przykładowe system prowadzenia taśmy:

Czym różnią się od dysków twardych

Urządzenia taśmowe: Twarde dyski

•Szeregowy dostęp do danych•Wymienne nośniki•Długi czas przechowywania danych(30 lat)•Wydajne algorytmy korekcji błędówWH Error: 10-17 SW Error: 10-27

•Duża odporność na uszkodzenianośnika•Bardzo szybki transfer liniowy – ok. 280MB/s (LTO-5 Comp.)•Potencjalnie bardzo długi czas oczekiwania na określowny fragment danych•Kodowanie: RLL, MPRL, NPML•Brak systemu plików (wyjątek LTFS)

•Blokowy dostęp do danych•Niewymienne nośniki – wyjątek MO•Nieznany maksymalny czas przechowywania•Słabsze algorytmy korekcji•Mała odporność na uszkodzenia mechaniczne•Transfer liniowy na poziomie 120MB/s•Stosunkowo krótki czas oczekiwania na określony fragment danych•Kodowanie RLL•Ściśle zdefinowane systemy plików

Technologia: LTO, SDLT, AIT, DDS (DAT) Pojemność nośnika: nominalna, z kompresją Interface: SCSI, FC, SAS Szybkość transferu: nominalna, z kompresją Całkowity czas potrzebny na utworzenie odczytanie pełnego archiwum Szyfrowanie sprzętowe WORM Gwarantowany czas przechowania danych Maksymalna liczba przebiegów głowicy Maksymalna liczba montowań nośnika Cartidge Memory (CM) Korekcja błędów HW Error, SW Error Pamięć cache Wsteczna kompatybilność

Podstawowe parametry urządzeń i nośników

Podstawowe parametry urządzeń i nośnikówLTO-5: (przykładowo Quantum LTO-5 FH)•Pojemność nominalna: 1500GB, 3000GB (2:1) 4500GB (3:1 IBM)•Interface FC-8•Szybkość transferu: 140MB/s, 280MB/s (2:1)•Czas potrzebny na utworzenie pełnego archiwum: 90 minut (2:1) – dla pewności należy przyjąć 120minut•Dostepność WORM-a: TAK•Szyfrowanie sprzętowe: NIE•Pamięć cache: 256MB

Podstawowe parametry urządzeń i nośników

Taśma LTO-5:

Gwarantowany czas przechowywania archiwum 15..30 lat

Pojemność 1500GB / 3000GB (2:1)

Maksymalna liczba montowań taśmy: 5000

Maksymalna liczba przebiegów głowicy 1 000 000 co daje ok. 260 pełnych zapisów / odczytów nośnika.

CM: jeśli występuje pozwala odczytać ważne informacje o taśmie:

Liczbę montowań

Liczbę przebiegów głowicy

Ewentualne problemy

Bar Code

Najczęściej używane technologie i kompatybilność

Technologie profesjonalne:•LTO (obecnie LTO-5)

• 1500GB• 120MB/s

•SDLT• 300GB (1:1)• 36MB/s (1:1)

•AIT (oczekiwane AIT-6)• 800GB• 248MB/s

•SAIT (oczekiwane SAIT-4)• 4000GB (1:1)• 240MB/s (1:1)

•T10000 (T10000B)• 1000GB (1:1)• 120MB/s (1:1)

•DLT-S4• 800GB (1:1)• 60MB/s

Technologie użytku domowego i małych firm• Digital Data Storage (DDS) (obecnie DAT-160)

• 80GB• 6,9MB/s

• VXA (obecnie VXA-320)• 160GB• 24MB/s

• SLR (Scalable Linear Recording)• 70GB• 6MB/s

Ponadto wiele innych formatów.

Najczęściej używane technologie i kompatybilność

Najczęściej używane technologie i kompatybilność

Na co zwracać uwagę przy wyborze technologii:•Powszechność danej technologii•Lista kompatybilności•Dostępność serwisu•Współpraca z innymi urządzeniami •Możliwości rozwojowe technologii

Najczęściej używane technologie i kompatybilność

Kompatybilność technologii LTO-5

Najczęściej używane technologie i kompatybilność

Kompatybilność technologii DDS

Najczęściej używane technologie i kompatybilność

Przyszłość technologii LTO:

Najczęściej używane technologie i kompatybilność

Przyszłość technologii DDS:

Przyrost pojemności taśm

0,25

2050

200

12000

400000

1500000

0,1

1

10

100

1000

10000

100000

1000000

10000000

1951 1964 1974 1984 1996 2004 2010

Pojemność [MB]

•Rok 1974 – pierwsza „biblioteka” taśmowa (IBM)•Rok 1996 – zastosowanie algorytmu PRML (DDS-3)

Kiedy i dlaczego używamy technologii taśmowych

Stosujemy:•Archiwa długoterminowe•Bezpieczeństwo danych nie modyfikowanych (WORM)•Trwałość mechaniczna: dysk pracuje przez cały czas taśma tylko przez chwilę•Przechowywanie dużych pojemności•Archiwa multi-volume•Kopie bezpieczeństwa•Szybkość dostępu do danych jest drugorzędna•Wymagane mocne kody korekcyjne

Nie stosujemy:•Szybki lub losowy dostęp do danych•Dane często ulegają zmianie•Krótki czas, życia danych •Dane małoistotne

Kilka słów więcej o technologii

•Systemy kodowania•Sposoby zapisu•Urządzenia blokowe i znakowe•Sposób dostępu do danych (partycje)

Systemy kodowania danych na taśmach

•Czym jest kodowanie i dlaczego je stosujemy

•Rodzina LTO:• LTO-1: RLL1,7• LTO 2,3,4: PRML• LTO-5: NPML

•Rodzina DDS:• Helical scan (R-DAT, PRML od DDS3)

Sposób zapisu danych – metody prowadzenia taśmy

Sposób zapisu danych – ułożenie ścieżekHelical scan

Line serpentine

Sposób zapisu danych – ułożenie domen magnetycznych

Urządzenia blokowe i znakowe

•Sposób dostępu do danych•Szybkość liniowa vs czas dostępu

• Odczyt danych z taśmy a ułożenie plików• Dane na „końcu” taśmy• Czas dostępu do danych na „końcu” taśmy

•Partycje na taśmie vs partycje na dysku

Kompresja danych i pojemność taśmy

•Pojemność nominalna•Problem kompresji danych •Porównanie przykładowych wyników kompresji•Szybkość transferu a kompresja•Kompresja automatyczna (LTO) a kompresja konfigurowana

Systemy automatyczne

•Autoloadery•Biblioteki•Rodzaje elementów biblioteki: Data Transfer, Storage, Mail etc.•Zarządzanie biblioteką•Partycje biblioteki•VTL

Systemy automatyczne – rodzaje bibliotek

•Z pojedynczym robotem •Z wieloma robotami

• Współdzielony obszar roboczy• Autonomiczne obszary robocze

•Pojedyncza technologia zapisu lub wiele technologii zapisu•Wiele bibliotek w systemie

Systemy automatyczne – zarządzanie biblioteką

•Elementy biblioteki: napędy, roboty•Biblioteka podłączona bezpośrednio•Biblioteka w strukturze SAN•Partycje biblioteki

RAIT

•Co to jest RAIT•Poziomy – konfiguracje: 0,1,5•Dlaczego stosujemy RAIT•Gdzie zastosowanie RAIT jest uzasadnione•HW RAIT vs Software RAIT dopasowanie nośników

Oprogramowanie do archiwizacji

•Istotne cechy oprogramowania• Wspierany sprzęt• Wspierane systemy operacyjne• Praca w sieci• Sposób zarządzania• Procedury awaryjne• Wsparcie od strony producenta• Wspierane technologie, Multi-Volume, VTL, RAIT, Disk Pool

•Oprogramowanie• IBM TSM• Bacula• Amanda• CASTOR (CERN)• Veritas backup• tar, dump/restore, mt, mtx

Oprogramowanie do archiwizacji

HSM – ang. Hierarchical Storage Management

Parametry użytkowe i cechy systemu HSM Przykładowa realizacja HSM w PCSSPoziomy hierarchii HSM

Przyrost pojemności technologii taśmowych

•Współczynnik 2x•Przyrost na przestrzeni lat

...

Podsumowanie

Dziękujemy za uwagęKontakt: jacek.herold@pwr.wroc.pl

kmd.pcss.pl

Technologie taśmowe