11. Nowoczesne systemy archiwizacji

25
© 2010 IBM Corporation Information Management Data Governance, Nowoczesne systemy archiwizacji Tomasz Kotowski, IBM

Transcript of 11. Nowoczesne systemy archiwizacji

Page 1: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation

Information Management

Data Governance,Nowoczesne systemy archiwizacji

Tomasz Kotowski, IBM

Page 2: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation2

Information Management

2

IBM Infosphere Information Governance

Spójno ść i reu żywalno ść

współdzielone metadanei polityki

Wszystkie obszary funkcjonalne

Modułowo ść

i ró żne punkty startu

Heterogeniczno ść

i wsparcie środowisk enterprise

Page 3: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation3

Information Management

Managing the Lifecycle of Data in the Information Supply Chain

Discover & DefineDiscover & Define

Consolidate & RetireConsolidate & Retire

Optimize, Archive & AccessOptimize, Archive & Access

Develop & TestDevelop & Test

� Zrozumieć “co i gdzie” w danych firmy

� Utworzenie modeli i rozwiązania zapewniającego odpowiednie składowanie i dostęp do danychw środowiskach produkcyjnych i poza produkcją

� Optymalizacja wydajności i eliminacja wąskich gardeł poprzez odpowiednią strategię archiwizacji

� Implementacja spójnego procesu dla wygaszania lub konsolidacji aplikacji

Test/DevTest/Dev

Page 4: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation4

Information Management

Data Lifecycle Management – etapy i narzędzia

� Understand and Define:

� * InfoSphere Guardium

� * InfoSphere Discovery

� * InfoSphere Data Architect

� Develop, Test and Deploy:

� * InfoSphere Optim Development Studio and pureQuery Runtime

� * InfoSphere Data Architect

� * InfoSphere Optim Test Data Management

� Optimize, Archive and Access:

� * InfoSphere Optim Performance Manager

� * InfoSphere Optim Data Growth

� * InfoSphere Optim Query Tuner

� * InfoSphere Optim Database Administrator

� * InfoSphere Optim Data Find

� Consolidate and Retire:

� * InfoSphere Information Server

� * InfoSphere Optim Application Retirement

� * InfoSphere Optim Data Growth

� * InfoSphere Optim Data Find

Page 5: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation5

Information Management

Czas

Zb

iera

nie

/ tw

orze

nie

Uak

tual

nia

nie

Arc

hiw

um

Usu

wan

ie

War

tość

dany

ch

Dys

tryb

ucj

aOnline Offline

< 30% > 70%Cykl życia danych – nie wszystkie dane maj ą tą samą warto ść

Około 70% danych w produkcyjnych bazach danych jest b ardzo rzadko lub w ogóle nie wykorzystywanych – Gartner

Page 6: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation6

Information Management

Page 7: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation7

Information Management

Problem - bazy danych – efekt mno żnika

4 TB Produkcja

4 TB Backup

DisasterRecovery

4 TB

4 TB Test

4 TB Development

4 TB Quality Control

24 TBSuma

Rzeczywista wielko ść utrzymywanych baz danych = rozmiar bazy produkcyjnej + rozmiar wszystkich klonów tej b azy

Koszty utrzymania (przestrzeń dyskowa, CPU, pamięć, licencje, praca DBA, …)

$ $$ $$$

Page 8: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation8

Information Management

Archiwizacja to proces przenoszenia nieaktywnych lub rzadko wykorzystywanych danych które wciąż mająwarto ść, z zachowaniem możliwości odtworzenia, dost ępu i wyszukiwania .

Archiwizacja – czyli co?

Dobra obsługa archiwizacji, zapewnienie optymalnego wykorzystania zasobów i bezpiecze ństwa danych wymaga automatyzacji procesu.

Page 9: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation9

Information Management

Dane aplikacji w relacyjnych bazach danych

?!?

Page 10: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation10

Information Management

� Jedno, skalowalne, wieloplatformowe i zorientowane n a usługi rozwi ązanie do zautomatyzowanego zarz ądzania danymi przedsi ębiorstwa w oparciu o zestawy reguł, klasyfikacje i warto ść danych.

� Pozwala na separacj ę logiki i modelu od implementacji i technologii

� Optim Relationship Engine™ - system definiowania, wyodr ębniania, dost ępu oraz selektywnego odtwarzania nienaruszonych podzbiorów danych z heterogenicznych systemów zarz ądzania bazami danych

Archive

Production Environments

OE

M/IS

V

Cu

sto

m

Am

do

cs

SA

P

JDE

dw

ard

s

Peo

ple

So

ft

Ora

cle

Sie

bel

Subset & Mask

Non Production Environments

OE

M/IS

V

Cu

sto

m

Am

do

cs

SA

P

JDE

dw

ard

s

Peo

ple

So

ft

Ora

cle

Sie

bel

NAS SAN ATA CAS Optical Tape

Windows XP/2000 Solaris HP/UX Linux AIX OS/390 Z/OS i-Series

Oracle SQL Server Sybase Informix DB2 LUW XML IMS VSAM/SEQ Adabas DB2 z/OS Teradata

Optim Relationship Engine ™

Data Growth, Data Privacy, Test Data Management, Ap plication Upgrades, Application Retirement

Page 11: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation11

Information Management

� Reprezentuj ą logiczne obiekty biznesowe aplikacji – np. klienta, transakcje

� Zapewniaj ą “historyczne zdj ęcie” danych reprezentuj ących aktywno ść biznesow ą (stan w danym momencie w czasie)

� Dzięki federacji mog ą powstawa ć z różnych źródeł danych, aplikacji obsługuj ących poszczególne etapy procesów biznesowych

Kompletne obiekty biznesowe

EBiz Financials / Oracle

Siebel / OracleCustom Inventory Management / DB2

Customer Order

Customer Order

Transakcja Klienta

Kompletny obiekt

biznesowy

Kompletny obiekt

biznesowy

Aplikacja 1DB2 on z/OS

Aplikacja 2Informix on LUW

Aplikacja 3Oracle

Page 12: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation12

Information Management

1212

IBM Optim Discovery

� Automatyzacja analizy modelu danych i wykrywania powiązańskraca czas analizy.

� Zgromadzona wiedza o modelu danych zmniejsza ryzyko projektu.

� Zapewnia spójnądokumentację zależności danych z różnych obszarów i aplikacji.

� Zdefiniowanie obiektów biznesowych dla archiwizacji i zasilania środowisk testowych

� Odkrycie reguł transformacji danych i złożonych relacji nie zapisanych w katalogu bazy danych

� Identyfikacja danych spełniających kryteria – np.. Danych wrażliwych wymagających maskowania

Wymagania

Korzyści

Ułatwia i przy śpiesza wdro żenie przez zautomatyzowane odkrywanie powi ązań i relacji danych i definicj ę obiektów biznesowych

Ręczna analiza i walidacja danych(czas, ryzyko, $$)

Zautomatyzowane odkrywanie danych

Page 13: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation13

Information Management

13

Wykrywanie powiązań i potencjalnie ukrytych danych wrażliwych

� Relacje i dane wrażliwe nie zawsze mogą być odnalezione poprzez proste skanowanie danych

– Dane wrażliwe mogą byćzawarte w wartości innego pola

– Dane wrażliwe mogą zostaćujawnione poprzez relacje pomiędzy polami i systemami

� Mając do czynienia z setkami tabel i milionami rekordów wyszukiwanie danych poufnych może być bardzo złożone i wymaga odpowiednich narzędzi.

Patient Result Test3802468 N 534182715 N 534600986 N 325061085 N 535567193 N 726123913 Y 476736304 N 347409934 N 348150928 N 478966020 N 34

System A Table 15

Wykrywanie relacji danych wra żżżżliwych

Code Name53 Streptococcus pyogenes72 Pregnancy 32 Alzheimer Disease47 H1N134 Dermatamycoses

System Z Table 25

Number Name4600986 AlexFulltheim8150928 BarneySolo6736304 BillAlexander3802468 BobSmith5567193 EileenKratchman7409934 FredSimpson6123913 GregLougainis5061085 JamieSlattery4182715 JimJohnson8966020 MartinAston

System A Table 1Number Name3544600986 Alex Felltham5728150928 Barney Solo3786736304 Bill Alexander6783802468 Bob Smith4035567193 Eileen Ranchman8037409934 Fred Simpson4306123913 John Smith9525061085 Jamie Slattery4594182715 Jim Johnson1288966020 Martin Aston

System A Table 1

Discover &Discover &DefineDefine

ID pacjenta # zawarty w innym polu

Złożone dane wrażliwe: Wyniki testu mogą zostać ujawnione

naruszając prywatność

Page 14: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation14

Information Management

Operating Platforms

IBM InfoSphere Optim - nowo ści

� Zunifikowane GUI daje możliwość projektowania i uruchamiania procesów Optim niezależnie od środowiska wykonania.

� Łatwe w wykorzystaniu środowisko Designera (Eclipse) oraz oparty o przeglądarkę interfejs Manager’a

� Możliwe jasne rozdzielenie roli projektantów od ról wykonujących i nadzorujących wykonanie procesów

� Kompatybilne z poprzednimi interfejsami (wciąż dostępnymi)

� Architektura zależna od środowiska wykonania

� Osobne środowiska developerskie

� To samo GUI dla projektowania i wykonywania zadań Optim

Rich-client supports drag-n-drop design

Rich-client supports drag-n-drop design

Optim – poprzednie wersje Optim - nowo ści

Phased rollout release

OptimOptimDistributedDistributedRunRun --TimeTime

EngineEngine

OptimOptimDistributedDistributedRunRun --TimeTime

EngineEngine

Web-based: monitor anywhere, anytime

Web-based: monitor anywhere, anytime

OptimOptimz/OSz/OS

RunRun --TimeTimeEngineEngine

OptimOptimz/OSz/OS

RunRun --TimeTimeEngineEngine

Page 15: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation15

Information Management

IBM Infosphere Optim Designer

� Pozwala na projektowanie i tworzenie usług Optim dla tworzenia środowisk testowych, maskowania danych, archiwizacji i wygaszania aplikac ji – niezale żnie od środowiska wykonania

� Wykorzystuje środowisko Eclipse, zapewniaj ąc integracj ę z innymi rozwi ązaniami IBM –InfoSphere Data Architect, Data Studio, Optim Query Tuner, Development Administrator & wi ęcej!

� Zapewnia współprac ę i integracj ę z Optim Dicovery i Infosphere Information Analyzer opart ą

o współdzielone meta dane, modele, reguły i definic je obiektów.

� Zintegrowane środowiskopozwala na współdzieleniei wielokrotne wykorzystanie komponentów przy zapewnieniu spójno ści

Wspó łłłłdzielone modele danych

Dost ęęęęp do wspólnych metadanych

Page 16: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation16

Information Management

Archiwa Offline

3

Archiwa Online

2

Aktywnie

wykorzystywane

dane historyczne

10

Dane bieżące

Klasyfikacja danych - przykładowe kryteria biznesoweC

ZA

SD

OS

PZ

AK

RE

S/S

TA

TU

S

1 - 2 lat

Bieżące przetwarzanie

Aktualne obiektybiznesowe

3 - 4 lat

Bieżące raportowanie

Aktualne i hist. obiekty bizn.

5 - 6 lat

Okazjonalneraportowanie

Aktualne i hist. obiekty bizn.

7+ lat

Sporadyczny

Historyczne obiekty bizn.

Klasy (warstwy) danych

Page 17: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation17

Information Management

odtworzenie

archiwizacja

Archiwa OfflineArchiwa OnlineAktywnie

wykorzystywane

dane historyczne

Dane bieżące

Klasyfikacja danych - dopasowana infrastruktura ITC

ZA

S

1 - 2 lat 3 - 4 lat 5 - 6 lat 7+ lat

CD,Tape,Optical, WORM

Archiwa poza RDBMSATA File ServerEMC DMX, CenteraIBM TS, DR550itd.

Pliki archiwumPliki archiwum

Baza archiwum

do raportów

Pliki archiwumPliki archiwumPliki archiwumPliki archiwum

XXXX$/GB XXX$/GB XX$/GB X$/GB

Definicje

archiwizacji

ODBC / JDBC / SQLDostęp do danych przez Open Data Manager

Bieżące

Odtworzone

Historyczne

Aplikacja Aplikacja Wyszukiwanie

(…)raportowanieMashup Eksport: CSV/XML

Page 18: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation18

Information Management

IBM Optim Manager

� Zarządza wykonaniem usług Optim niezale żnie od środowiska wykonania (z/OS, distributed)

� Ułatwia zarz ądzanie usługami zapewniaj ąc jeden, wspólny interfejs

� Umożliwia odseparowanie ról i uprawnie ń projektantów i administratorów

� Pozwala na wykorzystanie raportów z operacyjnych me ta danych do strojenia i wprowadzania zmian poprawiaj ących wydajno ść i działanie usług.

Elastyczne mechanizmy raportowania

Łatwy w obsłudze interfejs dostępny

przez przeglądarkępozwalający na uruchamianie i zarządzanie

usługami Optim

Monitoring

Zarządzanie

Konfiguracja

Page 19: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation19

Information Management

Optim – dost ęp do archiwum ■ Natywny dost ęp z aplikacji źródłowej

■ Obsługa drugiego źródła, federacja

■ Dostęp niezale żny od aplikacji źródłowej

■ Standardy: SQL, ODBC/JDBC, XML

■ IBM Mashup Center –teraz w cenie dla dost ępu do archiwum Optim

■ Środowiska raportowe: Crystal Reports, Cognos, Business Objects, Discoverer, Actuate

■ Narzędzia desktop: Excel, MS Access, etc.

■ Przywracanie i dostęp z innej bazy danych

■ Eksport do CSV, XML

■ Web service

Optim

IBM Mashup Center

Page 20: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation

Information Management

Co to jest mashup?

�„aplikacja internetowa, która łączy dane i funkcjonalności z więcej niż jednego źródła„

�Szybki w tworzeniu, budowany samodzielnie

�Używa istniejących zasobów, lecz tworzy nową wartość

�(zazwyczaj)nie wymaga umiejętności technicznych

�Może łączyć wewnętrzne i zewnętrzne źródła

�Używane komponenty – to np. widget

Page 21: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation21

Information Management

Feed generator / Data Mashup Builder

DB2 database(e.g. Claim records

history)

Optim Archive Excel files(e.g. Information about claim

agents)

DB2/zOS content(incl. PDF, word documents

in blob columns)

Custom Mashup plugin, to recreate actual file from binary blob content

IBM Mashup CenterMashup Builder

AtomFeeds

AtomFeeds

AtomFeeds

Excel File

JDBCdrivers

JDBCthrough Attunity

Optim

Aplikacja Mashup

Atom data feeds displayed through various interacti ve and connected iWidgets

Integracja danych z archiwumi danych bieżących z użyciem

Mashup Center

FileNet

DocumentsViewer

Documents & Files

Page 22: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation22

Information Management

Mashup Interface

Page 23: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation23

Information Management

Mashup Interface

Page 24: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation24

Information Management

1) Ograniczenie kosztów – oszczędności !– przestrzeń dyskowa (dla bazy produkcyjnej i jej klonów,

wprowadzenie warstwowego przechowywania danych)– redukcja zapotrzebowania na moc obliczeniową (mniej CPU)– administracja i utrzymania baz danych (licencje związane z CPU,

usługi)– uaktualnienia i migracje i wygaszanie aplikacji (skrócony czas

konwersji i migracji danych, dostęp do danych bez konieczności utrzymywania aplikacji)

2) Ograniczenie ryzyka– zgodność z regulacjami prawnymi o zachowywaniu danych (np.

UOODO, Basel, SOX, MiFID, PCI DSS, …)– uniwersalne i bezpieczne archiwum (obiekty biznesowe, niezależne

od aplikacji, bezpieczne archiwum)– precyzyjny i chroniony dostęp do danych (indeksowanie, audyt)

3) Poprawa wydajności i dostępności aplikacji– większa dostępność aplikacji (przetwarzanie mieści się

w wydzielonych oknach czasowych)– szybszy backup i przywracanie systemu – lepsza wydajność aplikacji

Korzy ści z archiwizacji baz danych

Page 25: 11. Nowoczesne systemy archiwizacji

© 2010 IBM Corporation25

Information Management

KONIEC