Data visualization in Business Intelligence and ETL process

37
DATA VISUALIZATION IN BUSINESS INTELLIGENCE AND ETL PROCESS Mateusz Cicheński Artur Jaworski Hurtownie danych, 16.06.2011 1/128

description

1 /128. Mateusz Cicheński Artur Jaworski Hurtownie danych, 16.06.2011. Data visualization in Business Intelligence and ETL process. 2 /128. Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku - PowerPoint PPT Presentation

Transcript of Data visualization in Business Intelligence and ETL process

Page 1: Data visualization in  Business  Intelligence and ETL process

DATA VISUALIZATIONIN BUSINESS INTELLIGENCE AND ETL PROCESSMateusz CicheńskiArtur JaworskiHurtownie danych, 16.06.2011

1/128

Page 2: Data visualization in  Business  Intelligence and ETL process

PLAN PREZENTACJI Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych

2/128

Page 3: Data visualization in  Business  Intelligence and ETL process

PLAN PREZENTACJI Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych

(„co oferuje Excel”)

(Theme River, Lap Chart)

(Fisheye, Table Lenses)

(Chernoff Faces)

(Augmented Reality)

3/128

Page 4: Data visualization in  Business  Intelligence and ETL process

ZASTOSOWANIE HURTOWNI DANYCH Archiwizacja i agregacja danych Przetwarzanie analityczne Wspomaganie decyzji Analiza efektywności Wsparcie dla systemów CRM

(Customer Relation Management)

4/128

Page 5: Data visualization in  Business  Intelligence and ETL process

WIZUALIZACJA DANYCH Ułatwia analizę danych Uwypukla trendy, zależności Wspomaga podejmowanie decyzji Umożliwia zaprezentowanie informacji

dla szerszego grona w sposób intuicyjny i łatwy do interpretacji

5/128

Page 6: Data visualization in  Business  Intelligence and ETL process

WIZUALIZACJA DANYCH – PROBLEMY TOWARZYSZĄCE

Odpowiednia forma prezentacji danych Percepcja człowieka Kolor! Przestrzeń i głębia Wielowymiarowość danych Interakcja, nawigacja, zoom „Focus” i kontekst Skalowalność

6/128

Page 7: Data visualization in  Business  Intelligence and ETL process

WIZUALIZACJA DANYCH – POPULARNE FORMY

Mindmap Informacje Dane Powiązania między

informacjami

7/128

Page 8: Data visualization in  Business  Intelligence and ETL process

KLASYCZNE PODEJŚCIA Diagram słupkowy/kolumnowy Diagram punktowy/liniowy Diagram kołowy

8/128

Page 9: Data visualization in  Business  Intelligence and ETL process

KLASYCZNE PODEJŚCIA – OGRANICZENIA Specjalizacja do konkretnego typu

danych Statyczna prezentacja danych Możliwość prezentacji tylko jednej

cechy Trudność w przedstawieniu dużej ilości

danych na jednym wykresie

9/128

Page 10: Data visualization in  Business  Intelligence and ETL process

ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOŁOWY

Unikaj tworzenia diagramów kołowych Używaj diagramów kołowych tylko dla

danych, które sumują się do sensownej całości

Nigdy nie używaj trójwymiarowych diagramów kołowych – są jeszcze gorsze niż dwuwymiarowe

Unikaj porównań pomiędzy więcej niż jednym diagramem kołowym

10/128

Page 11: Data visualization in  Business  Intelligence and ETL process

ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOLUMNOWY

Minimalizuj „ilość tuszu”– nie używaj efektu 3D Posortuj dane wg najbardziej znaczącej

zmiennej Użyj diagramu słupkowego dla więcej niż 8-10

kategorii Umieść legendę wewnątrz lub poniżej obszaru

kreślenia Przy więcej niż jednej serii danych uważaj na

różnice w skalowaniu

11/128

Page 12: Data visualization in  Business  Intelligence and ETL process

ZASADY DOBRYCH WYKRESÓW– DIAGRAM LINIOWY

Czas prawie zawsze powinien być przedstawiony na osi OX od lewej do prawej

Pokaż jak najwięcej danych używając jak najmniej atramentu

Upewnij się, że osoba czytająca wykres może odróżnić linie poszczególnych serii danych

Uważaj na efekty skalowania Pokazując dane finansowe lub walutowe,

zwykle najlepiej jest wyświetlać dane znormalizowane (względem inflacji lub PKB)

12/128

Page 13: Data visualization in  Business  Intelligence and ETL process

HISTOGRAM Histogram dla zbioru danych Castro

Trudno wyciągać wnioski dotyczące porównań poszczególnych serii danych!

13/128

Page 14: Data visualization in  Business  Intelligence and ETL process

THEME RIVER Ten sam histogram w postaci „rzeki”

łatwość śledzenia poszczególne trendów zachowane są właściwości histogramu

14/128

Page 15: Data visualization in  Business  Intelligence and ETL process

THEME RIVER – W ANALIZIE (1)

Atrybuty zmapowane są jako „prądy” rzeki płynącej w czasie

Grubość prądu – siła atrybutu Długość prądu – znaczenie

atrybutu Mapowanie wydarzeń,

łatwa analiza porównawczaatrybutów

15/128

Page 16: Data visualization in  Business  Intelligence and ETL process

THEME RIVER – W ANALIZIE (2)

Możliwość połączenia z histogramem Łatwość porównania dwóch „rzek”

16/128

Page 17: Data visualization in  Business  Intelligence and ETL process

THEME RIVER – W ANALIZIE (3)

Zgodność z „teorią Gestalta” (postrzeganie całości, a nie poszczególnych elementów)

Nakładające się prądy rzeki umożliwiają porównanie między atrybutami

Płynne przejścia między kolejnymi punktami na osi czasu (uwaga: przekłamania wynikające z interpolacji!)

Łatwość utworzenia wykresu (jak histogram)

17/128

Page 18: Data visualization in  Business  Intelligence and ETL process

THEME RIVER – ZASTOSOWANIE W HURTOWNIACH DANYCH

Rozkład wydatków w firmie Aktywność poszczególnych placówek

firmy (wyrażona jako wypracowany zysk, liczba dokonanych transakcji, wielkość sprzedaży)

Popularność sprzedawanych produktów

W ogólności: analiza danych zmieniających się w czasie

18/128

Page 19: Data visualization in  Business  Intelligence and ETL process

LAP CHART Inspirowany Formułą I Przedstawianie zależności między

sekwencjami w kolejnych chwilach czasowych

Zgodny z koncepcją focus – pomija nieistotne dane

19/128

Page 20: Data visualization in  Business  Intelligence and ETL process

LAP CHART - PRZYKŁAD

LOGISTYKA

KONTROLAJAKOŚCI

Page 21: Data visualization in  Business  Intelligence and ETL process

LAP CHART – ZASTOSOWANIE W HURTOWNIACH DANYCH

Porównanie sekwencji produktów na linii produkcyjnej

Analiza zmieniających się preferencji klientów

W ogólności: analiza danych tworzących sekwencje zmieniające się w czasie

21/128

Page 22: Data visualization in  Business  Intelligence and ETL process

FISHEYE Obiektywy typu „rybie oko” o dużym

kącie widzenia w fotografii Zgodność z koncepcją „focus” – ważne

dane są powiększone, nieistotne dane są małe

Rozwiązanie dla małej przestrzeni prezentacji danych

22/128

Page 23: Data visualization in  Business  Intelligence and ETL process

FISHEYE - PRZYKŁAD

23/128

Page 24: Data visualization in  Business  Intelligence and ETL process

TABLE LENSES Prezentowanie tabelarycznych danych

numerycznych w dużych ilościach Koncepcja „fisheye” Dane numeryczne prezentowane w

formie graficznej Korelacja między atrybutami! 30-100x więcej danych na ekranie!

24/128

Page 25: Data visualization in  Business  Intelligence and ETL process

TABLE LENSES - PRZYKŁAD

25/128

Page 26: Data visualization in  Business  Intelligence and ETL process

FISHEYE&TABLE LENSES – ZASTOSOWANIE W HURTOWNIACH DANYCH

Analiza zależności między popularnością produktu a jego parametrami

Zysk na pokojach w hotelu w stosunku do jakości wyposażenia, położenia w obiekcie

W ogólności: poszukiwanie relacji pomiędzy wymiarami i faktami

26/128

Page 27: Data visualization in  Business  Intelligence and ETL process

CHERNOFF FACES Zdolność człowieka do rozpoznawania

twarzy „Łatwość” w wychwyceniu drobnych

różnic Mapowanie atrybutów do cech

opisujących twarz (uwaga: pewne cechy są ważniejsze od innych!)

Analiza porównawcza Problem z przygotowaniem

danych

27/128

Page 28: Data visualization in  Business  Intelligence and ETL process

CHERNOFF FACES - PRZYKŁAD

28/128

Page 29: Data visualization in  Business  Intelligence and ETL process

CHERNOFF FACES – ZASTOSOWANIE W HURTOWNIACH DANYCH

Stan życia ludzi w poszczególnych dzielnicach

Zadowolenie klientów z obsługiw punktach sprzedaży

Jakość leczenia pacjentów

W ogólności: dane, które mogąbyć interpretowane jako emocjewyrażane przez mimikę twarzy(trudne do stwierdzenia!!!)

29/128

Page 30: Data visualization in  Business  Intelligence and ETL process

KOSTKA DANYCH30/128

Page 31: Data visualization in  Business  Intelligence and ETL process

KOSTKA DANYCH – POPULACJA STANÓW ZJEDNOCZONYCH

31/128

Page 32: Data visualization in  Business  Intelligence and ETL process

KOSTKA DANYCH – ANALIZA MATRYC DNA

32/128

Page 33: Data visualization in  Business  Intelligence and ETL process

AUGMENTED REALITY

Czas na krótki film …

33/128

Page 34: Data visualization in  Business  Intelligence and ETL process

REFERENCJE „Milestones in the history of thematic cartography, statistical graphics, and data visualization”

Michael Friendly (2008) „Data Visualization: Modern Approaches” Graphics, August 2nd, 2007 University of British Columbia, Faculty of Computer Science, Information Visualization courses

(http://www.cs.ubc.ca/~tmm/courses) Gallery of Data Visualization: The Best and Worst of Statistical Graphics

(http://www.datavis.ca/gallery) „ThemeRiver: Visualizing Thematic Changes in Large Document Collections” Susan Havre,

Elizabeth Hetzler, Paul Whitney, Lucy Nowell. IEEE Transactions on Visualization and Computer Graphics, 8(1), pp 9-20, 2002.

The Continuous Zoom: A Constrained Fisheye Technique for Viewing and Navigating Large Information Spaces L. Bartram, A. Ho, J. Dill and F. Henigman, UIST '95, pp. 207-216.

DateLens: A Fisheye Calendar Interface for PDAs Benjamin B. Bederson, Clamage, A., Czerwinski, M. P., & Robertson, G. G. ACM Transactions on Computer-Human Interaction (TOCHI), March 2004, 11(1), pp 59-89.

„The Use of Faces to Represent Points in K-Dimensional Space Graphically” Herman Chernoff, Journal of the American Statistical Association (American Statistical Association) 68 (342): 361–368

„Constructing Good Charts and Graphs” Gary Klass, Illinois State University, 2002 http://lilt.ilstu.edu/gmklass/pos138/datadisplay/sections/goodcharts.htm

„Multiscale Visualization Using Data Cubes” Chris Stolte, Diane Tang, Pat Hanrahan, Stanford University, 2002.

34/128

Page 35: Data visualization in  Business  Intelligence and ETL process

WIZUALIZACJE http://www.informationarchitects.jp/en/ia-trendmap-2007v2 http://marumushi.com/projects/newsmap http://www.time.com/time/covers/20061030/where_we_live/ http://www.crazyegg.com/ http://www.munterbund.de/visualisierung_textaehnlichkeiten/essay.php http://flare.prefuse.org/demo http://www.whc.ki.se/index.php http://strangepaths.com/en/ http://joshualedwell.typepad.com/usability_blog/files/final_vizualization.pdf

35/128

Page 36: Data visualization in  Business  Intelligence and ETL process

PYTANIA?…/128

Page 37: Data visualization in  Business  Intelligence and ETL process

Dziękujemy za uwagę!

128/128