DATA VISUALIZATIONIN BUSINESS INTELLIGENCE AND ETL PROCESSMateusz CicheńskiArtur JaworskiHurtownie danych, 16.06.2011
1/128
PLAN PREZENTACJI Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych
2/128
PLAN PREZENTACJI Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych
(„co oferuje Excel”)
(Theme River, Lap Chart)
(Fisheye, Table Lenses)
(Chernoff Faces)
(Augmented Reality)
3/128
ZASTOSOWANIE HURTOWNI DANYCH Archiwizacja i agregacja danych Przetwarzanie analityczne Wspomaganie decyzji Analiza efektywności Wsparcie dla systemów CRM
(Customer Relation Management)
4/128
WIZUALIZACJA DANYCH Ułatwia analizę danych Uwypukla trendy, zależności Wspomaga podejmowanie decyzji Umożliwia zaprezentowanie informacji
dla szerszego grona w sposób intuicyjny i łatwy do interpretacji
5/128
WIZUALIZACJA DANYCH – PROBLEMY TOWARZYSZĄCE
Odpowiednia forma prezentacji danych Percepcja człowieka Kolor! Przestrzeń i głębia Wielowymiarowość danych Interakcja, nawigacja, zoom „Focus” i kontekst Skalowalność
6/128
WIZUALIZACJA DANYCH – POPULARNE FORMY
Mindmap Informacje Dane Powiązania między
informacjami
7/128
KLASYCZNE PODEJŚCIA Diagram słupkowy/kolumnowy Diagram punktowy/liniowy Diagram kołowy
8/128
KLASYCZNE PODEJŚCIA – OGRANICZENIA Specjalizacja do konkretnego typu
danych Statyczna prezentacja danych Możliwość prezentacji tylko jednej
cechy Trudność w przedstawieniu dużej ilości
danych na jednym wykresie
9/128
ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOŁOWY
Unikaj tworzenia diagramów kołowych Używaj diagramów kołowych tylko dla
danych, które sumują się do sensownej całości
Nigdy nie używaj trójwymiarowych diagramów kołowych – są jeszcze gorsze niż dwuwymiarowe
Unikaj porównań pomiędzy więcej niż jednym diagramem kołowym
10/128
ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOLUMNOWY
Minimalizuj „ilość tuszu”– nie używaj efektu 3D Posortuj dane wg najbardziej znaczącej
zmiennej Użyj diagramu słupkowego dla więcej niż 8-10
kategorii Umieść legendę wewnątrz lub poniżej obszaru
kreślenia Przy więcej niż jednej serii danych uważaj na
różnice w skalowaniu
11/128
ZASADY DOBRYCH WYKRESÓW– DIAGRAM LINIOWY
Czas prawie zawsze powinien być przedstawiony na osi OX od lewej do prawej
Pokaż jak najwięcej danych używając jak najmniej atramentu
Upewnij się, że osoba czytająca wykres może odróżnić linie poszczególnych serii danych
Uważaj na efekty skalowania Pokazując dane finansowe lub walutowe,
zwykle najlepiej jest wyświetlać dane znormalizowane (względem inflacji lub PKB)
12/128
HISTOGRAM Histogram dla zbioru danych Castro
Trudno wyciągać wnioski dotyczące porównań poszczególnych serii danych!
13/128
THEME RIVER Ten sam histogram w postaci „rzeki”
łatwość śledzenia poszczególne trendów zachowane są właściwości histogramu
14/128
THEME RIVER – W ANALIZIE (1)
Atrybuty zmapowane są jako „prądy” rzeki płynącej w czasie
Grubość prądu – siła atrybutu Długość prądu – znaczenie
atrybutu Mapowanie wydarzeń,
łatwa analiza porównawczaatrybutów
15/128
THEME RIVER – W ANALIZIE (2)
Możliwość połączenia z histogramem Łatwość porównania dwóch „rzek”
16/128
THEME RIVER – W ANALIZIE (3)
Zgodność z „teorią Gestalta” (postrzeganie całości, a nie poszczególnych elementów)
Nakładające się prądy rzeki umożliwiają porównanie między atrybutami
Płynne przejścia między kolejnymi punktami na osi czasu (uwaga: przekłamania wynikające z interpolacji!)
Łatwość utworzenia wykresu (jak histogram)
17/128
THEME RIVER – ZASTOSOWANIE W HURTOWNIACH DANYCH
Rozkład wydatków w firmie Aktywność poszczególnych placówek
firmy (wyrażona jako wypracowany zysk, liczba dokonanych transakcji, wielkość sprzedaży)
Popularność sprzedawanych produktów
W ogólności: analiza danych zmieniających się w czasie
18/128
LAP CHART Inspirowany Formułą I Przedstawianie zależności między
sekwencjami w kolejnych chwilach czasowych
Zgodny z koncepcją focus – pomija nieistotne dane
19/128
LAP CHART - PRZYKŁAD
LOGISTYKA
KONTROLAJAKOŚCI
LAP CHART – ZASTOSOWANIE W HURTOWNIACH DANYCH
Porównanie sekwencji produktów na linii produkcyjnej
Analiza zmieniających się preferencji klientów
W ogólności: analiza danych tworzących sekwencje zmieniające się w czasie
21/128
FISHEYE Obiektywy typu „rybie oko” o dużym
kącie widzenia w fotografii Zgodność z koncepcją „focus” – ważne
dane są powiększone, nieistotne dane są małe
Rozwiązanie dla małej przestrzeni prezentacji danych
22/128
FISHEYE - PRZYKŁAD
23/128
TABLE LENSES Prezentowanie tabelarycznych danych
numerycznych w dużych ilościach Koncepcja „fisheye” Dane numeryczne prezentowane w
formie graficznej Korelacja między atrybutami! 30-100x więcej danych na ekranie!
24/128
TABLE LENSES - PRZYKŁAD
25/128
FISHEYE&TABLE LENSES – ZASTOSOWANIE W HURTOWNIACH DANYCH
Analiza zależności między popularnością produktu a jego parametrami
Zysk na pokojach w hotelu w stosunku do jakości wyposażenia, położenia w obiekcie
W ogólności: poszukiwanie relacji pomiędzy wymiarami i faktami
26/128
CHERNOFF FACES Zdolność człowieka do rozpoznawania
twarzy „Łatwość” w wychwyceniu drobnych
różnic Mapowanie atrybutów do cech
opisujących twarz (uwaga: pewne cechy są ważniejsze od innych!)
Analiza porównawcza Problem z przygotowaniem
danych
27/128
CHERNOFF FACES - PRZYKŁAD
28/128
CHERNOFF FACES – ZASTOSOWANIE W HURTOWNIACH DANYCH
Stan życia ludzi w poszczególnych dzielnicach
Zadowolenie klientów z obsługiw punktach sprzedaży
Jakość leczenia pacjentów
W ogólności: dane, które mogąbyć interpretowane jako emocjewyrażane przez mimikę twarzy(trudne do stwierdzenia!!!)
29/128
KOSTKA DANYCH30/128
KOSTKA DANYCH – POPULACJA STANÓW ZJEDNOCZONYCH
31/128
KOSTKA DANYCH – ANALIZA MATRYC DNA
32/128
AUGMENTED REALITY
Czas na krótki film …
33/128
REFERENCJE „Milestones in the history of thematic cartography, statistical graphics, and data visualization”
Michael Friendly (2008) „Data Visualization: Modern Approaches” Graphics, August 2nd, 2007 University of British Columbia, Faculty of Computer Science, Information Visualization courses
(http://www.cs.ubc.ca/~tmm/courses) Gallery of Data Visualization: The Best and Worst of Statistical Graphics
(http://www.datavis.ca/gallery) „ThemeRiver: Visualizing Thematic Changes in Large Document Collections” Susan Havre,
Elizabeth Hetzler, Paul Whitney, Lucy Nowell. IEEE Transactions on Visualization and Computer Graphics, 8(1), pp 9-20, 2002.
The Continuous Zoom: A Constrained Fisheye Technique for Viewing and Navigating Large Information Spaces L. Bartram, A. Ho, J. Dill and F. Henigman, UIST '95, pp. 207-216.
DateLens: A Fisheye Calendar Interface for PDAs Benjamin B. Bederson, Clamage, A., Czerwinski, M. P., & Robertson, G. G. ACM Transactions on Computer-Human Interaction (TOCHI), March 2004, 11(1), pp 59-89.
„The Use of Faces to Represent Points in K-Dimensional Space Graphically” Herman Chernoff, Journal of the American Statistical Association (American Statistical Association) 68 (342): 361–368
„Constructing Good Charts and Graphs” Gary Klass, Illinois State University, 2002 http://lilt.ilstu.edu/gmklass/pos138/datadisplay/sections/goodcharts.htm
„Multiscale Visualization Using Data Cubes” Chris Stolte, Diane Tang, Pat Hanrahan, Stanford University, 2002.
34/128
WIZUALIZACJE http://www.informationarchitects.jp/en/ia-trendmap-2007v2 http://marumushi.com/projects/newsmap http://www.time.com/time/covers/20061030/where_we_live/ http://www.crazyegg.com/ http://www.munterbund.de/visualisierung_textaehnlichkeiten/essay.php http://flare.prefuse.org/demo http://www.whc.ki.se/index.php http://strangepaths.com/en/ http://joshualedwell.typepad.com/usability_blog/files/final_vizualization.pdf
35/128
PYTANIA?…/128
Dziękujemy za uwagę!
128/128
Top Related