Wszystkie, część czy troszkę czyli ile

11
„Wszystkie, część czy troszkę czyli ile danych mieć...” Jarosław Żeliński – analityk biznesowy, projektant systemów

description

Czy ogromne ilości danych zawsze poprawiają skuteczność analiz i przewidywania? Nie...

Transcript of Wszystkie, część czy troszkę czyli ile

Page 1: Wszystkie, część czy troszkę czyli ile

„Wszystkie, część czy troszkę czyli ile danych mieć...”

Jarosław Żeliński – analityk biznesowy, projektant systemów

Page 2: Wszystkie, część czy troszkę czyli ile

Agenda

• BigData – co to takiego?• Do badań nie musimy mieć „wszystkiego”• Chmury i zegary – co to takiego?• Trend• Modelowanie• Analiza systemowa• Na zakończenie…

Page 3: Wszystkie, część czy troszkę czyli ile

BigData

• W 2012 roku Gartner uzupełnił podaną wcześniej definicję wskazując, iż „big data to zbiory informacji o dużej objętości, dużej zmienności i/lub dużej różnorodności, które wymagają nowych form przetwarzania w celu:– wspomagania podejmowania

decyzji,– odkrywania nowych zjawisk oraz – optymalizacji procesów”.

Page 4: Wszystkie, część czy troszkę czyli ile

Do badań nie musimy mieć „wszystkiego”.

• Nie będę mówił o tym, że pewne fakty – jako zapisy historii - musimy zachować jako fakty archiwalne (np. wszystkie transakcje sprzedaży).

• Nie będę mówił o tym, że badania statystyczne nie zawsze wymagają wszystkich danych bo nie raz wystarczy „próba reprezentatywna”

• Będę mówił o tym, że do wspomagania podejmowania decyzji i odkrywania nowych zjawisk nie raz wystarczy mało …

Page 5: Wszystkie, część czy troszkę czyli ile

Chmury i zegary

(Karl R. Popper, Wiedza obiektywna, WN PWN 2012r.)

• Pewne systemy, z uwagi na stopień ich złożoności, jesteśmy w stanie jedynie obserwować, przewidywanie ich zachowania jest praktycznie niemożliwe tak jak np. kształt chmur.

• Są także takie systemy, które możemy zrozumieć i których model jesteśmy w stanie zbudować, dzięki czemu te systemy stają się przewidywalne jak zegar.

Page 6: Wszystkie, część czy troszkę czyli ile

Trendy (badanie chmur)

• Próby przewidywania (planowanie, podejmowanie decyzji) metodą analizy trendów są skuteczne dla systemów cechujących się cyklicznością, nawet jeżeli nie potrafimy zbudować ich modelu ich natura pozwala uznać trend jako dobry prognostyk. Taką cechę mają np. wolno zmienne dla nas zjawiska w kosmosie ale już nie rynek, analiza techniczna nie pozwala skutecznie przewidywać.

• Analiza trendów, wbrew pozorom, w ekonomii i rynku nie pozwala na ocenę prawdopodobieństwa ponownego wystąpienia określonych faktów w przyszłości.

Page 7: Wszystkie, część czy troszkę czyli ile

Modelowanie (badanie zegarów)

• Do opracowania modelu systemu wystarczy pewna niewielka, właściwie dobra partia danych, test (dowód poprawności) modelu także nie wymaga wielkich ilości danych historycznych.

Page 8: Wszystkie, część czy troszkę czyli ile

Predykcja

• Celem analizy systemowej jest wspomaganie podejmowania decyzji i odkrywanie nowych zjawisk (nauka).

• Analiza systemowa nie wymaga dużych ilości danych do stawiania hipotez.• Predykcja w analizie systemowej polega na zbudowaniu modelu badanego

systemu, który pod wpływem bodźców zachowuje się (daje efekty) analogicznie do rzeczywistego.

• Optymalizacja procesów biznesowych – o ile uznamy, że jest potrzebna - polega na opracowaniu modelu organizacji, potwierdzeniu, że model jest poprawny (testy), opracowaniu rekomendacji nowego rozwiązania, którym mogą być np. zmiany organizacyjne czy nowe oprogramowanie…

Page 9: Wszystkie, część czy troszkę czyli ile

Na zakończenie…

• Analizy wielkich ilości danych są bardzo przydatne w szukaniu związków między różnymi procesami, zdarzeniami, zachowaniami (analizy korelacyjne, wykrywanie anomalii, itp...). Pozwalają wykrywać nadużycia, kojarzyć pozornie niepowiązane zdarzenia, oceniać wiarygodność faktów w historii.

• Tam gdzie w grę wchodzi przewidywanie (i jego ryzyko) czyli predykcja, ważne jest wcześniejsze zrozumienie natury zjawiska:– Nie ma znaczenia jak wielką ilość historycznych danych o chmurach

zbierzemy, i tak nie będziemy w stanie skutecznie planować ich przyszłego położenia.

– Do przewidzenia tego co pokaże ścienny zegar za kilka miesięcy wystarczy krótka seria faktów o jego zachowaniu z ostatniej doby….

– Kluczem jest zrozumienie (odkrycie) tego, czy badany system to chmura, zegar czy jakiś wariant pośredni.

• Na świecie jest bardzo wielu zwolenników metod indukcyjnych (analiza trendów), jednak niestety przegrywają i z chmurami (bo są nieprzewidywalne) i z zegarami (bo wymagają modelowania a nie statystyki)

Page 10: Wszystkie, część czy troszkę czyli ile

© Jarosław Żeliński IT-Consulting 10

PYTANIA…?

Dziękuję za uwagę…

Jarosław Żeliński – Analityk [email protected]://IT-Consulting.plGSM: 0-608 05 90 20

Page 11: Wszystkie, część czy troszkę czyli ile

O mnie…

Od 1991 roku w branży IT i zarządzaniaOd 1998 roku jako niezależny analityk, projektant i firma IT-Consulting.PlDziesiątki publikacji w prasie branżowej i gospodarczejCzłonek stowarzyszenia doradców gospodarczychWykładowca katedry systemów informacyjnych wydziału przedsiębiorczości akademii morskiej w GdyniKilkudziesięciu odbiorców usług doradczych, małe, średnie i duże firmy zarówno informatyczne jak i ich klienci.Poświadczenie bezpieczeństwa wydane przez ABWByły ekspert przy gabinecie komisji nadzoru finansowego

Projekty analityczne między innymi dla…

Publikacje między innymi w …