Data science - o co chodzi?

23
„Ogarnij się! Zajmij się Data Science!” Data Science – o co chodzi?

Transcript of Data science - o co chodzi?

Page 1: Data science - o co chodzi?

„Ogarnij się! Zajmij się Data Science!”

Data Science – o co chodzi?

Page 2: Data science - o co chodzi?

Paweł Jarosz

„Data Science Enthusiast”

2003 - … Politechnika Krakowska, Instytut Informatyki 2007-2008 – COO GridwiseTech 2012 – doktorat PAN 2014-2106 – CSO StrikeTech Mniejsze projekty, konsulting 2015 współzałożyciel Dacison.com Instruktor Indoor Cycling od 2008

Page 3: Data science - o co chodzi?
Page 4: Data science - o co chodzi?

Jak jest zachowanie naszych klientów? Czy możemy poprawić obsługę klienta? Jak?

Czy możemy poprawić nasz łańcuch dostaw? Jak zoptymalizować dostawy?

Typowe wyzwania

Page 5: Data science - o co chodzi?

Gdzie zlokalizować nasz następny sklep?

Jak zaprojektować osiedle?

Typowe wyzwania

Page 6: Data science - o co chodzi?

Jak dobrać polecane produkty naszym klientom?

Jak ocenić nasze działania marketingowe/PR?

Typowe wyzwania

Zobacz więcej zastosowań

Page 7: Data science - o co chodzi?

Różne źródła danych:- bazy danych- hurtownie danych- BI- dane rynkowe

Trendy, predykcja, modele zachowań

Decyzja biznesowa

Czego szukamy?

Page 8: Data science - o co chodzi?

Złożone Niezwiązane ze sobą/luźno związane Żywe Niepewne/obarczone błędem Różnorodne źródła

Źródła danych

AUDYT DANYCH TWOJEJ FIRMY

Page 9: Data science - o co chodzi?

Łączenie danych

Wizualizacja

Algorytmy różne

Jak to zrobić?

Page 10: Data science - o co chodzi?

Poprawa produktów/usługNowe możliwości rozwojuZwiększenie efektywności

POPRAWA TWOJEGO BIZNESU – IMPROVE YOUR BUSINESS

Data Science

MatematykaStatystyka

EkonometriaUczenie maszynowe

Wizualizacja….

Page 11: Data science - o co chodzi?

Sprawdźmy ...

Czy zatem Data Science to coś nowego?

Page 12: Data science - o co chodzi?

• Ekonometria„nauka pomocnicza w ramach ekonomii, wykorzystująca narzędzia matematyki, statystyki oraz informatyki do badania ilościowych związków zachodzących między zjawiskami i zmiennymi ekonomicznymi. Jest zbiorem metod opracowanych najczęściej poza ekonomią, ale wykorzystywanych na jej polu.”

• Modele statystyczne• „Model statystyczny – hipoteza lub układ hipotez, sformułowanych w sposób matematyczny (odpowiednio w postaci równania lub układu równań), który przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami rzeczywistymi.”

• Metody numeryczne• „Metoda numeryczna – metoda rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane tą drogą wyniki są na ogół

przybliżone, jednak dokładność obliczeń może być z góry określona i dobiera się ją zależnie od potrzeb. Obecnie ta dziedzina matematyki rozwija się bardzo szybko ze względu na liczne zastosowania w informatyce i algorytmice. Metody numeryczne wykorzystywane są wówczas, gdy badany problem nie ma w ogóle rozwiązania analitycznego (danego wzorami) lub korzystanie z takich rozwiązań jest uciążliwe ze względu na ich złożoność.”

• Modelowanie matematyczne – użycie języka matematyki do opisania zachowania jakiegoś układu (na przykład układu automatyki, biologicznego, ekonomicznego, elektrycznego, mechanicznego, termodynamicznego).

Trochę historii – nowa nazwa dla starych pojęć? (Wikipedia)

Page 13: Data science - o co chodzi?

Kto to jest Data Scientist?

Page 14: Data science - o co chodzi?

• „Think of him or her as a hybrid of data hacker, analyst, communicator, and trusted adviser. The combination is extremely powerful—and rare.”https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century

• „In my opinion, they are half hacker, half analyst, they use data to build products and find insights”, Monica Rogati, Senior Data Scientist, LinkedIn

Data Scientist

Page 15: Data science - o co chodzi?

Data Scientist

• „It’s a high-ranking professional with the training and curiosity to make discoveries in the world of data.”• „More than anything, what data scientists do is make discoveries

while swimming in data”https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century

Page 16: Data science - o co chodzi?

• Silne połączenie obszarów: analizy i modelowania danych, umiejętności technicznych i rozumienia biznesu• Ponadto świetny komunikator

Data Scientist

Uczenie maszynoweBiznes

Python/R

Eksploracja danych

WizualizacjaBazy danych

SPRAWDŹ PEŁNY PROGRAM SZKOLENIOWY DATA SCIENCE

Page 17: Data science - o co chodzi?

Eksploracja danych, uczenie maszynowe, metody statystyczne, analiza danych, business intelligence

Lepsze decyzje biznesowe Efekt synergii – połączenia razem różnych kompetencji daje siłę

Stare metody, nowe cele

Page 18: Data science - o co chodzi?

Czy wszystko jest takie piękne?

Page 19: Data science - o co chodzi?

• Od lat pokolenia używały danych do analizy i stosowały je do podejmowania decyzji.• Bycie “data driven” nie jest czymś zupełnie nowym 

• Nowe są środki które prowadzą do nowych wyzwań• Więcej różnorodnych danych• Nowe metody• Nowe wyzwania

Czy wszystko jest takie piękne?

Page 20: Data science - o co chodzi?

• Świat niestety jest bardzo zaśmiecony – również świat danych• W 2010 dwóch ekonomistów z Harvardu oblikowało artykuł, w który

ostrzegali że dług US osiąga poziom krytyczny. Okazało się zrobili prosty błąd Excelu• Dane oderwane od kontekstu są mało wartościowe. Dają tylko część

bardzo złożonego obrazu. Bez wiedzy/doświadczenia o konkretnym problemie, dziedzinie trudno jest ocenić wiarygodność danych I wniosków.• Mamy super narzędzia, techniki do przetwarzania, analizy i

przechowywania danych na których się skupiamy – ale zapominamy że musimy zrobić jeszcze naszą robotę tzn. interpretację, rozumienie.

Pięta achillesowa danych

Page 21: Data science - o co chodzi?

Źródło: playbuzz.com Źródło: intenseopinions.wordpress.com

Data Scientist – Data Detective

Page 22: Data science - o co chodzi?

Koncepcje muszą być tak szerokie jak natura, jeżeli mają ją ogarnąć.Źródło: Arthur Conan Doyle, Studium w szkarłacie

Nie ma nic nowego pod słońcem. Wszystko wydarzyło się już kiedyś w przeszłości.Źródło: Arthur Conan Doyle, Studium w szkarłacie

Podstawowym błędem jest podawanie teorii, zanim uzyska się dane. Niepostrzeżenie zaczyna się dostosowywać fakty, by zgadzały się z teoriami, zamiast próbować stworzyć teorię, która byłaby zgodna z faktami.

Źródło: Arthur Conan Doyle, Skandal w Bohemii

Zbyt wiele w życiu widziałem, żeby nie wiedzieć, że kobiece przeczucia bywają cenniejsze niż wnioski analityka.

Źródło: Arthur Conan Doyle, Człowiek z blizną

Dobra inspiracja – Sherlock Holmes powiedział ...

Page 23: Data science - o co chodzi?

Zajmij się Data Science

PROJEKTY DATA SCIENCE

SZKOLENIA DATA SCIENCE

Zapraszam