Data science - o co chodzi?

Post on 21-Feb-2017

79 views 0 download

Transcript of Data science - o co chodzi?

„Ogarnij się! Zajmij się Data Science!”

Data Science – o co chodzi?

Paweł Jarosz

„Data Science Enthusiast”

2003 - … Politechnika Krakowska, Instytut Informatyki 2007-2008 – COO GridwiseTech 2012 – doktorat PAN 2014-2106 – CSO StrikeTech Mniejsze projekty, konsulting 2015 współzałożyciel Dacison.com Instruktor Indoor Cycling od 2008

Jak jest zachowanie naszych klientów? Czy możemy poprawić obsługę klienta? Jak?

Czy możemy poprawić nasz łańcuch dostaw? Jak zoptymalizować dostawy?

Typowe wyzwania

Gdzie zlokalizować nasz następny sklep?

Jak zaprojektować osiedle?

Typowe wyzwania

Jak dobrać polecane produkty naszym klientom?

Jak ocenić nasze działania marketingowe/PR?

Typowe wyzwania

Zobacz więcej zastosowań

Różne źródła danych:- bazy danych- hurtownie danych- BI- dane rynkowe

Trendy, predykcja, modele zachowań

Decyzja biznesowa

Czego szukamy?

Złożone Niezwiązane ze sobą/luźno związane Żywe Niepewne/obarczone błędem Różnorodne źródła

Źródła danych

AUDYT DANYCH TWOJEJ FIRMY

Łączenie danych

Wizualizacja

Algorytmy różne

Jak to zrobić?

Poprawa produktów/usługNowe możliwości rozwojuZwiększenie efektywności

POPRAWA TWOJEGO BIZNESU – IMPROVE YOUR BUSINESS

Data Science

MatematykaStatystyka

EkonometriaUczenie maszynowe

Wizualizacja….

Sprawdźmy ...

Czy zatem Data Science to coś nowego?

• Ekonometria„nauka pomocnicza w ramach ekonomii, wykorzystująca narzędzia matematyki, statystyki oraz informatyki do badania ilościowych związków zachodzących między zjawiskami i zmiennymi ekonomicznymi. Jest zbiorem metod opracowanych najczęściej poza ekonomią, ale wykorzystywanych na jej polu.”

• Modele statystyczne• „Model statystyczny – hipoteza lub układ hipotez, sformułowanych w sposób matematyczny (odpowiednio w postaci równania lub układu równań), który przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami rzeczywistymi.”

• Metody numeryczne• „Metoda numeryczna – metoda rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane tą drogą wyniki są na ogół

przybliżone, jednak dokładność obliczeń może być z góry określona i dobiera się ją zależnie od potrzeb. Obecnie ta dziedzina matematyki rozwija się bardzo szybko ze względu na liczne zastosowania w informatyce i algorytmice. Metody numeryczne wykorzystywane są wówczas, gdy badany problem nie ma w ogóle rozwiązania analitycznego (danego wzorami) lub korzystanie z takich rozwiązań jest uciążliwe ze względu na ich złożoność.”

• Modelowanie matematyczne – użycie języka matematyki do opisania zachowania jakiegoś układu (na przykład układu automatyki, biologicznego, ekonomicznego, elektrycznego, mechanicznego, termodynamicznego).

Trochę historii – nowa nazwa dla starych pojęć? (Wikipedia)

Kto to jest Data Scientist?

• „Think of him or her as a hybrid of data hacker, analyst, communicator, and trusted adviser. The combination is extremely powerful—and rare.”https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century

• „In my opinion, they are half hacker, half analyst, they use data to build products and find insights”, Monica Rogati, Senior Data Scientist, LinkedIn

Data Scientist

Data Scientist

• „It’s a high-ranking professional with the training and curiosity to make discoveries in the world of data.”• „More than anything, what data scientists do is make discoveries

while swimming in data”https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century

• Silne połączenie obszarów: analizy i modelowania danych, umiejętności technicznych i rozumienia biznesu• Ponadto świetny komunikator

Data Scientist

Uczenie maszynoweBiznes

Python/R

Eksploracja danych

WizualizacjaBazy danych

SPRAWDŹ PEŁNY PROGRAM SZKOLENIOWY DATA SCIENCE

Eksploracja danych, uczenie maszynowe, metody statystyczne, analiza danych, business intelligence

Lepsze decyzje biznesowe Efekt synergii – połączenia razem różnych kompetencji daje siłę

Stare metody, nowe cele

Czy wszystko jest takie piękne?

• Od lat pokolenia używały danych do analizy i stosowały je do podejmowania decyzji.• Bycie “data driven” nie jest czymś zupełnie nowym 

• Nowe są środki które prowadzą do nowych wyzwań• Więcej różnorodnych danych• Nowe metody• Nowe wyzwania

Czy wszystko jest takie piękne?

• Świat niestety jest bardzo zaśmiecony – również świat danych• W 2010 dwóch ekonomistów z Harvardu oblikowało artykuł, w który

ostrzegali że dług US osiąga poziom krytyczny. Okazało się zrobili prosty błąd Excelu• Dane oderwane od kontekstu są mało wartościowe. Dają tylko część

bardzo złożonego obrazu. Bez wiedzy/doświadczenia o konkretnym problemie, dziedzinie trudno jest ocenić wiarygodność danych I wniosków.• Mamy super narzędzia, techniki do przetwarzania, analizy i

przechowywania danych na których się skupiamy – ale zapominamy że musimy zrobić jeszcze naszą robotę tzn. interpretację, rozumienie.

Pięta achillesowa danych

Źródło: playbuzz.com Źródło: intenseopinions.wordpress.com

Data Scientist – Data Detective

Koncepcje muszą być tak szerokie jak natura, jeżeli mają ją ogarnąć.Źródło: Arthur Conan Doyle, Studium w szkarłacie

Nie ma nic nowego pod słońcem. Wszystko wydarzyło się już kiedyś w przeszłości.Źródło: Arthur Conan Doyle, Studium w szkarłacie

Podstawowym błędem jest podawanie teorii, zanim uzyska się dane. Niepostrzeżenie zaczyna się dostosowywać fakty, by zgadzały się z teoriami, zamiast próbować stworzyć teorię, która byłaby zgodna z faktami.

Źródło: Arthur Conan Doyle, Skandal w Bohemii

Zbyt wiele w życiu widziałem, żeby nie wiedzieć, że kobiece przeczucia bywają cenniejsze niż wnioski analityka.

Źródło: Arthur Conan Doyle, Człowiek z blizną

Dobra inspiracja – Sherlock Holmes powiedział ...

Zajmij się Data Science

PROJEKTY DATA SCIENCE

SZKOLENIA DATA SCIENCE

Zapraszam