Data science - o co chodzi?
-
Upload
pawel-jarosz -
Category
Data & Analytics
-
view
79 -
download
0
Transcript of Data science - o co chodzi?
„Ogarnij się! Zajmij się Data Science!”
Data Science – o co chodzi?
Paweł Jarosz
„Data Science Enthusiast”
2003 - … Politechnika Krakowska, Instytut Informatyki 2007-2008 – COO GridwiseTech 2012 – doktorat PAN 2014-2106 – CSO StrikeTech Mniejsze projekty, konsulting 2015 współzałożyciel Dacison.com Instruktor Indoor Cycling od 2008
Jak jest zachowanie naszych klientów? Czy możemy poprawić obsługę klienta? Jak?
Czy możemy poprawić nasz łańcuch dostaw? Jak zoptymalizować dostawy?
Typowe wyzwania
Gdzie zlokalizować nasz następny sklep?
Jak zaprojektować osiedle?
Typowe wyzwania
Jak dobrać polecane produkty naszym klientom?
Jak ocenić nasze działania marketingowe/PR?
Typowe wyzwania
Zobacz więcej zastosowań
Różne źródła danych:- bazy danych- hurtownie danych- BI- dane rynkowe
Trendy, predykcja, modele zachowań
Decyzja biznesowa
Czego szukamy?
Złożone Niezwiązane ze sobą/luźno związane Żywe Niepewne/obarczone błędem Różnorodne źródła
Źródła danych
AUDYT DANYCH TWOJEJ FIRMY
Łączenie danych
Wizualizacja
Algorytmy różne
Jak to zrobić?
Poprawa produktów/usługNowe możliwości rozwojuZwiększenie efektywności
POPRAWA TWOJEGO BIZNESU – IMPROVE YOUR BUSINESS
Data Science
MatematykaStatystyka
EkonometriaUczenie maszynowe
Wizualizacja….
Sprawdźmy ...
Czy zatem Data Science to coś nowego?
• Ekonometria„nauka pomocnicza w ramach ekonomii, wykorzystująca narzędzia matematyki, statystyki oraz informatyki do badania ilościowych związków zachodzących między zjawiskami i zmiennymi ekonomicznymi. Jest zbiorem metod opracowanych najczęściej poza ekonomią, ale wykorzystywanych na jej polu.”
• Modele statystyczne• „Model statystyczny – hipoteza lub układ hipotez, sformułowanych w sposób matematyczny (odpowiednio w postaci równania lub układu równań), który przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami rzeczywistymi.”
• Metody numeryczne• „Metoda numeryczna – metoda rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane tą drogą wyniki są na ogół
przybliżone, jednak dokładność obliczeń może być z góry określona i dobiera się ją zależnie od potrzeb. Obecnie ta dziedzina matematyki rozwija się bardzo szybko ze względu na liczne zastosowania w informatyce i algorytmice. Metody numeryczne wykorzystywane są wówczas, gdy badany problem nie ma w ogóle rozwiązania analitycznego (danego wzorami) lub korzystanie z takich rozwiązań jest uciążliwe ze względu na ich złożoność.”
• Modelowanie matematyczne – użycie języka matematyki do opisania zachowania jakiegoś układu (na przykład układu automatyki, biologicznego, ekonomicznego, elektrycznego, mechanicznego, termodynamicznego).
Trochę historii – nowa nazwa dla starych pojęć? (Wikipedia)
Kto to jest Data Scientist?
• „Think of him or her as a hybrid of data hacker, analyst, communicator, and trusted adviser. The combination is extremely powerful—and rare.”https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century
• „In my opinion, they are half hacker, half analyst, they use data to build products and find insights”, Monica Rogati, Senior Data Scientist, LinkedIn
Data Scientist
Data Scientist
• „It’s a high-ranking professional with the training and curiosity to make discoveries in the world of data.”• „More than anything, what data scientists do is make discoveries
while swimming in data”https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century
• Silne połączenie obszarów: analizy i modelowania danych, umiejętności technicznych i rozumienia biznesu• Ponadto świetny komunikator
Data Scientist
Uczenie maszynoweBiznes
Python/R
Eksploracja danych
WizualizacjaBazy danych
SPRAWDŹ PEŁNY PROGRAM SZKOLENIOWY DATA SCIENCE
Eksploracja danych, uczenie maszynowe, metody statystyczne, analiza danych, business intelligence
Lepsze decyzje biznesowe Efekt synergii – połączenia razem różnych kompetencji daje siłę
Stare metody, nowe cele
Czy wszystko jest takie piękne?
• Od lat pokolenia używały danych do analizy i stosowały je do podejmowania decyzji.• Bycie “data driven” nie jest czymś zupełnie nowym
• Nowe są środki które prowadzą do nowych wyzwań• Więcej różnorodnych danych• Nowe metody• Nowe wyzwania
Czy wszystko jest takie piękne?
• Świat niestety jest bardzo zaśmiecony – również świat danych• W 2010 dwóch ekonomistów z Harvardu oblikowało artykuł, w który
ostrzegali że dług US osiąga poziom krytyczny. Okazało się zrobili prosty błąd Excelu• Dane oderwane od kontekstu są mało wartościowe. Dają tylko część
bardzo złożonego obrazu. Bez wiedzy/doświadczenia o konkretnym problemie, dziedzinie trudno jest ocenić wiarygodność danych I wniosków.• Mamy super narzędzia, techniki do przetwarzania, analizy i
przechowywania danych na których się skupiamy – ale zapominamy że musimy zrobić jeszcze naszą robotę tzn. interpretację, rozumienie.
Pięta achillesowa danych
Źródło: playbuzz.com Źródło: intenseopinions.wordpress.com
Data Scientist – Data Detective
Koncepcje muszą być tak szerokie jak natura, jeżeli mają ją ogarnąć.Źródło: Arthur Conan Doyle, Studium w szkarłacie
Nie ma nic nowego pod słońcem. Wszystko wydarzyło się już kiedyś w przeszłości.Źródło: Arthur Conan Doyle, Studium w szkarłacie
Podstawowym błędem jest podawanie teorii, zanim uzyska się dane. Niepostrzeżenie zaczyna się dostosowywać fakty, by zgadzały się z teoriami, zamiast próbować stworzyć teorię, która byłaby zgodna z faktami.
Źródło: Arthur Conan Doyle, Skandal w Bohemii
Zbyt wiele w życiu widziałem, żeby nie wiedzieć, że kobiece przeczucia bywają cenniejsze niż wnioski analityka.
Źródło: Arthur Conan Doyle, Człowiek z blizną
Dobra inspiracja – Sherlock Holmes powiedział ...
Zajmij się Data Science
PROJEKTY DATA SCIENCE
SZKOLENIA DATA SCIENCE
Zapraszam