Micha‚ Korzycki @ SFI

download Micha‚ Korzycki @ SFI

of 37

  • date post

    06-Apr-2017
  • Category

    Science

  • view

    703
  • download

    3

Embed Size (px)

Transcript of Micha‚ Korzycki @ SFI

  • Micha Korzycki

    Data Scientist - zawd przyszoci

    The Sexiest Job of the 21st Century

  • Micha Korzycki

    Katedra Informatyki AGH

    Data Mining

    Wspczesna Alchemia

  • Micha Korzycki

    Katedra Informatyki AGH

    Data Mining

    Wspczesna Alchemia

  • Data scientist (pl. Mistrz Danych) termin okrelajcy

    zawd osoby zajmujcej si analiz danych

    nieuporzdkowanych, w szczeglnoci bigdata.

    Data Scientist: The Sexiest Job of the 21st Century

    Harvard Business Review

    Data Scientist

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • There were 5 Exabytes of information created between the dawn of civilization through 2003, but that much information is nocreated every 2 days.

    Googles CEO, Eric Schmidt, 2010 Google Atmosphere Convention

    Data ...

  • 1000 Bajtw = 1 Kilobajt

    1000 Kilobajtw = 1 Megabajt

    1000 Megabajtw = 1 Gigabajt

    1000 Gigabajtw = 1 Terabajt

    1000 Terabajtw = 1 Petabajt

    1000 Petabajtw = 1 Eksabajt

    1000 Exabajtw = 1 Zettabajt

    Digital Universe: ilo danych stworzonych w 2010r. to 1.2 Zettabajtw

    ~ ok. 6.8 Eksabajtw na 2 dni

    Data ...

  • Mdro tumw (Wisdom of the Crowds) Rekomendacje produktowe Analiza ryzyka Badania epidemiologiczne Bioinformatyka Dostosowywanie informacji w czasie rzeczywistym Dostosowanie leczenia do pacjenta Inteligentne miasta ... i wiele, wiele innych

    Data ...

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • Drew Conway Venn Diagram

  • http://tylervigen.com/view_correlation?id=1703

    Margaryna w Data Science ...

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • Specjalizacja

    Researcher: 54.3% Computer Scientist: 52.3% BI Analyst: 36% Mathematician: 19% Educator: 18.3% Entrepreneur: 12.4%http://info.crowdflower.com/2015-data-scientist-report

    Data Scientist

  • Sta i dowiadczenie

  • Obowizki

    Predictive Analysis: 53.6% Mining Data for Patterns: 52.3% Interacting with Data: 49.7%http://info.crowdflower.com/2015-data-scientist-report

    Data Scientist

  • Top 3 tools

    Excel: 55.6% R: 43.1% Tableau: 26.1%http://info.crowdflower.com/2015-data-scientist-report

    Data Scientist

  • #1 challenge

    Cleaning and Organizing Data: 66.7% Poor quality data: 52.3%

    #2 Challenge

    Not enough data scientists: 80% Insufficient time: 40% Limited tools: 30% Limited ability: 30%http://info.crowdflower.com/2015-data-scientist-report

    Data Scientist

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Fundamentals Statistics Programming Machine Learning Text Mining / Natural Language Processing Data Visualization Big Data Data Ingestion Data Munging Toolbox

    Swami Chandrasekaran

    Data Scientist

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • Data Science jobs pay an average of $118,000 per year

    It is estimated that by 2018, US could have a shortage of 140,000+ people with advanced analytical skills & need 1.5M managers/analysts that can make decisions based on data analysis

    The Global Information Technology Report 2012

    Data Scientist

  • Lean Startup

  • Skd si bior dane ? Co to jest data science ? Kto si tym zajmuje ? Kim jest Data Scientist ? Jakie narzdzia, technologie s wane dla data science ? To czego musz si jeszcze douczy ? Jakie s perspektywy z tak specjalizacj ? Skd czerpa wiedz i inspiracj ?

    Data Scientist

  • Python Fundamentals Codecademy Machine Learning Coursera / Stanford Data Analyst Nanodegree Udacity http://www.kdnuggets.com/ https://www.kaggle.com/ Bd DataKind - pomagaj innym z danymi Korzystaj z publicznie dostpnych baz z danymi Bierz udzia w zawodach (Patrz: Kaggle)

    rda wiedzy i inspiracji

  • Ksiki

  • Dzikuj !!!