[WebMuses] Bajki z krainy danych

27
Bajki z krainy danych Tudzież: czy wiem co robię? Opowie @przemur z

description

Polska wersja opowiastki o krasnalach i analizie danych.

Transcript of [WebMuses] Bajki z krainy danych

Page 1: [WebMuses] Bajki z krainy danych

Bajki z krainy danychTudzież: czy wiem co robię?

Opowie @przemur z

Page 2: [WebMuses] Bajki z krainy danych
Page 3: [WebMuses] Bajki z krainy danych

Historia…

Page 4: [WebMuses] Bajki z krainy danych
Page 5: [WebMuses] Bajki z krainy danych
Page 6: [WebMuses] Bajki z krainy danych
Page 7: [WebMuses] Bajki z krainy danych
Page 8: [WebMuses] Bajki z krainy danych

Suspens!

Page 9: [WebMuses] Bajki z krainy danych
Page 10: [WebMuses] Bajki z krainy danych

>?

Page 11: [WebMuses] Bajki z krainy danych

Co zrobiłby krasnalowy Chief Data Scientist?

Page 12: [WebMuses] Bajki z krainy danych
Page 13: [WebMuses] Bajki z krainy danych

Nowi krasnale dostają nowy typ młota

Stary typ młota

Page 14: [WebMuses] Bajki z krainy danych

R

Page 15: [WebMuses] Bajki z krainy danych

install.packages('ggplot2') require('ggplot2') setwd("/Users/pmm/Desktop/hammer") all <- read.csv(file="all.csv")

qplot(all$month_sequence, all$dwarfs) + geom_smooth() qplot(all$month_sequence, all$production) + geom_smooth()

all$prod_per_dwarf <- all$production / all$dwarfs qplot(all$month_sequence, all$prod_per_dwarf) + geom_smooth()

Page 16: [WebMuses] Bajki z krainy danych

Nowe młoty dla krasnali od tego miesiąca…

Page 17: [WebMuses] Bajki z krainy danych

Średnia produkcja złota na jednego krasnala

Page 18: [WebMuses] Bajki z krainy danych

Ktoś widzi jakiś problem? :)

Page 19: [WebMuses] Bajki z krainy danych

Produkcja dla danego krasnala w kolejnych miesiącach od jego przyjścia.

Używający stare młoty

Używający nowe młoty

Page 20: [WebMuses] Bajki z krainy danych

Produkcja dla danego krasnala w kolejnych miesiącach od jego przyjścia.

Używający stare młoty

Używający nowe młoty

LutyMarzec

Page 21: [WebMuses] Bajki z krainy danych

Produkcja dla danego krasnala w kolejnych miesiącach od jego przyjścia.

Używający stare młoty

Używający nowe młoty

lipiecsierpień

Page 22: [WebMuses] Bajki z krainy danych

R

Page 23: [WebMuses] Bajki z krainy danych

new <- read.csv(file="new_relative.csv") old <- read.csv(file="old_relative.csv")

qplot(new$relative_month, new$production) ggplot(new, aes(x=relative_month, y=production)) + geom_point(shape=19, position=position_jitter(width=.5,height=0), alpha=.2)

# Tak bedzie ladniej:old$type='old' new$type='new' old_and_new = rbind(old,new) ggplot(old_and_new, aes(x=relative_month, y=production, color=type)) + geom_point(shape=19, position=position_jitter(width=.5,height=0), alpha=.2)

Page 24: [WebMuses] Bajki z krainy danych
Page 25: [WebMuses] Bajki z krainy danych

ggplot(old_and_new, aes(x=relative_month, y=production, color=type)) + geom_point(shape=19, position=position_jitter(width=.5,height=0), alpha=.1) + geom_smooth(method=lm)

Page 26: [WebMuses] Bajki z krainy danych

Nowe młoty zużywają się dużo szybciej!

Page 27: [WebMuses] Bajki z krainy danych

Lekcje? :)• Warto:

• wiedzieć co się robi

• zadawać pytania

• być trochę podejrzliwym (przynajmniej jeśli chodzi o wyniki)

• używać R i ggplot2

• Nie warto:

• ufać wykresom ,,w ciemno’’