Praktyczne podejście do Machine Learning -...

15
Praktyczny wstęp do Machine Learning Mateusz Rogowski

Transcript of Praktyczne podejście do Machine Learning -...

Page 1: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

Praktyczny wstęp do Machine Learning

Mateusz Rogowski

Page 2: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

2

#DataScience

#MachineLearning

#DeepLearning

Page 3: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

3

Machine Learning - zastosowania

Wykrywanie anomalii● Oszustwa

● Włamania

● Katastrofy naturalne

● Defekty przemysłowe

● Monitoring zdrowia

Page 4: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

4

Machine Learning - zastosowania

Klasyfikacja● Automatyczne kategorie postów

● Wykrywanie typu choroby

● Kategoryzacja obrazów

● Wykrywanie twarzy

Page 5: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

5

Machine Learning - zastosowania

Predykcja● Wartości akcji

● Nakład produkcji

● Obciążenie serwerów

● Termin wyjścia ze szpitala

Page 6: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

7

#DataScience

#MachineLearning

#DeepLearning

#Python

Page 7: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

8http://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html

Page 8: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

9https://www.ibm.com/developerworks/community/blogs/jfp/entry/What_Language_Is_Best_For_Machine_Learning_And_Data_Science

Page 9: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

10

Keras

Page 10: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

12

scikit-learn

● Proste i wydajne narzędzia do analizowania danych

● Powszechnie dostępne, uniwersalne

● Zbudowane w oparciu o biblioteki NumPy, SciPy i matplotlib

● Open source na licencji BSD – można wykorzystywać komercyjnie

Page 11: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

13

scikit-learn – główne moduły

Klasyfikacja

Regresja

Klastrowanie

Redukcja wymiarów

Selekcja modelu

Wstępne przetwarzanie

Page 12: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

14

scikit-learn - zalety

Jednolity interfejs klasyfikatorów

fit(X,y)

predict(X)

predict_proba(X)

Optymalna implementacja

C + Fortran + Cython

wielowątkowość

Page 13: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

15

scikit-learn - zalety

Duży zakres dostępnych funcjonalności

● gotowe zestawy testowe,

● próbkowanie zestawów danych (train_test_split, StratiffiedShuffleSplit)

● automatyczne dopasowanie parametrów (grid_search)

● różne sposoby oceniania wyników (accuracy, precision, recall, F1)

● duża ilość dostępnych algorytmów (klasyfikatory, regresory, grupowanie)

Page 14: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

16

Przebieg tworzenia modelu

DATASETRAWDATA

MACHINELEARNING

MODEL

Page 15: Praktyczne podejście do Machine Learning - PyWawpywaw.org/media/slides/pywaw-64-praktyczny-wstep-do...Proste i wydajne narzędzia do analizowania danych Powszechnie dostępne, uniwersalne

17

scikit-learn

Przykładowy notebook