Sztuka czytania między wierszami - R i Data mining

42
Sztuka czytania między wierszami czyli język R i Data Mining w akcji

description

Slajdy stanowią ramy warsztatu z R i data miningu (poziom podstawowy). Materiały przykładowe z komentarzami w języku polskim: https://gist.github.com/kmrowca/public

Transcript of Sztuka czytania między wierszami - R i Data mining

Page 1: Sztuka czytania między wierszami - R i Data mining

Sztuka czytania między wierszami

czyli język R i Data Mining w akcji

Page 2: Sztuka czytania między wierszami - R i Data mining

Katarzyna Mrowca

<me>

</me>

Page 3: Sztuka czytania między wierszami - R i Data mining
Page 4: Sztuka czytania między wierszami - R i Data mining

The deal

Page 5: Sztuka czytania między wierszami - R i Data mining

Agenda

• Quick glance on theory - Data mining• Exercises on… paper• Quick glance on tool – R console• Exercises – became friend with R• …

Page 6: Sztuka czytania między wierszami - R i Data mining

Agenda

• Quick glance on theory - Data mining• Exercises on… paper• Quick glance on tool – R console• Exercises – became friend with R• …

Exercise

Theory

Page 7: Sztuka czytania między wierszami - R i Data mining

Agenda

• Quick glance on theory - Data preparation• Exercises • Decision trees• Cluser analysis• Text mining• …

Exercise

Theory

Page 8: Sztuka czytania między wierszami - R i Data mining

Agile is everywhere!

Page 9: Sztuka czytania między wierszami - R i Data mining

Agile is everywhere!

• Retro after second break

Page 10: Sztuka czytania między wierszami - R i Data mining

Quick glance on theory!

Page 11: Sztuka czytania między wierszami - R i Data mining

What data mining is?

Page 12: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Page 13: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Data mining (the analysis step of the "Knowledge Discovery in Databases" process, or KDD), [1] an interdisciplinary subfield of computer science,

Page 14: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Data mining (the analysis step of the "Knowledge Discovery in Databases" process, or KDD), an interdisciplinary subfield of computer science, is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics.

Page 15: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Data mining (the analysis step of the "Knowledge Discovery in Databases" process, or KDD), an interdisciplinary subfield of computer science, is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics.

Page 16: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Data mining (the analysis step of the "Knowledge Discovery in Databases" process, or KDD), an interdisciplinary subfield of computer science, is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics.

Page 17: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Data mining (the analysis step of the "Knowledge Discovery in Databases" process, or KDD), an interdisciplinary subfield of computer science, is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics.

Page 18: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Data mining (the analysis step of the "Knowledge Discovery in Databases" process, or KDD), an interdisciplinary subfield of computer science, is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics.

Page 19: Sztuka czytania między wierszami - R i Data mining

What „google” says?

The overall goal of the data mining process is to extract information from a data set and transform it into an understandable structure for further use.

Page 20: Sztuka czytania między wierszami - R i Data mining

What „google” says?

The overall goal of the data mining process is to extract information from a data set and transform it into an understandable structure for further use.

Page 21: Sztuka czytania między wierszami - R i Data mining

What „google” says?

The overall goal of the data mining process is to extract information from a data set and transform it into an understandable structure for further use.

Page 22: Sztuka czytania między wierszami - R i Data mining

What „google” says?

Aside from the raw analysis step, it involves database and data management aspects, data pre-processing, model and inference considerations, interestingness metrics, complexity considerations, post-processing of discovered structures, visualization, and online updating.

Source: wikipedia

Page 23: Sztuka czytania między wierszami - R i Data mining

Data mining – what is „inside”

• Predictive• Regression• Classification• Collaborative Filtering

• Descriptive• Clustering / similarity matching• Association rules and variants• Deviation detection

Page 24: Sztuka czytania między wierszami - R i Data mining

Data mining – what is „inside”

• Predictive:• Regression• Classification• Collaborative Filtering

• Descriptive:• Clustering / similarity matching• Association rules and variants• Deviation detection

Page 25: Sztuka czytania między wierszami - R i Data mining

Data mining – what is „inside”

• Predictive:• Regression• Classification• Collaborative Filtering

• Descriptive:• Clustering / similarity matching• Association rules and variants• Deviation detection

Page 26: Sztuka czytania między wierszami - R i Data mining

What data mining is not?

Page 27: Sztuka czytania między wierszami - R i Data mining

Why Data Mining is so popular?

Page 28: Sztuka czytania między wierszami - R i Data mining

What is a difference between statistics and data mining?

Page 29: Sztuka czytania między wierszami - R i Data mining

Exercise

Page 30: Sztuka czytania między wierszami - R i Data mining

Data preparation

Page 31: Sztuka czytania między wierszami - R i Data mining

Variables

Page 32: Sztuka czytania między wierszami - R i Data mining

Qualitative & Quantitative

Page 33: Sztuka czytania między wierszami - R i Data mining

Tame R console!

Page 34: Sztuka czytania między wierszami - R i Data mining

Take a break

Page 35: Sztuka czytania między wierszami - R i Data mining

Regression

Page 36: Sztuka czytania między wierszami - R i Data mining

Time series

Page 37: Sztuka czytania między wierszami - R i Data mining

Decision trees

Page 38: Sztuka czytania między wierszami - R i Data mining

Regression trees

Page 39: Sztuka czytania między wierszami - R i Data mining

Classification trees

Page 40: Sztuka czytania między wierszami - R i Data mining

K means

Page 41: Sztuka czytania między wierszami - R i Data mining

Text mining

Page 42: Sztuka czytania między wierszami - R i Data mining

Thank you!