DATA MINING

Post on 02-Jan-2016

39 views 0 download

description

DATA MINING. w ekonomii, finansach i towaroznawstwie. Data Mining. spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, „przekopywanie” danych, „męczenie” danych - PowerPoint PPT Presentation

Transcript of DATA MINING

w ekonomii, finansach i towaroznawstwie

spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, „przekopywanie” danych, „męczenie” danych

proces wykrywania zależności w zbiorach danych poprzez połączenie metod statystyki i sztucznej inteligencji (AI) z zarządzaniem bazami danych

przejście od (obszernych) danych surowych do wiedzy (Knowledge Discovery in Databases - KDD)

2

statystyczna analiza wielowymiarowa uczenie maszynowe (Machine Learning) /

sztuczna inteligencja (AI) / metody obliczeń miękkich (Soft Computing)

analiza szeregów czasowych logika matematyczna metody numeryczne systemy baz danych (relacyjne bazy

danych)

3

eksploracyjny data mining (eksploracyjna analiza danych, „drążenie danych”)

predykcyjny data mining (konstrukcja modeli opisujących prawidłowości odkryte w poprzednim etapie postępowania)

4

sztuczne sieci neuronowe (ANN) metody sztucznej inteligencji (m. in. algorytmy

genetyczne) drzewa decyzyjne (metoda RP) metody logiki rozmytej metody statystycznej analizy wielowymiarowej

(metoda składowych głównych, analiza kanoniczna, analiza dyskryminacyjna)

analiza skupień (klasteryzacja) skalowanie wielowymiarowe / wizualizacja danych analiza asocjacji i sekwencji relacyjny data mining text mining oraz web mining modele zespołowe / modele hybrydowe

5

podejście modelowe w rozwiązywaniu zagadnienia podejście konfirmacyjne (statystyka) / podejście

indukcyjne (DM) zastosowanie metod parametrycznych (statystyka) /

zastoosowanie metod nieparametrycznych (DM) zastosowanie miar statystycznych dla pomiaru jakości

dopasowania i jakości prognostycznej modelu weryfikacja dobroci dopasowania modelu w oparciu o

dane, które posłużyły do estymacji modelu (statystyka) / weryfikacja modelu w oparciu o niezależną próbę testową (DM)

podejście ilościowe do analizy danych pośrednia (statystyka) / bezpośrednia (DM) możliwość

optymalizacji modelu w oparciu o kryterium merytoryczne np. finansowe

6

systemy scoringu kredytowego, fraudowego (modele zmiennej jakościowej, ANN, SVM, logika rozmyta)

modele wczesnego ostrzegania np. przed bankructwem (modele zmiennej jakościowej, ANN)

Systemy transakcyjne (systemy spekulacyjne oparte o modele AI, pair trading/ arbitraż statystyczny, wykrywanie formacji analizy technicznej, text mining)

grupowanie spółek akcyjnych podobnych na gruncie analizy fundamentalnej (analiza skupień)

7

wielowymiarowa analiza rozwoju gospodarczego krajów, regionów i innych jednostek terytorialnych (analiza skupień, mierniki syntetyczne, skalowanie wielowymiarowe)

aCRM (segmentacja rynku, marketing bezpośredni)

wycena nieruchomości, ocena stanu technicznego nieruchomości

mikroekonometria (modelowanie decyzji jednostkowych)

modele wczesnego ostrzegania przed kryzysem walutowym

8

SPC / QC Data Mining (badanie stabilności statystycznej procesu, wczesne ostrzeganie przed rozregulowaniem procesu wieloetapowego)

chemometria (czerpie z metod statystyki wielowymiarowej)

statystyczne zapewnianie jakości analiz laboratoryjnych (walidacja parametrów, kalibracja, analityczne karty kontrolne)

przetwarzanie sygnałów w analizie instrumentalnej (analiza widmowa)

9

biostatystyka meteorologia i monitoring stanu powietrza

(np. modele opadu-przepływu, prognozowanie szczytowego zanieczyszczenia)

dynamiczne badanie poparcia politycznego (testowanie występowania procesu o długiej pamięci ARFIMA)

oraz wiele, wiele innych

10

R – język i środowisko programowania STATISTICA gretl EViews STATA SAS SPSS MATLAB Weka JMulTi GAUSS Mplus inne

11

PMML (Predictive Model Markup Language) SQL MQL5 (MetaQuotes Language)/MetaTrader –

dla Algotradingu LATEX (LeD) – sporządzanie publikacji

12

DZIĘKUJĘ ZA UWAGĘ!

13