I EKSPLORACJA DANYCH

18
I EKSPLORACJA DANYCH sploracja danych: literatura Pyle D., Data preparation for Data Mining, Morgan Kaufmann Publishers, Academic Press, 1999 Larose D.T., Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, Warszawa 2006, Hand, D., Mannila H., Smyth P., Eksploracja danych, Wydawnictwo NT, Warszawa 2005 Witten I.H., Frank E., Data Mining. Practical Machine Learning Tools and Technics, Elsevier 2005 Han J., Kamber M., Data Mining. Concepts and Techniques, Morgan Kaufmann Publishers 2001 Hand, D., Mannila H., Smyth P., Principles of Data Mining, The MIT Press 2001

description

I EKSPLORACJA DANYCH. Eksploracja danych: literatura. Pyle D., Data preparation for Data Mining, Morgan Kaufmann Publishers, Academic Press, 1999. Han J., Kamber M., Data Mining. Concepts and Techniques, Morgan Kaufmann Publishers 2001. - PowerPoint PPT Presentation

Transcript of I EKSPLORACJA DANYCH

Page 1: I              EKSPLORACJA DANYCH

I EKSPLORACJA DANYCH

Eksploracja danych: literatura• Pyle D., Data preparation for Data Mining, Morgan Kaufmann Publishers, Academic Press, 1999

• Larose D.T., Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, Warszawa 2006,

• Hand, D., Mannila H., Smyth P., Eksploracja danych, Wydawnictwo NT, Warszawa 2005

• Witten I.H., Frank E., Data Mining. Practical Machine Learning Tools and Technics, Elsevier 2005

• Han J., Kamber M., Data Mining. Concepts and Techniques, Morgan Kaufmann Publishers 2001

• Hand, D., Mannila H., Smyth P., Principles of Data Mining, The MIT Press 2001

Page 2: I              EKSPLORACJA DANYCH

I EKSPLORACJA DANYCH

Eksploracja danych: a może inaczej?

• drążenie danych

• odkrywanie wiedzy z baz danych (KDD)

• wydobywanie danych

• ekstrakcja danych

• pozyskiwanie wiedzy

Explōrātiō [łac.] badanie nieznanych dziedzin lub terenów.

Page 3: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:

• przeszukiwanie zbiorów (ogromnych) danych

• i wiele innych

• analiza w celu wykrycia nieoczekiwanych związków (synergia)

• proces wspomaganego odkrywania nietrywialnych, dotychczas nieznanych użytecznych reguł, wzorców, schematów

• wydobywanie wiedzy z danych zgromadzonych w zupełnie innym celu

I EKSPLORACJA DANYCH

Page 4: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• przeszukiwanie zbiorów (ogromnych) danych

Za duże uznajemy takie zbiory danych, których

człowiek nie jest w stanie objąć i wykorzystaćbez pomocy komputera i specjalistycznego oprogramowania.

Bardzo często w praktyce spotykamy się z sytuacją, gdy danych jest za dużo, a głównym zadaniem we wnioskowaniu z danych jest odsianie bezużytecznej informacji. Taką sytuację podsumowujemy stwierdzeniem, że toniemy w danych.

I EKSPLORACJA DANYCH

Page 5: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• przeszukiwanie zbiorów (ogromnych) danych

Barclaycard operator kart płatniczych obsługuje 350 milionów transakcji rocznie [2000]WAL*MART sprzedawca detaliczny dokonuje ponad 7 miliardów transakcji rocznie [1994] i zbudował 11 terabajtową bazę danych transakcji z klientami [1998]AT&T operator telefoniczny łączy co roku 70 miliardów rozmów długodystansowych [1997]

Mobil przechowuje ponad 100 terabajtów danych związanych z wydobyciem ropy naftowej [1993]NASA Earth Observing Project uruchomiony na przełomie wieków miał gromadzić 50 gigabajtów co godzinę [1996]

I EKSPLORACJA DANYCH

Page 6: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• przeszukiwanie zbiorów (ogromnych) danych

I EKSPLORACJA DANYCH

Page 7: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• wydobywanie wiedzy z danych zgromadzonych w zupełnie innym celu

I EKSPLORACJA DANYCH

MARCPOL S.A.05-092 Łomianki, ul. Poniatowskiego 2Sklep ul. Ożarowska 61, 01-416 Warsza

NIP 119-16-33-13925,09,07 51001

Paragon fiskalnyD POMIDOR ŻÓŁTY PDG LUZ

0,474*8,85- 4,19DD GRUSZKA ZIELONA 0,542*4,79 2,60DB BANAN 0,316*4,59- 1,45BB SOBS.SALAMI MAZOWIECKIE L

0,134*19,39- 2,60BB GJ TATAR 250G 1*7,29- 7,29BB GJ TATAR 250G 1*7,29- 7,29BB BERT. SER TOP. EMENTAL 100

1*1,95- 1,95BB BERT. SER TOP. EMENTAL 100

1*1,95- 1,95BB BERT. SER TOP. EMENTAL 100

1*1,95- 1,95B

Sprzed. opodat. PTU BPTU B 7,00 % 1,73Sprzed. opodat. PTU DPTU D 3,00 % 0,20Podatek PTU 1,93

SUMA 31,2700535 #000 1 21:28

Page 8: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• proces wspomaganego odkrywania nietrywialnych, dotychczas nieznanych użytecznych reguł, wzorców, schematów

I EKSPLORACJA DANYCH

Page 9: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• analiza w celu wykrycia nieoczekiwanych związków (synergia)

I EKSPLORACJA DANYCH

  

Page 10: I              EKSPLORACJA DANYCH

Definicja eksploracji danych:• analiza w celu wykrycia nieoczekiwanych związków (synergia)

I EKSPLORACJA DANYCH

  

Page 11: I              EKSPLORACJA DANYCH

Cel eksploracji danych:• wiedza

• zabawa

• władza

• bezpieczeństwo

• zysk

I EKSPLORACJA DANYCH

• inne ?

Page 12: I              EKSPLORACJA DANYCH

Cel eksploracji danych: zysk

I EKSPLORACJA DANYCH

źródło Sieci neuronowe. Wykorzystanie do prognozowania WIGdr Kamila Migdał Najmandr Krzysztof NajmanKatedra Statystyki Wydział Zarządzania Uniwersytet Gdański

Page 13: I              EKSPLORACJA DANYCH

Cel eksploracji danych: bezpieczeństwo

zagrożenie dla bezpieczeństwa w gminie (osiedlu) stanowią:• piraci drogowi 26,0 %, • agresywnie zachowująca się młodzież 20,5 %, • sprawcy rozbojów, napadów i pobić 20,5 %,• wandale 10,6 %,• włamywacze i złodzieje 7,6 %.

I EKSPLORACJA DANYCH

Page 14: I              EKSPLORACJA DANYCH

Cel eksploracji danych: bezpieczeństwo

• oświetlanie w porze wieczorowo-nocnej miejsc uznanych za niebezpieczne, • uruchamianie technicznych środków zabezpieczenia i monitorowania miejsc uznanych za

niebezpieczne oraz zagrożonych obiektów, • uruchomienie projektu "Sąsiedzka czujność", • tworzenie "Bezpiecznych przestrzeni", • pozyskiwanie opiekunów obiektów zagrożonych wandalizmem i włamaniami,• niezwłoczne usuwanie śladów zniszczeń i dewastacji mienia, • zapewnienie służby porządkowej na zawodach sportowych i imprezach organizowanych w

gminie, • stworzenie skutecznego systemu powiadamiania sąsiadów i policji o występujących

zagrożeniach, • prowadzenie działań edukacyjno-wychowawczych wobec osób dopuszczających się zamachów

na osoby lub mienie, • informowanie mieszkańców o możliwościach indywidualnej ochrony przed przemocą

(dodatkowe zamki, alarmy, ubezpieczenia itp.), • organizowanie lokalnych grup samoobrony, • monitorowanie problematyki przemocy w rodzinie i patologii społecznych oraz podejmowanie

działań eliminujących te zagrożenia, • piętnowanie społecznie niepożądanych postaw w lokalnych mediach, • wydawanie broszur i ulotek o charakterze informacyjno-edukacyjnym,

I EKSPLORACJA DANYCH

Page 15: I              EKSPLORACJA DANYCH

Cel eksploracji danych: bezpieczeństwo

I EKSPLORACJA DANYCH

Page 16: I              EKSPLORACJA DANYCH

Cel eksploracji danych: bezpieczeństwo…Someone also has to be accountable for making sure that we modernize information technology. Before we go round up all these people and profile them because they're Muslims or Arabs or wear turbans, it'd be good to know that the government has the same information, checked it on a weekly basis, that's already in the computers of every mass mailing company in the country on the rest of us. We're all in somebody's computer. They know where we live, they know where we pay our utility bills, they know how many credit cards we have. They know what our debt is. Mark is laughing because the biggest one of these companies is in Arkansas. My best childhood friend works for this company. He called me a couple of days after September 11th and said, we got four FBI agents here and we've already found five of these terrorists in our computers. Well you say, that's fine but could they have known before September 11th? You tell me. One of the men, who flew an airplane into the World Trade Center, had 30 credit cards, a quarter of a million of dollars in debt and a consolidated payout schedule of $9,800 a month. Now, since this information is already available on all of us, you could scan that once a week. If somebody if has been in this country for two years or less and they already have 30 credit cards and a quarter a million dollars in debt, they're either really rich or up to no good and it shouldn't be that hard to figure out which.Mohammed Atta, the ring leader, had 12 addresses, two places he lived and 10 safe houses, under the names Mohammed Atta, Mohammed J. Atta, J. Atta, and his middle initials spelled out. So if somebody has been here a couple years or less and they have 12 homes, they're either really rich or up to no good. It shouldn't be that hard to figure out which. That's more important than all that reorganization. That's what we ought to advocate. We ought to drive it home, that ought to be our homeland security position. It's a legitimate issue. …

December 6, 2002

Former President Clinton

The following is the part text of his speech to the Democratic Leadership Council.

I EKSPLORACJA DANYCH

Page 17: I              EKSPLORACJA DANYCH

Cel eksploracji danych: władza

nowodworski 33,9 9,65m. Sopot 5,0 6,74

białogardzki 34,4 10,34m. Szczecin 12,0 8,32

koniński 22,7 10,81m. Poznań 4,9 9,24

chełmski 24,5 10,30m. Lublin 10,8 9,04

brzozowski 25,6 10,94m. Krosno 6,8 5,65

stopabezrobocia

odsetekurodzin

I EKSPLORACJA DANYCH

Page 18: I              EKSPLORACJA DANYCH

Cel eksploracji danych: zabawa

I EKSPLORACJA DANYCH

To miejsce czeka na Państwa propozycje