Finał konkursu "Analityk Danych"

35
Finał konkursu "Analityk Danych" • CAWI jako przyszłościowa technika zbierania danych • Zastosowanie statystyki w analizie danych giełdowych • Symulacje komputerowe - zastosowanie w prognozowaniu. • Metody prezentacji danych statystycznych Koło Naukowe Statystyków Uniwersytetu Ekonomicznego w Katowicach

description

Finał konkursu "Analityk Danych". CAWI jako przyszłościowa technika zbierania danych Zastosowanie statystyki w analizie danych giełdowych Symulacje komputerowe - zastosowanie w prognozowaniu. Metody prezentacji danych statystycznych - PowerPoint PPT Presentation

Transcript of Finał konkursu "Analityk Danych"

Page 1: Finał konkursu "Analityk Danych"

Finał konkursu "Analityk Danych"

• CAWI jako przyszłościowa technika zbierania danych• Zastosowanie statystyki w analizie danych

giełdowych • Symulacje komputerowe - zastosowanie w

prognozowaniu.• Metody prezentacji danych statystycznych

Koło Naukowe StatystykówUniwersytetu Ekonomicznego w Katowicach

Page 2: Finał konkursu "Analityk Danych"

CAWI jako przyszłościowa technika zbierania danych

Piotr Ziuziański

Page 3: Finał konkursu "Analityk Danych"

Techniki zbierania danychPAPI (Paper and pencil interview)• Najstarsza metoda: ankieta papierowa• Wymaga wprowadzania i kontroli danych

CAPI (Computer aided personal interview)

• Ankieta w formie elektronicznej, realizowana za pomocą komputera• Zapewnia kontrolę zakresu wartości danych i zależności pomiędzy pytaniami

CATI (Computer aided telephone interview)• Realizowanie wywiadów przez telefon• Ankieta w formie elektronicznej, realizowana za pomocą komputera• Zapewnia kontrolę zakresu wartości danych i zależności pomiędzy pytaniami

CAWI (Computer aided web interview)• Przyszłość badań: wywiady internetowe, bez udziału ankietera• Niski koszt wywiadu• Najbardziej zaawansowana metoda zbierania danych, daje duże poczucie anonimowości

Page 4: Finał konkursu "Analityk Danych"

DOTARCIE•Blisko połowa Polaków w wieku 15-75 korzysta z Internetu. Wśród młodzieży, osób z wyższym wykształceniem czy lepiej zarabiających Polaków penetracja Internetu jest niemal całkowita — oscyluje wokół 90%.

DOSTĘPNOŚĆ•Internet umożliwia dotarcie do najróżniejszych, często bardzo wąskich grup respondentów jak np. przedstawiciele różnych grup zawodowych, osoby na wysokich stanowiskach, konsumenci marki X itp.

SZYBKOŚĆ•Realizacja badania trwa zdecydowanie krócej niż w przypadku badań tradycyjnych. Wstępne wyniki można otrzymać już po 2-3 dniach.

NISKIE KOSZTY•Brak kosztów prac terenowych: druku i wysyłki materiałów, wynagrodzenia dla ankieterów sprawia, że ceny badań online są bardzo atrakcyjne.

MULTIMEDIALNOŚĆ•Do ankiet online można z łatwością dołączyć elementy multimedialne takie jak obraz czy film. Dzięki temu badanie online świetnie sprawdza się do testowania reklam czy opakowań.

INTERAKTYWNOŚĆ•Możliwe jest modyfikowanie zestawu i kolejności zadawania pytań w zależności od uzyskiwanych odpowiedzi Dzięki temu można przeprowadzać bardziej precyzyjne badania poprzez eliminację niektórych pytań lub pogłębianie odpowiedzi na inne.

CAWI

zale

ty

Page 5: Finał konkursu "Analityk Danych"

(X)HTML(Extensible HyperText Markup

Language)

CSS(Cascading Style Sheets)

PHP

JAVASCRIPT, AJAX(Asynchronous JavaScript and XML)

MYSQL

• struktura formularza ankiety

• ustalenie wyglądu strony

• zaprogramowanie formularza (wysyłanie, sprawdzanie poprawności)

• nadanie dynamiki, wyświetlanie dynamiczne, interakcja po stronie klienta

• przechowywanie danych

Technologie wykorzystywane w CAWI

<html><head></head><body><form><input type = "radio">opcja pierwsza</body></form></html>

body {background-color: #477795;}h1 {color: #99AF34;font-family: "Trebuchet MS",arial,sans-serif;text-align: right;}

<?php $plec = $_POST['0'];

if ($plec == '1') { $napis0 = "mieszkałeś"; $napis1 = "zdawałeś"; $napis2 = "zamierzałeś"; $napis3 = "studiowałeś"; } elseif ($plec == '0') { $napis0 = "mieszkałaś"; $napis1 = "zdawałaś"; $napis2 = "zamierzałaś"; $napis3 = "studiowałaś"; } ?>

<script type='text/javascript'> //<![CDATA[ $(function(){

$("[name=13]").change(function(){ $("#13").toggle($("[name=13]").index(this)!=2);

}); $

("[name=14]").change(function(){ $("#14").toggle($("[name=14]").index(this)!=2);

});

}); //]]> </script>

$Query = "Insert into ankieta_s values(''";

foreach($_POST as $index => $wartosc) //petla tworzy glowna tresc zapytania do sql{

$Query .= ", '$wartosc'";}$Query .=")";

Page 6: Finał konkursu "Analityk Danych"

Etapy CAWI

Podanie adresu internetowego

Uwierzytelnienie respondenta

Wypełnienie ankiety przez respondenta

Walidacja poprawności wypełnionej

ankiety

Wysłanie danych do bazy danych

Page 7: Finał konkursu "Analityk Danych"

Zastosowanie statystyki w analizie danych giełdowych

Michał MierzwaPaweł Bieroński

Page 8: Finał konkursu "Analityk Danych"

Wykres liniowy - EURUSD

Page 9: Finał konkursu "Analityk Danych"

Średnie ruchome

Page 10: Finał konkursu "Analityk Danych"

20

xxxxx

20

120SMA

n

xxxxx

n

1]n[SMA

2032120

1ii

n321n

1ii

Średnie ruchome

SMA – średnia ruchomax – kurs zamknięcia

Page 11: Finał konkursu "Analityk Danych"

Średnie ruchome

Page 12: Finał konkursu "Analityk Danych"

Wstęga Bollingera

20

)()()(2

)(20

12

220

22

21

20

1

2

xxxxxxndsBolingerBa

xxndsBolingerBai

i

x – kurs zamknięcia

Page 13: Finał konkursu "Analityk Danych"

Wstęga Bollingera

Page 14: Finał konkursu "Analityk Danych"

Symulacje komputerowe - zastosowanie w prognozowaniu.

Małgorzata Krzciuk

Page 15: Finał konkursu "Analityk Danych"

Symulacja

• stwarzanie fałszywych pozorów; świadome wprowadzanie w błąd otoczenia;

• przybliżone odtworzenie zachowania danego obiektu lub zjawiska zachodzącego w świecie rzeczywistym za pomocą jego modelu.

• symulacja komputerowa - metoda odtwarzania zjawisk zachodzących w świecie rzeczywistym (lub ich niektórych właściwości i parametrów) za pomocą ich zmatematyzowanych modeli, definiowanych i obsługiwanych przy użyciu programów komputerowych; wykorzystywana do wnioskowania o przebiegu tych zjawisk i procesów, których bezpośrednia obserwacja jest niemożliwa lub zbyt kosztowna.

Słownik wyrazów obcych, PWN

Page 16: Finał konkursu "Analityk Danych"

Prognozowanie

• Prognozowanie - oparte na uzasadnionych naukowo przesłankach formułowanie przewidywań przyszłych stanów rzeczy, procesów, zdarzeń.

• Prognoza - przewidywanie przyszłych faktów, zjawisk czy zdarzeń na podstawie uzasadnionych przesłanek ustalonych w toku badań nauk., stanowiące wytyczną do dalszego postępowania w danej dziedzinie nauki.

Słownik wyrazów obcych, PWN

Page 17: Finał konkursu "Analityk Danych"

R 2.10.1

ESSENTIALSFOR R 19

SPSS 19

Narzędzia statystyczne pozwalające na wykorzystanie symulacji komputerowych w prognozowaniu

Page 18: Finał konkursu "Analityk Danych"

Przykład wykorzystania symulacji komputerowej w prognozowaniu

Dane:

Page 19: Finał konkursu "Analityk Danych"

Przykład wykorzystania symulacji komputerowej w prognozowaniu

Page 20: Finał konkursu "Analityk Danych"

Wykres danych rzeczywistych oraz 10 realizacji wygenerowanychzgodnie z trendem wykładniczym

Wykres danych rzeczywistych i wygenerowanych za pomocą trendów

(z uwzględnieniem prognoz)

Page 21: Finał konkursu "Analityk Danych"

Histogram błędów predykcji dla poszczególnych trendów

Wykres rozrzutu wartości generowanych

na okres kolejny i prognoz

Page 22: Finał konkursu "Analityk Danych"

Tabela wynikowaprzeprowadzonej symulacji

WYNIKI SYMULACJI

Miary

Trendy

Liniowy Logarytmiczny Potęgowy Wykładniczy

1 2,438 -8,933 -9,606 ,028

2 2,767 9,020 9,685 1,271

3 1,309 1,249 1,233 1,271

4 80,713 1810,331 1825,428 -21,475

(1) względne obciążenie prognoz, (2) względny pierwiastka MSE,(3) względny średni błąd predykcji ex ante, (4) względne obciążenie estymatora V2.

Page 23: Finał konkursu "Analityk Danych"

Prognozowanie

Podsumowując, wykorzystanie symulacji komputerowych w procesie prognozowania ma duże znaczenie w szczególności gdy analiza badanego zjawiska lub procesu jest niemożliwa lub zbyt kosztowna. Pozwala ono na łatwe wielokrotne oszacowanie przyszłych wartości badanych zmiennych.

Page 24: Finał konkursu "Analityk Danych"

Metody prezentacji danych statystycznychWykresy statystyczne

Paweł DomańskiIzabela Krzyżowska

Page 25: Finał konkursu "Analityk Danych"

Metody prezentacji danych statystycznych

• tablice statystyczne,• wykresy statystyczne,• tekst (opis),• mieszana.

Page 26: Finał konkursu "Analityk Danych"
Page 27: Finał konkursu "Analityk Danych"

Podstawowe wykresy statystyczne

Histogram

Statystyki

Bieżące wynagrodzenie$34,419.57

$28,875.00

$30,750

$17075.66

2.125

.112

$15,750

$135,000

Średnia

Mediana

Dominanta

Odchylenie standardowe

Skośność

Błąd standardowyskośnościMinimum

Maksimum

M ẋ

Page 28: Finał konkursu "Analityk Danych"

Słupkowy

Podstawowe wykresy statystyczne

Page 29: Finał konkursu "Analityk Danych"

Rozrzutu

Liniowy

LiniowyWykres słonecznikowy

Page 30: Finał konkursu "Analityk Danych"

Podstawowe wykresy statystyczne

http://www.wrpo.wielkopolskie.pl

Kołowy Graf

Page 31: Finał konkursu "Analityk Danych"

Inne wykresy statystyczne

Twarze Chernoffa Radarowy

Page 32: Finał konkursu "Analityk Danych"

Inne wykresy statystyczneWykres konturowy Mapa ciepła

Page 33: Finał konkursu "Analityk Danych"

Inne wykresy statystyczne

70 71 72 73 74 75 76 77 78 79 80

1.0

1.2

1.4

1.6

1.8

2.0

2.2

Szwecja

Niemcy

Polska

Czechy

Litwa

Średnia długość życia

Pło

dn

ć

Bąbelkowy PudełkowySkrzypcowy

Page 34: Finał konkursu "Analityk Danych"

Programy

Mężczyźni

02004006008001000120014001600

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70

Kobiety

0 200 400 600 800 1000 1200 1400 1600

Piramida wiekuwiek

Page 35: Finał konkursu "Analityk Danych"

Dziękujemy za uwagę! :)