Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja ...derun/SED/raport_derkowski.pdf ·...

21
Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Transcript of Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja ...derun/SED/raport_derkowski.pdf ·...

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych

(nr 3)

Kamil Krzysztof Derkowski

Zadanie 1 Eksploracja (EXAMINE)

Informacja o analizowanych danych

Obserwacje

Uwzględnione Wykluczone Ogółem

N Procen

t N Procen

t N Procent

Wzrost cen w ciągu ostatnich 12 miesięcy

230 70,1% 98 29,9% 328 100,0%

Wzrost cen w najbliższych 12 miesiącach

230 70,1% 98 29,9% 328 100,0%

Statystyki opisowe (DESCRIPTIVES)

Statystyka

Wzrost cen w ciągu ostatnich 12 miesięcy

Średnia 40,19

95% przedział ufności dla średniej

Dolna granica 36,25

Górna granica 44,13

5% średnia obcięta 37,00

Mediana 30,00

Wariancja 920,196

Odchylenie standardowe 30,335

Minimum 2

Maksimum 300

Rozstęp 298

Rozstęp ćwiartkowy 26

Skośność 3,954

Kurtoza 26,373

Wzrost cen w najbliższych 12 miesiącach

Średnia 38,85

95% przedział ufności dla średniej

Dolna granica 34,83

Górna granica 42,87

5% średnia obcięta 35,63

Mediana 30,00

Wariancja 958,458

Odchylenie standardowe 30,959

Minimum 2

Maksimum 300

Rozstęp 298

Rozstęp ćwiartkowy 30

Skośność 3,583

Kurtoza 22,979

Statystyki opisowe (DESCRIPTIVES)

Błąd

standardowy

Wzrost cen w ciągu ostatnich 12 miesięcy

Średnia 2,000

95% przedział ufności dla średniej

Dolna granica

Górna granica

5% średnia obcięta

Mediana

Wariancja

Odchylenie standardowe

Minimum

Maksimum

Rozstęp

Rozstęp ćwiartkowy

Skośność ,160

Kurtoza ,320

Wzrost cen w najbliższych 12 miesiącach

Średnia 2,041

95% przedział ufności dla średniej

Dolna granica

Górna granica

5% średnia obcięta

Mediana

Wariancja

Odchylenie standardowe

Minimum

Maksimum

Rozstęp

Rozstęp ćwiartkowy

Skośność ,160

Kurtoza ,320

Obie próby są do siebie podobne. Średnia wynosi około 40. Mediana

wynosi 30 dla każdej zmiennej. Wartości minimum i maksimum wynoszą

tyle samo 2 i 300. Odchylenie standardowe około 30 dla obu zmiennych.

Próba jest duża. Uwzględniono 230 obserwacji.

Percentyle

Percentyle

5 10 25 50

Przeciętne ważone (Definicja 1)

Wzrost cen w ciągu ostatnich 12 miesięcy

10,00 17,10 23,75 30,00

Wzrost cen w najbliższych 12 miesiącach

10,00 10,50 20,00 30,00

Zawiasy Tukey'a Wzrost cen w ciągu ostatnich 12 miesięcy

24,00 30,00

Wzrost cen w najbliższych 12 miesiącach

20,00 30,00

Percentyle

Percentyle

75 90 95

Przeciętne ważone (Definicja 1)

Wzrost cen w ciągu ostatnich 12 miesięcy

50,00 69,00 100,00

Wzrost cen w najbliższych 12 miesiącach

50,00 70,00 100,00

Zawiasy Tukey'a Wzrost cen w ciągu ostatnich 12 miesięcy

50,00

Wzrost cen w najbliższych 12 miesiącach

50,00

Wzrost cen w ciągu ostatnich 12 miesięcy

Wzrost cen w najbliższych 12 miesiącach

Zadanie 2 Test T (T-TEST)

W pliku Dane_wzrost_cen.sav próba jest duża nie ma, więc konieczności sprawdzania normalności rozkładu.

H0: Oprocentowanie 12-miesięcznych lokat jest równe 3-krotnej inflacji. H1: Oprocentowanie 12-miesięcznych lokat jest inne niż 3-krotna inflacja.

Statystyki dla jednej próby

N Średni

a

Odchylenie

standardowe

Błąd standardo

wy średniej

12 miesięczne oprocentowania zł na lokacie

217 40,66 18,878 1,282

Test dla jednej próby

Wartość testowana = 30

t df

Istotność (dwustron

na) Różnica średnich

12 miesięczne oprocentowania zł na lokacie

8,321 216 ,000 10,664

Test dla jednej próby

Wartość testowana = 30

95% przedział ufności dla różnicy średnich

Dolna granica Górna granica

12 miesięczne oprocentowania zł na lokacie

8,14 13,19

Istotność jest mniejsza niż 0,05 -> H0 odrzucamy i przyjmujemy H1.

Zadanie 3 Test T (T-TEST)

W pliku Dane_wzrost_cen.sav próba jest duża nie ma, więc konieczności sprawdzania normalności rozkładu.

H0: Zmienne mają jednakowe średnie. H1: Zmienne mają różne średnie.

Statystyki dla prób zależnych

Średnia N

Odchylenie standardow

e

Błąd standardo

wy średniej

Para 1

Wzrost cen w ciągu ostatnich 12 miesięcy

40,19 230 30,335 2,000

Wzrost cen w najbliższych 12 miesiącach

38,85 230 30,959 2,041

Korelacje dla prób zależnych

N Korelacja Istotność

Para 1

Wzrost cen w ciągu ostatnich 12 miesięcy & Wzrost cen w najbliższych 12 miesiącach

230 ,885 ,000

Test dla prób zależnych

Różnice w próbach zależnych

Średnia

Odchylenie standardowe

Błąd standardowy

średniej

Para 1

Wzrost cen w ciągu ostatnich 12 miesięcy - Wzrost cen w najbliższych 12 miesiącach

1,335 14,738 ,972

Test dla prób zależnych

Różnice w próbach zależnych

t df

95% przedział ufności dla różnicy średnich

Dolna granica

Górna granica

Para 1

Wzrost cen w ciągu ostatnich 12 miesięcy - Wzrost cen w najbliższych 12 miesiącach

-,580 3,250 1,374 229

Test dla prób zależnych

Istotność (dwustron

na)

Para 1

Wzrost cen w ciągu ostatnich 12 miesięcy - Wzrost cen w najbliższych 12 miesiącach

,171

Otrzymaliśmy istotność większą niż 0,05 -> Nie ma podstaw do odrzucenia H0.

Zadanie 4 Dopasowanie krzywej (CURVEFIT)

Opis modelu

Nazwa modelu MOD_1 Zmienna zależna

1 Wzrost cen w ciągu ostatnich 12 miesięcy

Równanie 1 Liniowy Zmienna niezależna Wzrost cen w

najbliższych 12 miesiącach

Stała Uwzględnione Zmienna opisująca obserwacje na wykresach

Nieokreślone

Informacja o

analizowanych danych

Liczebno

ść

Ogółem obserwacji

328

Obserwacje wykluczonea

98

Obserwacje prognozowane

0

Nowoutworzone obserwacje

0

a. Obserwacje z brakami danych w dowolnej ze zmiennych są wykluczane z analizy.

Podsumowanie przetwarzanych zmiennych

Zmienne

Zależna Niezależn

a

Wzrost cen w ciągu

ostatnich 12

miesięcy

Wzrost cen w

najbliższych 12

miesiącach

Liczba dodatnich wartości 266 241 Liczba zer 0 0 Liczba ujemnych wartości 0 0 Liczba braków danych

Brak danych zdefiniowany przez użytkownika

62 87

Systemowy brak danych

0 0

Podsumowanie modelu i oszacowań parametrów

Zmienna zależna:Wzrost cen w ciągu ostatnich 12 miesięcy

Równanie

Model - Podsumowanie Oceny

parametrów

R-kwadrat F df1 df2

Istotność Stała b1

Liniowy ,782 820,085

1 228 ,000 6,513 ,867

Zmienną niezależną jest Wzrost cen w najbliższych 12 miesiącach.

R^2 = 0,782 co oznacza, że w 78% różnice w prognozie dają się wytłumaczyć różnicami w zauważonym przez respondentów wzroście cen w ubiegłym okresie. R=0,884 co świadczy o dodatniej korelacji miedzy prognozą cen i ubiegłym okresem.

Równanie prostej regresji ma postać y = 0,867 * x + 6,513.

Eksploracja (EXAMINE)

Informacja o analizowanych danych

Obserwacje

Uwzględnione Wykluczone Ogółem

N Procent N Procent N Procent

Wzrost cen w ciągu ostatnich 12 miesięcy

230 70,1% 98 29,9% 328 100,0%

Wzrost cen w najbliższych 12 miesiącach

230 70,1% 98 29,9% 328 100,0%

Wykresy skrzynkowe ujawniły przypadki odstające dla zmiennych wzrost_wstecz i wzrost_prognoza. Jest 24 takich obserwacji, wartości usuwamy z pliku i powtarzamy analizę. Dopasowanie krzywej (CURVEFIT)

Opis modelu

Nazwa modelu MOD_2 Zmienna zależna

1 Wzrost cen w ciągu ostatnich 12 miesięcy

Równanie 1 Liniowy Zmienna niezależna Wzrost cen w

najbliższych 12 miesiącach

Stała Uwzględnione Zmienna opisująca obserwacje na wykresach

Nieokreślone

Informacja o

analizowanych danych

Liczebno

ść

Ogółem obserwacji

304

Obserwacje wykluczonea

94

Obserwacje prognozowane

0

Nowoutworzone obserwacje

0

Informacja o analizowanych danych

Liczebno

ść

Ogółem obserwacji

304

Obserwacje wykluczonea

94

Obserwacje prognozowane

0

Nowoutworzone obserwacje

0

a. Obserwacje z brakami danych w dowolnej ze zmiennych są wykluczane z analizy.

Podsumowanie przetwarzanych zmiennych

Zmienne

Zależna Niezależn

a

Wzrost cen w ciągu

ostatnich 12

miesięcy

Wzrost cen w

najbliższych 12

miesiącach

Liczba dodatnich wartości 243 220 Liczba zer 0 0 Liczba ujemnych wartości 0 0 Liczba braków danych

Brak danych zdefiniowany przez użytkownika

61 84

Systemowy brak danych

0 0

Podsumowanie modelu i oszacowań parametrów Zmienna zależna:Wzrost cen w ciągu ostatnich 12 miesięcy

Równanie

Model - Podsumowanie Oceny

parametrów

R-kwadrat F df1 df2

Istotność Stała b1

Liniowy ,585 293,060

1 208 ,000 10,984 ,706

Zmienną niezależną jest Wzrost cen w najbliższych 12 miesiącach.

R^2 = 0,585 co oznacza, że w 59% różnice w prognozie dają się wytłumaczyć różnicami w zauważonym przez respondentów wzroście cen w ubiegłym okresie. R=0,765 co świadczy o dodatniej korelacji miedzy prognozą cen i ubiegłym okresem.

Równanie prostej regresji ma postać y = 0,706 * x + 10,984. Równanie może być używane do przewidywania odpowiedzi na drugie pytanie na podstawie odpowiedzi na pierwsze, ponieważ R=0,765 co świadczy o dodatniej korelacji miedzy prognozą cen i ubiegłym okresem.