Laboratorium 4 statystyka statistica

download Laboratorium 4 statystyka statistica

of 16

Transcript of Laboratorium 4 statystyka statistica

1| Strona

Statystyka laboratorium 4

1.

Tworzenie bazy w programie STATISTICATworzenie bazy danych za pomoc importu z arkusza kalkulacyjnego Excel. Zadanie 1. Kodowanie zmiennych w arkuszu Excel.

Otwrz Zbir w Excelu Dane laboratorium 4 statystyka. Zakoduj w nowych kolumnach wszystkie zmienne tekstowe wedug formuy: Pe: nowa kolumna kod_pe , sposb zakodowania: kobieta 1; mczyzna 0; Wyksztacenie: nowa kolumna kodwyksz , sposb zakodowania: rednie - 1 , maturalne 2, wysze 3, wysze magisterskie 4; Miejscowo zamieszkiwana: nowa kolumna kod_miejscowo , sposb zakodowania: wie - 1, gmina 2, miasto 3; Czy pali papierosy: nowa kolumna kod_palenie , sposb zakodowania: tak- 1, nie 0.

Zamknij zbir. Zadanie 2. Utworzenie zbioru w programie STATISTICA Uruchom program STATISTICA i okienku Witamy w STATISTICA zaznacz Otwrz arkusz EXCELA.

2| Strona

Statystyka laboratorium 4

Zaznacz zbir, ktry ma by przeniesiony( tu przenoszony jest z pulpitu)

Wpisz nazw zbioru i otwrz go.

Wybierz arkusz

3| Strona

Statystyka laboratorium 4

Jeli widzisz

To dobrze wykonano polecenie. 2. Wejd w zakadk Dane Specyfikacja zmiennej

4| Strona

Statystyka laboratorium 4

Zaznacz Wszystkie specyfikacje.

5| Strona

Statystyka laboratorium 4

Zaznacz Typ zmiennej, typ skali, w etykietach wpisz nazwy, ktre maj pojawia si w tabelach i na wykresach. Po zdefiniowaniu wszystkich zmiennych

OK

6| Strona

Statystyka laboratorium 4

3. Zapisywanie bazy. a. Wybierz Plik nastpnie Zapisz jako i wpisz nazw pliku Nazwisko_laboratorium4.

Analiza pojedynczej zmiennejPrzypomnienie ( a moe co nowego?) Oznaczmy obserwowane wartoci zmiennej X przez x1, x2, , xn. Miary pooenia Dla zmiennych wyraonych w skali interwaowej i ilorazowej klasycznymi miarami tendencji centralnej to najczciej rednie, ktre informuj o przecitnym poziomie cechy, nie odzwierciedlajc rnic pomidzy poszczeglnymi jednostkami. W zalenoci od postaci wartoci zmiennej stosujemy: -redni arytmetyczn (gdy wartoci zmiennej mona dodawa), -redni geometryczn (gdy wartoci zmiennej mona mnoy), -redni harmoniczn (gdy wartoci zmiennej mona dodawa). Warto redniej wyznaczamy jeli wartoci zmiennej s jednorodne. rednia arytmetyczna rednia arytmetyczna rwna si sumie wszystkich wartoci zmiennej podzielonej przez ich liczb. Dla zmiennej, ktra przyjmuje wartoci x1, x2, , xn rednia arytmetyczna x wynosi:

x=

1 n xi , n i =1

5% rednia ucita - rednia wyznaczona z wartoci zmiennej , z ktrych wyeliminowano 5% najwikszych i 5% najmniejszych wartoci. Warto 5% redniej ucitej wyznacza si gdy chcemy aby zmienne nietypowe nie zakcay wartoci redniej. rednia geometryczna rednia geometryczna xg jest pierwiastkiem n - tego stopnia iloczynu n wartoci zmiennej. Stosuje si j gwnie przy badaniu zmian tempa zjawisk . rednia geometryczna w mniejszym stopniu ni rednia arytmetyczna odzwierciedla wpyw wartoci ekstremalnych na przecitny poziom zmiennej. rednia geometryczn wyznacza si ze wzoru:

x g = n x1 x2 ...xn .Z definicji wynika, e redni geometryczn moemy wyznacza tylko wtedy, gdy wartoci obserwacje s liczbami dodatnimi i rnymi od zera. rednia harmoniczna redni harmoniczna xh (dla liczb rnych od zera) nazywamy odwrotno redniej arytmetycznej z odwrotnoci wartoci zmiennej. Oblicza si j, gdy wartoci zmiennej s podane w jednostkach wzgldnych. rednia harmoniczn wyznacza si ze wzoru:

x =(

1 n 1 1 ) = n i =1 xi

n 1 x i =1 in

,

przy czym:

xi =1

n

1i

0.

Dla wszystkich zmiennych, wyraonych co najmniej na skali porzdkowej, mona wyznacza nieklasyczne miary tendencji centralnej. Nale do nich:

7| Strona

Statystyka laboratorium 4

-mediana, -dominanta (moda), -kwantyle. Mediana (zwana te wartoci rodkow) to w warto w szeregu uporzdkowanym, powyej i poniej ktrej znajduje si jednakowa liczba wartoci zmiennej. Dominanta (moda) - to najczciej wystpujca warto zmiennej. Kwantylem rzdu p (Kp), gdzie 1 > p > 0, nazywamy kad liczb xp przed, ktr znajduje si 100p% wartoci zmiennej. Kwantyle dla p = 0,25, p = 0,5, p = 0,75 nazywany kwartylami. Gdy: p = 0,25 kwartyl dolny (inaczej kwartyl rzdu 1 oznaczany przez Q1, percentyl 25), p = 0,5 - mediana (inaczej kwartyl rzdu 2, percentyl 50), p = 0,75 kwartyl grny ( inaczej kwartyl rzdu 3 oznaczany przez Q3, percentyl 75). Miary zmiennoci (rozproszenia, dyspersji) Miary zmiennoci dzielimy na: Miary klasyczne: - wariancja (dla zmiennych, ktre mona mnoy), - odchylenie standardowe(dla zmiennych, ktre mona mnoy), - odchylenie przecitne (dla zmiennych, ktre mona dodawa), - wspczynnik zmiennoci (dla zmiennych, ktre mona mnoy i dzieli), Miary pozycyjne: - rozstp (dla zmiennych, ktre mona dodawa), - odchylenie wiartkowe (dla zmiennych, ktre mona dodawa),, - wspczynnik zmiennoci.2 Wariancj S x wyznaczamy ze wzoru: 2 Sx =

1 n ( xi x ) 2 , n 1 i =1 S x = S x2 .

odchylenie standardowe:

Odchylenie standardowe informuje o ile rednio odchylaj si wartoci zmiennej od wartoci redniej x . Im mniejsza warto odchylenia tym wartoci zmiennej s bardziej skupione wok redniej. Rozstp R to warto bezwzgldna (modu) rnicy pomidzy wartoci maksymaln i minimaln badanej zmiennej.

R = max( x1 , x 2 ,..., x n ) min( x1 , x 2 ,..., x n )Odchylenie wiartkowe Q (rozstp midzykwartylowy) - jest to wielko okrelajca odchylenie wartoci zmiennej od mediany. Mierzy poziom zrnicowania tylko czci jednostek; po odrzuceniu jednostek o wartociach niewikszych ni Q1 oraz jednostek o wartociach niemniejszych ni Q3. Im wiksza szeroko rozstpu wiartkowego, tym wiksze zrnicowanie wartoci zmiennej.

Q=

Q3 Q1 2

.

Wspczynnik zmiennoci wyznacza si ze wzoru ZM x = Miary asymetrii

Sx , x 0. x

Istnieje wiele miar sucych do wyznaczania asymetrii rozkadu do najczciej stosowanych naley trzeci moment centralny , ktry wyznacza si ze wzoru:

8| Strona

Statystyka laboratorium 4 M3 = 1 n ( xi x ) 3 , n i =1

lub wspczynnik skonoci

WM 3 =

M3 3 . Sx

Wspczynnik skonoci przyjmuje warto zero dla rozkadu symetrycznego, wartoci ujemne dla rozkadw o lewostronnej asymetrii (wyduone lewe rami rozkadu) i wartoci dodatnie dla rozkadw o prawostronnej asymetrii (wyduone prawe rami rozkadu). Miary koncentracji Miary koncentracji mierz koncentracj wartoci zmiennej wok redniej. Do najczciej stosowanych wspczynnikw koncentracji naley kurtoza Definiuje si j nastpujcym wzorem:

Kurt =

M4 3, 4 Sx M4 = 1 n ( xi x ) 4 . n i =1

gdzie M 4 nazywane czwartym momentem centralnym wyznacza si ze wzoru:

Rozkady zmiennych mona podzieli ze wzgldu na warto kurtozy na rozkady: mezokurtyczne - warto kurtozy wynosi 0, spaszczenie rozkadu jest podobne do spaszczenia rozkadu normalnego (dla ktrego kurtoza wynosi dokadnie 0) leptokurtyczne - kurtoza jest dodatnia, wartoci cechy bardziej skoncentrowane ni przy rozkadzie normalnym (wykres wysmuky) platokurtyczne - kurtoza jest ujemna, wartoci cechy mniej skoncentrowane ni przy rozkadzie normalnym (wykres spaszczony). Zadanie 3. Analiza statystyczna zmiennej jakociowej wyraonej w skali nominalnej Przeprowadzi analiz zmiennej Miejscowo zamieszkiwana. Aby wyznaczy statystyki mona jedynie posugiwa si zmiennymi liczbowymi a wic analiz bdziemy przeprowadza na zmiennej kod_miejscowo. W tym celu wybieramy zakadk Statystyka, Statystyki opisowe i Zmienne, oraz wybieramy zmienne, ktre maj by poddane analizie.

9| Strona

Statystyka laboratorium 4

Po wybraniu zmiennej OK. oraz Wicej. Pojawi si ponisza tabela w ktrej wybieramy statystyki zgodnie z rodzajem skali pomiarowej w jakiej wyraona jest badana zmienna.

10 | S t r o n a

Statystyka laboratorium 4

Jako Posumowanie otrzymujemy wartoci zaznaczonych statystyk w postaci poniszego arkusza, ktry mona przekopiowa do dokumentu np. Worda.

Moemy take otrzyma tabel licznoci ( szereg przedziaowy) dla badanej zmiennej

11 | S t r o n a

Statystyka laboratorium 4

W postaci poniszego arkusza:

Dodatkowo mona wykona histogram badanej zmiennej.

Za pomoc Wykresy 1

12 | S t r o n a

Statystyka laboratorium 4

Za pomoc Wykres 2:

Za pomoc Histogramy:

13 | S t r o n a

Statystyka laboratorium 4

Jeli chcemy uzyska wykres innego typu wybieramy na wstce Wykresy. Jeli na przykad chcemy uzyska wykres koowy to wybieramy Wykresy 2W a nastpnie Wykresy koowe.

14 | S t r o n a

Statystyka laboratorium 4

3 1

2

k o d _ m

ie js c o w

o

Jeli na wykresie maj by umieszczone licznoci, procenty i ewentualne nazwy, klikamy prawym klawiszem myszy i w tabeli Opcje wykresu zaznaczamy Etykiety punktw oraz Licznoci, Procenty, Nazwy klas.

15 | S t r o n a

Statystyka laboratorium 4

Wynikiem naszego dziaania bdzie wykres w postaci:

3

;

3

5

;

1

8 % 1 ; 6 2 ; 3 1 %

2

;

1 0

3

;

5

2

%

k o

d

_

m

i e

j s

c

o

w

o

Ten sam wykres koowy dla zmiennej niekodowanej Miejscowo zamieszkiwana ma posta:

16 | S t r o n a

Statystyka laboratorium 4

m

i a

s

t o

;

3

5

;

1

8

% w i e ; 6 2 ; 3 1 %

g

m

i n

a

;

1

0

3

;

5

2

%

M

i e

j s

c

o

w

o

z a

m

i e

s

z k i w

a

n

a

Zadanie 4. Analiza statystyczna zmiennej jakociowej wyraonej w skali porzdkowej Przeprowadzi analiz statystyczn zmiennej Wyksztacenie i utworzy histogram . Zmienna Wyksztacenie zostaa zakodowana i zapisana jako zmienna kodwyksz. Przeprowadzimy wic analiz zmiennej kodwyksz. Wyniki analiz ( wykresy i tabele) umie w dokumencie Word. Poniewa na kodach nie mona wykonywa dziaa arytmetycznych naley wybra tylko te statystyki, ktre mona wyznaczy. W stosunku do skali nominalnej, dla skali porzdkowej mona jeszcze dodatkowo wyznaczy kwantyle. Wyniki analiz ( wykresy i tabele) umie w dokumencie Word i zinterpretuj wszystkie otrzymane wyniki.

Zadanie 5. Analiza statystyczna zmiennej ilociowej Przeprowadzi analiz statystyczn zmiennej Waga oraz wykona histogram z krzyw normaln. Dla zmiennej Waga wyraonej w skali ilorazowej mona wyznaczy wszystkie statystyki oferowane przez program STATISTICA Przekopiowa do Worda histogram i otrzymane tabele oraz zinterpretowa wszystkie wyznaczone wartoci statystyk.