Wykład 4. Rozkłady teoretyczne

Post on 04-Jan-2016

90 views 0 download

description

Wykład 4. Rozkłady teoretyczne. Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem. Rozkład normalny - PowerPoint PPT Presentation

Transcript of Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne

Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem.

Rozkład normalnyPodstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny

(Gaussa-Laplace’a). Zmienna losowa X ma rozkład normalny, jeśli jej funkcja gęstości - określona dla wszystkich rzeczywistych wartości x - da się przedstawić za pomocą wzoru (4.1):

,2

)(exp

2

1=)(

2

2

mx

xf

Wykład 4. Rozkłady teoretyczne

Realizacje zmiennej losowej o rozkładzie normalnym są określone w przedziale - < x < +

Funkcja gęstości rozkładu normalnego, dana wzorem 4.1. ma następujące własności:

1) jest symetryczna względem prostej x = m (własność symetryczności),

2) osiąga maksimum dla x = m (własność jednomodalności),

3) jej ramiona mają dwa punkty przegięcia dla x1 m- σ;

4) oraz x2 m + σ ,

4) jest całkowicie określona przez dwa parametry: parametr m decyduje o przesunięciu krzywej, natomiast parametr σ decyduje o smukłości krzywej; własność określoności wyróżniamy zapisem N(m; σ) .

Wykład 4. Rozkłady teoretyczne; rozkład normalny

Rys. 4.1 Gêstoœæ rozk³adu normalnego

0,000

0,005

0,010

0,015

0,020

0,025

0,030

0,035

0,040

-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0

Kwantyle

Punkty przegiêcia

Wykład 4. Rozkłady teoretyczne; rozkład normalny

Rozkład normalny N (0,1) nazywa się standardowym rozkładem normalnym. Jego dystrybuanta wyraża się wzorem (4.2):

gdzie (4.3)

xu duexF ,

2

1=)( 2/

mx

u

Wykład 4. Rozkłady teoretyczne; dystrybuanta rozkładu normalnego

Rys. 4.2. Dystrybuanta rozkładu normalnego standaryzowanego N(0;1)

0,00

0,01

0,02

0,03

0,04

-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5

Kwantyle rozkładu normalnego

Pra

wdo

podo

bień

stw

o

Tablica 4.1. Dystrybuanta rozkładu normalnego standaryzowanego N(0;1), I rodzaj tablic (pole pod krzywą od minus nieskończoność do x) u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,10 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,20 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,30 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,40 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,50 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,60 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,70 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,80 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,90 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,00 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,10 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,20 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,30 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,40 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,50 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,60 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,70 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,80 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,90 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,00 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,10 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,20 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

Wykład 4. Rozkłady teoretyczne; rozkład normalny

Funkcje związane z rozkładem normalnym w Excelu:

A. Dowolny rozkład normalny:

a) dane są: średnia, odchylenie standardowe, wartość empiryczna x - poszukujemy pole czyli „lewy ogonek”:

- [fx]=>statystyczne=>rozkład.normalny ==>dane: m, s, x oraz jako „skumulowany” wpisać jako wartość logiczną „1”

b) dane jest prawdopodobieństwo, średnia, odchylenie standardowe - poszukujemy kwantyl empiryczny x,

- [fx]=>statystyczne=>rozkład.normalny ==>dane

Wykład 4. Rozkłady teoretyczne; rozkład normalny

B. Rozkład normalny standaryzowany

a) dany jest kwantyl - poszukujemy pole „lewy ogonek”:

- [fx]=>statystyczne=>rozkład.normalny.S==> kwantyl

b) dane jest pole - poszukujemy kwantyl rozkładu normalnego:

- [fx]=>statystyczne=>rozkład.normalny.S.odw==> pole pod krzywą rozkładu normalnego od - do szukanego x.

Obliczanie prawdopodobieństw P(a<X<b) dla zmiennej losowej o rozkładzie normalnym można przedstawić przy pomocy zmiennej standaryzowanej U(0,1) w sposób następujący:

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

)()(mbmXma

PbXaP

)())

()(ma

Fmb

Fmb

Uma

P

)()( ab uFuF

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

Przykład 1:

Temperatura ciała ludzkiego jest zmienną losową o rozkładzie normalnym ze średnią wynoszącą 36,6oC oraz odchyleniem standardowym . Oblicz prawdopodobieństwo zdarzenia, że losowo wybrany pacjent pewnego szpitala będzie miał temperaturę ciała:

a) mniejszą niż 36,3oC,

b) większą niż 37,6 oC,

c) większą niż 37,9 oC ale mniejszą niż 38,2oC.

ad. a)

)3,36( Xp

6,05,0

3,0

5,0

6,363,36

u

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

ad. b)

P(X>37,6) P(X>37,6)=P(u>2)=1-F(2)=1-0,97725=0,02275, patrz rys. 4.3.

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

ad. c)

004,09953,09993,0

)6,2()2,3()2,36,2()2,389,37(

FFUPXP

Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego

1) Rozkład normalny standaryzowany N(0;1) ma E(u) = 0 oraz S2 = 1;

2) Pole pod krzywą rozkładu normalnego standaryzowanego N(0;1) jest

równe jedności;

3) Punkty przegięcia: u1 = -1 oraz u2 = +1;

4) Współczynnik asymetrii alfa 3 = 0;

5) Współczynnik koncentracji alfa 4 = 3;

6) Mo = Me = E(u)

7) Q1 = - 0,6745; Q3 = +0,6745

Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego

8) W przedziale od – 1 do + 1 znajduje się ponad 68% zbiorowości,

od – 2 do + 2 około 95%,

od – 3 do + 3 ponad 99% całej zbiorowości;

9) Rozkład normalny jako rozkład błędów w teorii pomiarów;

10) Występowanie rozkładu normalnego w świecie przyrody: mity i

rzeczywistość;

11) Rzadkość występowania rozkładu normalnego w zjawiskach społeczno-

ekonomicznych;

Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego

12)Miejsce rozkładu normalnego w teorii statystyki:

a. aproksymacja statystyczna,

b. przybliżenie krzywą Gaussa – Laplace’a innych rozkładów teoretycznych

ciągłych (Studenta, , Fishera – Snedecora) i dyskretnych (dwumianowy,

Poissona)

c. estymacja statystyczna,

d. weryfikacja hipotez statystycznych,

e. ocena niezbędnej wielkości próby w badaniach reprezentacyjnych..

Wykład 4. Rozkłady teoretyczne; Rozkład Studenta

Rozkład t-Studenta według liczby stopni swobody

0,000

0,005

0,010

0,015

0,020

0,025

-4 -3 -2 -1 0 1 2 3 4

Kwantyle rozkładu Studenta

Funk

cja

gęst

ości

1

10

30

70

100

Wykład 4. Tablice rozkładu Studenta „dwuogonowe”

Tablica 4.2. Kwantyle rozkładu Studenta z dwoma obszaramikrytycznymi ("dwugoniaste") dla małej liczby stopni swobody.

Liczba stopni

0,50 0,40 0,30 0,20 0,10 0,04 0,02 0,01 0,002

swobody1 1,00 1,38 1,96 3,08 6,31 15,89 31,82 63,66 318,292 0,82 1,06 1,39 1,89 2,92 4,85 6,96 9,92 22,333 0,76 0,98 1,25 1,64 2,35 3,48 4,54 5,84 10,214 0,74 0,94 1,19 1,53 2,13 3,00 3,75 4,60 7,175 0,73 0,92 1,16 1,48 2,02 2,76 3,36 4,03 5,896 0,72 0,91 1,13 1,44 1,94 2,61 3,14 3,71 5,217 0,71 0,90 1,12 1,41 1,89 2,52 3,00 3,50 4,798 0,71 0,89 1,11 1,40 1,86 2,45 2,90 3,36 4,509 0,70 0,88 1,10 1,38 1,83 2,40 2,82 3,25 4,30

10 0,70 0,88 1,09 1,37 1,81 2,36 2,76 3,17 4,1411 0,70 0,88 1,09 1,36 1,80 2,33 2,72 3,11 4,0212 0,70 0,87 1,08 1,36 1,78 2,30 2,68 3,05 3,9313 0,69 0,87 1,08 1,35 1,77 2,28 2,65 3,01 3,8514 0,69 0,87 1,08 1,35 1,76 2,26 2,62 2,98 3,7915 0,69 0,87 1,07 1,34 1,75 2,25 2,60 2,95 3,73

Wykład 5 Analiza współzależności.

1. Analiza wariancji

a) analiza jednoczynnikowa (podział wg 1 kryterium)

- Porównanie średnich w dowolnej liczbie subpopulacji (prób) o

rozkładzie normalnym lub zbliżonym do normalnego oraz o

jednakowych wariancjach.

H0: M1 = M2 = M3 = . . . (5.1)

H1: M1 M2 M3 . . . (5.2)

Wykład 5 Analiza współzależności. Analiza wariancji

Do weryfikacji hipotezy (5.1) wykorzystuje się test Fishera-Snedecora o

postaci:

F = MSB/MSE, gdy MSB > MSE, (5.3)

lub

F = MSE/MSB, gdy MSB < MSE, (5.4)

gdzie: MSB – średni kwadrat odchyleń od średniej między grupami

(próbami),

MSE – średni kwadrat odchyleń od średniej wewnątrz grup

Wykład 5 Analiza współzależności. Analiza wariancji

Tablica 5.1. Analiza wariancji z uwzględnieniem liczby zmiennych (grup) oraz liczby obserwacji:

Źródło zmienności Suma kwadratów odchyleń

Stopnie swobody

Średni kwadrat odchyleń

1. Czynnik (podpróbka, klasyfikacja) r - 1

- zróżnicowanie międzygrupowe r-liczba grup

2. Błąd losowy n – r- zróżnicowanie wewnątrzgrupowe n-liczba

wszystkich jednostek

3. Ogółem dla całej próby SST r-1+n-r=n-1 MSB+MSE

SSB MSB

SSE MSE

Wykład 5 Analiza współzależności. Analiza wariancji

Ogólna suma kwadratów odchyłek (5.5):

2

1 1

2

2

1 1

1 1

2 xnxn

xxSST

r

i

n

kki

r

i

n

kkir

i

n

kki

i

i

i

Wykład 5 Analiza współzależności. Analiza wariancji

Ważona suma kwadratów odchyłek między średnimi grupowymi a średnią ogólną (5.6):

n

x

n

xSSB

r

i

n

kkir

i i

n

kki

ii

2

1 1

1

2

1

Wykład 5 Analiza współzależności. Analiza wariancji

Suma kwadratów odchyłek między realizacjami zmiennej X a poszczególnymi średnimi wewnątrz grup (podpróbek) (5.7) :

SSE = SST – SSB

Wariancja między grupami (5.8):

11

2

1

r

xxn

r

SSBMSB

r

iii

Wykład 5 Analiza współzależności. Analiza wariancji

gdzie w nawiasie okrągłym w liczniku (5.8) mamy odchyłki między średnimi grupowymi (lub przeciętnymi z poszczególnych podpróbek) a średnią ogólną dla całej próby.

Wariancja wewnątrz grup (wewnątrz podpróbek) (5.9):

rnnn

xxxxxx

rn

SSEMSE

r

n

k

n

krk

n

kkk

r

...

...

21

1 1

21

1

221

211

1 2

Przykład 5.1. Ceny wędlin w wylosowanych sklepach detalicznych Poznania. Czy ceny mięsa pochodzącego od różnych rzeźników różnią się istotnie?

Boucher Butcher Fleischer Henryk Suma cen

16 15,8 14,6 15,1 61,516,1 16,4 15,5 15,2 63,216,5 16,4 16 15,3 64,216,8 17 16,2 15,7 65,7

17 17,5 16,4 16 66,917,2 16,6 16,8 50,6

18 17,4 35,418,2 18,2

Suma cen od producenta (i) 117,6 83,1 130,9 94,1 425,7Liczby wędlin od (i) 7 5 8 6 26Średnie (i) 16,8 16,62 16,36 15,68 16,37

Uwaga: ceny wylosowanych wędlin zostały uporządkowane rosnąco. Porządek losowania nie

ma tu znaczenia.

Producent (grupa i)

Przykład 5.1. c.d.

0,64 0,6724 3,10641 0,34028Kwadraty odchyleń 0,49 0,0484 0,74391 0,23361pomiędzy konkretną 0,09 0,0484 0,13141 0,14694ceną a ich średnią 0 0,1444 0,02641 0,00028u danego rzeźnika 0,04 0,7744 0,00141 0,10028[grupy] 0,16 0,05641 1,24694

1,44 1,076413,37641

Suma kwadratów odchyłek 2,86 1,69 8,52 2,07 15,140,68796

a średnią ogólną 1,27584 0,30486 0,00089 2,85448 4,441,47869Wariancja między grupami (MSB) według wzoru 8.8

Wariancja wewnątrz grup (MSE) według wzoru 8.9Ważona suma kwadratów odchyłek między średnimi grupowymi

Wykład 5 Analiza współzależności. Analiza wariancji

F = 1,47869/0,68796 =2,1494. Na poziomie istotności α = 0,05 i

liczbach stopni swobody: k-1=4-1 = 3 (licznik) oraz n-k=26-

4=22 (mianownik) w rozkładzie Fishera-Snedecora

odczytujemy: F0,05;3;22 = 3,05 > F = 2,1494

Nie można więc odrzucić H0, że średnie w populacji

generalnej są sobie równe. Brak zatem podstaw do

stwierdzenia, że mięso pochodzące od poszczególnych

rzeźników różni się pod względem cen.

Wykład 6 Analiza współzależności. Korelacja cech jakościowych i ilościowych

1. Rodzaje zależnościa) Kryterium 1 - przyczynowo-skutkowe,

- korelacyjne,

- symptomatyczne,

- bilansowe

b) Kryterium 2- zależność funkcyjna,

· zależność stochastyczna,

· zależność korelacyjna.

c) Kryterium 3

- liniowe,

- krzywoliniowe,

- wg formalnej postaci równań

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (brak korelacji)

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (bardzo silna korelacja dodatnia - rxy = 0,94)

y = 0,5392x + 19,999

R2 = 0,8839

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zmie

nna

Y

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (wyraźna korelacja dodatnia - rxy = 0,5)

y = 0,24x + 35,65

R2 = 0,25

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (słaba korelacja dodatnia - rxy = 0,3)

y = 0,19x + 38,07

R2 = 0,09

0

10

20

30

40

50

60

70

80

90

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (bardzo silna korelacja ujemna- rxy = - 0,9)

y = -0,51x + 69,45

R2 = 0,81

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (wyraźna korelacja ujemna- rxy = - 0,6)

y = -0,33x + 61,56

R2 = 0,36

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (brak zależności liniowej - rxy = 0,00; bardzo silna korelacja krzywoliniowa, wielomian drugiego stopnia)

zależność linioway = -0,00x + 37,29

R2 = 0,00

Zależność paraboliczna

y = -0,0189x2 + 1,8314x + 3,6244

R2 = 0,9067

0

10

20

30

40

50

60

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Wykład 6 Rodzaje zależności (kryterium 3).