Wykład 4. Rozkłady teoretyczne

36
Wykład 4. Rozkłady teoretyczne Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem. Rozkład normalny Podstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny (Gaussa-Laplace’a). Zmienna losowa X ma rozkład normalny, jeśli jej funkcja gęstości - określona dla wszystkich rzeczywistych wartości x - da się przedstawić za pomocą wzoru (4.1): , 2 ) ( exp 2 1 = ) ( 2 2 m x x f

description

Wykład 4. Rozkłady teoretyczne. Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem. Rozkład normalny - PowerPoint PPT Presentation

Transcript of Wykład 4. Rozkłady teoretyczne

Page 1: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne

Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem.

Rozkład normalnyPodstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny

(Gaussa-Laplace’a). Zmienna losowa X ma rozkład normalny, jeśli jej funkcja gęstości - określona dla wszystkich rzeczywistych wartości x - da się przedstawić za pomocą wzoru (4.1):

,2

)(exp

2

1=)(

2

2

mx

xf

Page 2: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne

Realizacje zmiennej losowej o rozkładzie normalnym są określone w przedziale - < x < +

Funkcja gęstości rozkładu normalnego, dana wzorem 4.1. ma następujące własności:

1) jest symetryczna względem prostej x = m (własność symetryczności),

2) osiąga maksimum dla x = m (własność jednomodalności),

3) jej ramiona mają dwa punkty przegięcia dla x1 m- σ;

4) oraz x2 m + σ ,

4) jest całkowicie określona przez dwa parametry: parametr m decyduje o przesunięciu krzywej, natomiast parametr σ decyduje o smukłości krzywej; własność określoności wyróżniamy zapisem N(m; σ) .

Page 3: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; rozkład normalny

Rys. 4.1 Gêstoœæ rozk³adu normalnego

0,000

0,005

0,010

0,015

0,020

0,025

0,030

0,035

0,040

-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0

Kwantyle

Punkty przegiêcia

Page 4: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; rozkład normalny

Rozkład normalny N (0,1) nazywa się standardowym rozkładem normalnym. Jego dystrybuanta wyraża się wzorem (4.2):

gdzie (4.3)

xu duexF ,

2

1=)( 2/

mx

u

Page 5: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; dystrybuanta rozkładu normalnego

Rys. 4.2. Dystrybuanta rozkładu normalnego standaryzowanego N(0;1)

0,00

0,01

0,02

0,03

0,04

-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5

Kwantyle rozkładu normalnego

Pra

wdo

podo

bień

stw

o

Page 6: Wykład 4. Rozkłady teoretyczne

Tablica 4.1. Dystrybuanta rozkładu normalnego standaryzowanego N(0;1), I rodzaj tablic (pole pod krzywą od minus nieskończoność do x) u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,10 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,20 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,30 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,40 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,50 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,60 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,70 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,80 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,90 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,00 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,10 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,20 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,30 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,40 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,50 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,60 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,70 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,80 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,90 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,00 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,10 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,20 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

Page 7: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; rozkład normalny

Funkcje związane z rozkładem normalnym w Excelu:

A. Dowolny rozkład normalny:

a) dane są: średnia, odchylenie standardowe, wartość empiryczna x - poszukujemy pole czyli „lewy ogonek”:

- [fx]=>statystyczne=>rozkład.normalny ==>dane: m, s, x oraz jako „skumulowany” wpisać jako wartość logiczną „1”

b) dane jest prawdopodobieństwo, średnia, odchylenie standardowe - poszukujemy kwantyl empiryczny x,

- [fx]=>statystyczne=>rozkład.normalny ==>dane

Page 8: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; rozkład normalny

B. Rozkład normalny standaryzowany

a) dany jest kwantyl - poszukujemy pole „lewy ogonek”:

- [fx]=>statystyczne=>rozkład.normalny.S==> kwantyl

b) dane jest pole - poszukujemy kwantyl rozkładu normalnego:

- [fx]=>statystyczne=>rozkład.normalny.S.odw==> pole pod krzywą rozkładu normalnego od - do szukanego x.

Obliczanie prawdopodobieństw P(a<X<b) dla zmiennej losowej o rozkładzie normalnym można przedstawić przy pomocy zmiennej standaryzowanej U(0,1) w sposób następujący:

Page 9: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

)()(mbmXma

PbXaP

)())

()(ma

Fmb

Fmb

Uma

P

)()( ab uFuF

Page 10: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

Przykład 1:

Temperatura ciała ludzkiego jest zmienną losową o rozkładzie normalnym ze średnią wynoszącą 36,6oC oraz odchyleniem standardowym . Oblicz prawdopodobieństwo zdarzenia, że losowo wybrany pacjent pewnego szpitala będzie miał temperaturę ciała:

a) mniejszą niż 36,3oC,

b) większą niż 37,6 oC,

c) większą niż 37,9 oC ale mniejszą niż 38,2oC.

ad. a)

)3,36( Xp

6,05,0

3,0

5,0

6,363,36

u

Page 11: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

ad. b)

P(X>37,6) P(X>37,6)=P(u>2)=1-F(2)=1-0,97725=0,02275, patrz rys. 4.3.

Page 12: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego

ad. c)

004,09953,09993,0

)6,2()2,3()2,36,2()2,389,37(

FFUPXP

Page 13: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego

1) Rozkład normalny standaryzowany N(0;1) ma E(u) = 0 oraz S2 = 1;

2) Pole pod krzywą rozkładu normalnego standaryzowanego N(0;1) jest

równe jedności;

3) Punkty przegięcia: u1 = -1 oraz u2 = +1;

4) Współczynnik asymetrii alfa 3 = 0;

5) Współczynnik koncentracji alfa 4 = 3;

6) Mo = Me = E(u)

7) Q1 = - 0,6745; Q3 = +0,6745

Page 14: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego

8) W przedziale od – 1 do + 1 znajduje się ponad 68% zbiorowości,

od – 2 do + 2 około 95%,

od – 3 do + 3 ponad 99% całej zbiorowości;

9) Rozkład normalny jako rozkład błędów w teorii pomiarów;

10) Występowanie rozkładu normalnego w świecie przyrody: mity i

rzeczywistość;

11) Rzadkość występowania rozkładu normalnego w zjawiskach społeczno-

ekonomicznych;

Page 15: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego

12)Miejsce rozkładu normalnego w teorii statystyki:

a. aproksymacja statystyczna,

b. przybliżenie krzywą Gaussa – Laplace’a innych rozkładów teoretycznych

ciągłych (Studenta, , Fishera – Snedecora) i dyskretnych (dwumianowy,

Poissona)

c. estymacja statystyczna,

d. weryfikacja hipotez statystycznych,

e. ocena niezbędnej wielkości próby w badaniach reprezentacyjnych..

Page 16: Wykład 4. Rozkłady teoretyczne

Wykład 4. Rozkłady teoretyczne; Rozkład Studenta

Rozkład t-Studenta według liczby stopni swobody

0,000

0,005

0,010

0,015

0,020

0,025

-4 -3 -2 -1 0 1 2 3 4

Kwantyle rozkładu Studenta

Funk

cja

gęst

ości

1

10

30

70

100

Page 17: Wykład 4. Rozkłady teoretyczne

Wykład 4. Tablice rozkładu Studenta „dwuogonowe”

Tablica 4.2. Kwantyle rozkładu Studenta z dwoma obszaramikrytycznymi ("dwugoniaste") dla małej liczby stopni swobody.

Liczba stopni

0,50 0,40 0,30 0,20 0,10 0,04 0,02 0,01 0,002

swobody1 1,00 1,38 1,96 3,08 6,31 15,89 31,82 63,66 318,292 0,82 1,06 1,39 1,89 2,92 4,85 6,96 9,92 22,333 0,76 0,98 1,25 1,64 2,35 3,48 4,54 5,84 10,214 0,74 0,94 1,19 1,53 2,13 3,00 3,75 4,60 7,175 0,73 0,92 1,16 1,48 2,02 2,76 3,36 4,03 5,896 0,72 0,91 1,13 1,44 1,94 2,61 3,14 3,71 5,217 0,71 0,90 1,12 1,41 1,89 2,52 3,00 3,50 4,798 0,71 0,89 1,11 1,40 1,86 2,45 2,90 3,36 4,509 0,70 0,88 1,10 1,38 1,83 2,40 2,82 3,25 4,30

10 0,70 0,88 1,09 1,37 1,81 2,36 2,76 3,17 4,1411 0,70 0,88 1,09 1,36 1,80 2,33 2,72 3,11 4,0212 0,70 0,87 1,08 1,36 1,78 2,30 2,68 3,05 3,9313 0,69 0,87 1,08 1,35 1,77 2,28 2,65 3,01 3,8514 0,69 0,87 1,08 1,35 1,76 2,26 2,62 2,98 3,7915 0,69 0,87 1,07 1,34 1,75 2,25 2,60 2,95 3,73

Page 18: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności.

1. Analiza wariancji

a) analiza jednoczynnikowa (podział wg 1 kryterium)

- Porównanie średnich w dowolnej liczbie subpopulacji (prób) o

rozkładzie normalnym lub zbliżonym do normalnego oraz o

jednakowych wariancjach.

H0: M1 = M2 = M3 = . . . (5.1)

H1: M1 M2 M3 . . . (5.2)

Page 19: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

Do weryfikacji hipotezy (5.1) wykorzystuje się test Fishera-Snedecora o

postaci:

F = MSB/MSE, gdy MSB > MSE, (5.3)

lub

F = MSE/MSB, gdy MSB < MSE, (5.4)

gdzie: MSB – średni kwadrat odchyleń od średniej między grupami

(próbami),

MSE – średni kwadrat odchyleń od średniej wewnątrz grup

Page 20: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

Tablica 5.1. Analiza wariancji z uwzględnieniem liczby zmiennych (grup) oraz liczby obserwacji:

Źródło zmienności Suma kwadratów odchyleń

Stopnie swobody

Średni kwadrat odchyleń

1. Czynnik (podpróbka, klasyfikacja) r - 1

- zróżnicowanie międzygrupowe r-liczba grup

2. Błąd losowy n – r- zróżnicowanie wewnątrzgrupowe n-liczba

wszystkich jednostek

3. Ogółem dla całej próby SST r-1+n-r=n-1 MSB+MSE

SSB MSB

SSE MSE

Page 21: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

Ogólna suma kwadratów odchyłek (5.5):

2

1 1

2

2

1 1

1 1

2 xnxn

xxSST

r

i

n

kki

r

i

n

kkir

i

n

kki

i

i

i

Page 22: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

Ważona suma kwadratów odchyłek między średnimi grupowymi a średnią ogólną (5.6):

n

x

n

xSSB

r

i

n

kkir

i i

n

kki

ii

2

1 1

1

2

1

Page 23: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

Suma kwadratów odchyłek między realizacjami zmiennej X a poszczególnymi średnimi wewnątrz grup (podpróbek) (5.7) :

SSE = SST – SSB

Wariancja między grupami (5.8):

11

2

1

r

xxn

r

SSBMSB

r

iii

Page 24: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

gdzie w nawiasie okrągłym w liczniku (5.8) mamy odchyłki między średnimi grupowymi (lub przeciętnymi z poszczególnych podpróbek) a średnią ogólną dla całej próby.

Wariancja wewnątrz grup (wewnątrz podpróbek) (5.9):

rnnn

xxxxxx

rn

SSEMSE

r

n

k

n

krk

n

kkk

r

...

...

21

1 1

21

1

221

211

1 2

Page 25: Wykład 4. Rozkłady teoretyczne

Przykład 5.1. Ceny wędlin w wylosowanych sklepach detalicznych Poznania. Czy ceny mięsa pochodzącego od różnych rzeźników różnią się istotnie?

Boucher Butcher Fleischer Henryk Suma cen

16 15,8 14,6 15,1 61,516,1 16,4 15,5 15,2 63,216,5 16,4 16 15,3 64,216,8 17 16,2 15,7 65,7

17 17,5 16,4 16 66,917,2 16,6 16,8 50,6

18 17,4 35,418,2 18,2

Suma cen od producenta (i) 117,6 83,1 130,9 94,1 425,7Liczby wędlin od (i) 7 5 8 6 26Średnie (i) 16,8 16,62 16,36 15,68 16,37

Uwaga: ceny wylosowanych wędlin zostały uporządkowane rosnąco. Porządek losowania nie

ma tu znaczenia.

Producent (grupa i)

Page 26: Wykład 4. Rozkłady teoretyczne

Przykład 5.1. c.d.

0,64 0,6724 3,10641 0,34028Kwadraty odchyleń 0,49 0,0484 0,74391 0,23361pomiędzy konkretną 0,09 0,0484 0,13141 0,14694ceną a ich średnią 0 0,1444 0,02641 0,00028u danego rzeźnika 0,04 0,7744 0,00141 0,10028[grupy] 0,16 0,05641 1,24694

1,44 1,076413,37641

Suma kwadratów odchyłek 2,86 1,69 8,52 2,07 15,140,68796

a średnią ogólną 1,27584 0,30486 0,00089 2,85448 4,441,47869Wariancja między grupami (MSB) według wzoru 8.8

Wariancja wewnątrz grup (MSE) według wzoru 8.9Ważona suma kwadratów odchyłek między średnimi grupowymi

Page 27: Wykład 4. Rozkłady teoretyczne

Wykład 5 Analiza współzależności. Analiza wariancji

F = 1,47869/0,68796 =2,1494. Na poziomie istotności α = 0,05 i

liczbach stopni swobody: k-1=4-1 = 3 (licznik) oraz n-k=26-

4=22 (mianownik) w rozkładzie Fishera-Snedecora

odczytujemy: F0,05;3;22 = 3,05 > F = 2,1494

Nie można więc odrzucić H0, że średnie w populacji

generalnej są sobie równe. Brak zatem podstaw do

stwierdzenia, że mięso pochodzące od poszczególnych

rzeźników różni się pod względem cen.

Page 28: Wykład 4. Rozkłady teoretyczne

Wykład 6 Analiza współzależności. Korelacja cech jakościowych i ilościowych

1. Rodzaje zależnościa) Kryterium 1 - przyczynowo-skutkowe,

- korelacyjne,

- symptomatyczne,

- bilansowe

b) Kryterium 2- zależność funkcyjna,

· zależność stochastyczna,

· zależność korelacyjna.

c) Kryterium 3

- liniowe,

- krzywoliniowe,

- wg formalnej postaci równań

Page 29: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (brak korelacji)

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Page 30: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (bardzo silna korelacja dodatnia - rxy = 0,94)

y = 0,5392x + 19,999

R2 = 0,8839

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zmie

nna

Y

Page 31: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (wyraźna korelacja dodatnia - rxy = 0,5)

y = 0,24x + 35,65

R2 = 0,25

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Page 32: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (słaba korelacja dodatnia - rxy = 0,3)

y = 0,19x + 38,07

R2 = 0,09

0

10

20

30

40

50

60

70

80

90

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Page 33: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (bardzo silna korelacja ujemna- rxy = - 0,9)

y = -0,51x + 69,45

R2 = 0,81

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Page 34: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (wyraźna korelacja ujemna- rxy = - 0,6)

y = -0,33x + 61,56

R2 = 0,36

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Page 35: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).

Rodzaje zależności (brak zależności liniowej - rxy = 0,00; bardzo silna korelacja krzywoliniowa, wielomian drugiego stopnia)

zależność linioway = -0,00x + 37,29

R2 = 0,00

Zależność paraboliczna

y = -0,0189x2 + 1,8314x + 3,6244

R2 = 0,9067

0

10

20

30

40

50

60

0 10 20 30 40 50 60 70 80 90 100

Zmienna X

Zm

ienn

a Y

Page 36: Wykład 4. Rozkłady teoretyczne

Wykład 6 Rodzaje zależności (kryterium 3).