Rozkłady wywodzące się z rozkładu normalnego standardowego

1

Rozkłady wywodzące się z rozkładu normalnego standardowego

Bardzo ważną rolę w statystyce odgrywają trzy rozkłady zmiennych losowych bazujące na zmiennych o standardo-wych rozkładach normalnych. Są to następujące rozkłady:

1. 2 - (Chi-kwadrat)

2. t-Studenta

3. F-Fishera-Snedecora.

Ze statystykami opartymi na tych rozkładach związane są takie działy statystyki jak: przedziały ufności, weryfikacja hipotez, analiza wariancji i regresji.

2

Rozkład Chi-kwadrat

f xx

x e xv v x

v( )

0 0

2 02 2 212

1

dla

dla

E v D v 2 2 2 2

Zmienna losowa X ma rozkład Chi-kwadrat Pearsona, jeżeli jej funkcja gęstości prawdopodobieństwa dana jest wzorem:

Wielkość v występująca w podanym wyżej wzorze jest jednocześnie wartością oczekiwaną tej zmiennej, a jej podwojona wartość jest wariancją zmiennej:

3

Rozkład Chi-kwadrat (c.d.)

v ii

v

x i v2 2

1

1 2 dla , , . . . ,

v2

Jeżeli zmienne xi mają wszystkie standardowy rozkład normalny N(0; 1) i są niezależne, to zmienna:

ma rozkład chi-kwadrat.

Liczbę v nazywamy liczbą stopni swobody, wskazuje ona liczbę niezależnych składników zmiennej , jest jednocześnie wartością oczekiwaną tej zmiennej losowej. Wariancja tej zmiennej jest równa 2v.

4

Rozkład Chi-kwadrat (c.d.)

Poniżej podane są wykresy funkcji gęstości prawdopodo-

bieństwa zmiennej dla trzech wybranych stopni swobody.

0.000

0.010

0.020

0.030

0.040

0.050

v = 2

v = 6

v = 10

5

Rozkład t-Studenta

f tv

t

vt R v Nv

vv

v

vv

( )( )

( )

11

1

2

21

dla i

Et v 0 1dla D tv

vv2

22

dla

Zmienna losowa t ma rozkład t-Studenta, jeśli jej funkcja gęstości prawdopodobieństwa dana jest wzorem:

Liczba v jest liczbą stopni swobody, a parametrami rozkładu tej zmiennej losowej są odpowiednio:

6

Rozkład t-Studenta (c.d.)

X X X X v0 1 2, , , . . . ,

tX

Xv ii

v

0

1 2

1

Jeżeli zmienne losowe są nie-zależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to zmienna:

ma rozkład t-Studenta z liczbą stopni swobody v.

7

Rozkład t-Studenta (c.d.)

Poniżej podane są przykładowe wykresy funkcji gęstości

rozkładu t-Studenta dla trzech wybranych stopni swobody.

0

0.1

0.2

0.3

0.4

-3 -2 -1 0 1 2 3

v=1

v=4

v=30

8

Rozkład F-Fishera-Snedecora

Zmienna losowa X ma rozkład F-Fishera-Snedecora, jeżeli jej funkcja gęstości prawdopodobieństwa dana jest wzorem:

gdzie u i v są liczbami stopni swobody.

Parametrami zmiennej losowej F-Fishera-Snedecora są odpowiednio:

f x

x

u vx

ux vxu v

u v

u v

u v

u

u v, ( )

( )

0 0

02 2

2

2

2

2 2

1

dla

dla

EFv

vv

22dla D F

v u v

u v vv2

2

2

2 2

2 44

( )

( ) ( )dla

9

Rozkład F-Fishera-Snedecora (c.d.)

Jeżeli zmienne losowe i są niezależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to zmienna:

ma rozkład F-Fishera-Snedecora z liczbami stopni swobody

u i v.

X X X u1 2, , . . . , Y Y Yv1 2, , . . . ,

1 2

1

1 2

1

u ii

u

v ii

v

X

Y

10

Rozkład F-Fishera-Snedecora (c.d.)

Poniżej podane są przykładowe wykresy funkcji gęstości rozkładu F-Fischera-Snedecora dla trzech wybranych par stopni swobody

11

Wielowymiarowe zmienne losowe

12

Wprowadzenie

Niech E będzie zbiorem zdarzeń elementarnych danego ekspery-mentu. Układ n funkcji (X1, X2, ..., Xn) przyporządkowujących każdemu zdarzeniu elementarnemu eE n liczb rzeczywistych (x1, x2, ..., xn) nazywamy zmienną losową n-wymiarową.Przykład: W badaniach sytuacji finansowej rodzin analizujemy takie cechy jak:

x1 - liczbę członków rodziny;

x2 - dochód na członka;

x3 - liczbę izb w mieszkaniu.Wyniki pomiarów dla poszczególnych rodzin, uporządkowane w podany wyżej sposób można traktować jako realizację 3-wymia-rowej zmiennej losowej (X1, X2, X3).

13

Dwuwymiarowe zmienne losowe

Zmienne losowe (dwuwymiarowe) wielowymiarowe mogą być zarówno skokowe jak i ciągłe.

Dwuwymiarowa zmienna losowa (X, Y) jest typu skokowego, jeżeli przyjmuje skończoną lub przeliczalną liczbę wartości (xi, yj) z odpowiednimi prawdopodobieństwami pij.

Rozkład dwuwymiarowej zmiennej losowej typu skokowego może być określony funkcją rozkładu prawdopodobieństwa:

P X x Y y p

gdzie p

i j ij

iji j

( )

,

1

14

Dwuwymiarowe zmienne losowe

Rozkład dwuwymiarowej zmiennej losowej typu skokowego

może być także określony funkcją dystrybuanty:

F x y P X x Y y

P X x Y yi jy yx x ji

( , ) ( )

( )

15

Przykład liczbowy

Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej będzie dana tabelką

1 2 3 pi.

1 0,06 0,03 0,04 0,13

2 0,07 0,04 0,13 0,24

3 0,07 0,06 0,20 0,33

4 0,05 0,12 0,13 0,30

p.j 0,25 0,25 0,50 1,00

X Y

16

Rozkłady brzegowe

Rozkład jednej tylko zmiennej, X lub Y, bez względu na rozkład drugiej, będziemy nazywali rozkładem brzegowym tej zmiennej.

Rozkłady brzegowe są rozkładami jednowymiarowymi, a ich f.r.p. określone są następująco:

P X x p p

P Y y p p

i i ijj

j j iji

( )

( )

.

.

17

Niezależność zmiennych losowych

Dwuwymiarowe zmienne losowe skokowe (X,Y) są niezależne, jeżeli:

dla każdego i,j.

Dla dwuwymiarowych zmiennych losowych dowolnego typu warunek niezależności można zdefiniować następująco:

zmienne losowe (X,Y) są niezależne wtedy i tylko wtedy, gdy F(x,y)=F(x)F(y)

p p pij i j . .

18

Rozkłady warunkowe

W przypadku rozkładów dwuwymiarowych istnieje możli-wość określenia rozkładu jednej zmiennej pod warunkiem, że druga zmienna przyjmie określone wartości.

Warunkowe funkcje rozkładu prawdopodobieństwa określone są następująco:

P X x Y yp

p

P Y y X xp

p

i jij

j

j iij

i

( )

( )

.

.

19

Warunkowe funkcje prawdopodobieństwa

Obliczając warunkowe f.r.p. dla zmiennej losowej Y w naszym przykładzie otrzymamy:

1 2 3

1 0,46 0,23 0,31 1

2 0,29 0,17 0,54 1

3 0,21 0,18 0,61 1

4 0,17 0,40 0,43 1

p

pij

ij .Y

ixX

20

Parametry rozkładu dwuwymiarowej zmiennej losowej

Momentem zwykłym rzędu k+l (k, l = 0, 1,...) dwuwymiarowej zmiennej losowej (X,Y) typu skokowego nazywamy wyrażenie:

Z powyższego wynika, że istnieją dwa momenty rzędu pierwszego m10 i m01, przy czym

m10=EX oraz m01=EY,

tym samym momenty te są wartościami oczekiwanymi w rozkładach brzegowych zmiennych X i Y.

m EX Y x y pklk l

ik

jl

ijji

21

Parametry rozkładu (c.d.)

Podobnie istnieją trzy momenty rzędu drugiego:

m20=EX2; m02=EY2; m11=EXY

Przykład: Obliczając momenty rzędu pierwszego i drugiego w naszym przykładzie otrzymujemy:m10=EX=1 • 0,13 + 2 • 0,24 + 3 • 0,33 + 4 • 0,30 = 2,8

m01=EY=1 • 0,25 + 2 • 0,25 + 3 • 0,50 = 2,25

m20=EX2=12 • 0,13+22 • 0,24+32 • 0,33+42 • 0,30 = 0,13+0,96+2,97+4,80 = 8,86

m02=EY2=12 • 0,25 + 22 • 0,25 + 32 • 0,50 = 0,25 + 1,00 + 4,50 = 5,75

m11=EXY=1 • 1 • 0,06 + 1 • 2 • 0,03 +1 • 3 • 0,04+2 • 1 • 0,07+ 2 • 2 • 0,04 +

+ 2 • 3 • 0,13 +3 • 1 • 0,07 +3 • 2 • 0,06 +3 • 3 • 0,20+

+ 4 • 1 • 0,05 + 4 • 2 • 0,12 + 4 • 3 • 0,13 = 0,24 + 1,08 + 2,37 + 2,72 = 6,41

22

Parametry rozkładu (c.d.)

Momentem centralnym rzędu k+l (k, l = 0, 1,...) dwuwy-miarowego rozkładu zmiennej losowej (X,Y) typu skokowego nazywamy wyrażenie:

klk l

ik

jl

ijji

E X m Y m

x m y m p

( ) ( )

( ) ( )

10 01

10 01

23

Obliczanie momentów centralnych

Z definicji momentu centralnego wynika, że:

Istnieje jeszcze jeden moment centralny rzędu drugiego:

Moment ten nazywamy kowariancją i oznaczamy symbolem CXY.

10 10 01 010 0 E X m E Y m( ) , ( )

20 102 2

02 022 2 E X m D X E Y m D Y( ) , ( )

11 10 01 E X m Y m( )( )

24

Związki między momentami

Między momentami centralnymi a zwykłymi zachodzą związki:

Można udowodnić, że jeżeli zmienne losowe (X,Y) są niezależne, to kowariancja jest równa zero. O zmiennych (X,Y), dla których CXY=0 mówimy, że są nieskorelowane.

20 20 102

02 02 012

11 11 10 01

m m

m m

m m m EXY EX EY

25

Współczynnik korelacji

Z kowariancją związany jest jeszcze jeden parametr rozkładu dwuwymiarowego, tzw. współczynnik korelacji zmiennych losowych (X,Y):

Z własności kowariancji wynika następująca własność współczynnika korelacji:

Współczynnik korelacji jest miarą siły związku między zmiennymi losowymi.

CXY

DX DY

1 1

26

Obliczenia momentów centralnych i współczynnika korelacji

Korzystając ze związków między momentami otrzymujemy

w naszym przykładzie:

Możemy już obliczyć współczynnik korelacji:

202

022

8 86 2 8 8 86 7 84 1 02

5 75 2 25 5 75 5 0625 0 6875

, , , , ,

, , , , ,

11 6 41 2 8 2 25 6 41 6 3 0 11 , , , , , ,

0 11

1 02 0 6815

0 11

0 8340 131

,

, ,

,

,,

27

Warunkowe wartości oczekiwane

Warunkową wartością oczekiwaną zmiennej losowej Y przy warunku, że zmienna X = xi nazywamy wyrażenie:

Analogicznie definiujemy warunkową wartość oczekiwaną zmiennej X:

E Y X x yp

pi jij

ij

( ).

E X Y y xp

pj iij

ji

( ).

28

Obliczanie warunkowych wartości oczekiwanych

Obliczmy warunkowe wartości oczekiwane zmiennej losowej Y w naszym przykładzie. Kolejno otrzymujemy:

E(Y/X=1)=10,46+20,23+30,31=1,85

E(Y/X=2)=10,29+20,17+30,54=2,25

E(Y/X=3)=10,21+20,18+30,61=2,40

E(Y/X=4)=10,17+20,40+30,43=2,26

29

Funkcja regresji I rodzaju

Warunkowe wartości oczekiwane zmiennej Y zależą od wartości zmiennej X, są pewną funkcją tej zmiennej. Funkcję tę możemy zapisać następująco:

Tak określoną funkcję nazywamy funkcją regresji I rodzaju zmiennej losowej Y względem zmiennej losowej X.

W naszym przykładzie funkcję tę można zapisać następująco:

E Y X x m xi( ) ( )

m x

dla x

dla x

dla x

dla x

( )

,

,

,

,

185 1

2 25 2

2 40 3

2 26 4

30

Wykres funkcji regresji I rodzaju

0.00

0.50

1.00

1.50

2.00

2.50

0 1 2 3 4

31

Funkcja regresji II rodzaju

W praktyce najwygodniej jest zastąpić nieliniowe krzywe regresji I rodzaju funkcjami liniowymi, jeżeli tylko takie przybliżenie jest wystarczające.

Spośród wszystkich możliwych prostych wybieramy taką, dla której średnie odchylenie kwadratowe wartości danej zmiennej od tej prostej jest minimalne:

E Y a bX{[ ( )] } min 2

32

Funkcja regresji II rodzaju (c.d.)

Rozwiązując ten warunek otrzymujemy:

Parametr b nazywamy współczynnikiem regresji liniowej zmiennej Y względem X.

W naszym przykładzie otrzymujemy:

Tym samym prosta regresji ma postać:

bCXY

D Xa EY bEX

2

b oraz

a

0 11

1 020 1078

2 25 0 1078 2 8 1 9481

,

,,

, , , ,

~, ,Y X 0 1078 1 9481

33

Wykres funkcji regresji II rodzaju

0

0.5

1

1.5

2

2.5

0 1 2 3 4

I r

II r

Rozkłady wywodzące się z rozkładu normalnego standardowego

Documents

Transcript of Rozkłady wywodzące się z rozkładu normalnego standardowego