Rozkłady wywodzące się z rozkładu normalnego standardowego
description
Transcript of Rozkłady wywodzące się z rozkładu normalnego standardowego
1
Rozkłady wywodzące się z rozkładu normalnego standardowego
Bardzo ważną rolę w statystyce odgrywają trzy rozkłady zmiennych losowych bazujące na zmiennych o standardo-wych rozkładach normalnych. Są to następujące rozkłady:
1. 2 - (Chi-kwadrat)
2. t-Studenta
3. F-Fishera-Snedecora.
Ze statystykami opartymi na tych rozkładach związane są takie działy statystyki jak: przedziały ufności, weryfikacja hipotez, analiza wariancji i regresji.
2
Rozkład Chi-kwadrat
f xx
x e xv v x
v( )
0 0
2 02 2 212
1
dla
dla
E v D v 2 2 2 2
Zmienna losowa X ma rozkład Chi-kwadrat Pearsona, jeżeli jej funkcja gęstości prawdopodobieństwa dana jest wzorem:
Wielkość v występująca w podanym wyżej wzorze jest jednocześnie wartością oczekiwaną tej zmiennej, a jej podwojona wartość jest wariancją zmiennej:
3
Rozkład Chi-kwadrat (c.d.)
v ii
v
x i v2 2
1
1 2 dla , , . . . ,
v2
Jeżeli zmienne xi mają wszystkie standardowy rozkład normalny N(0; 1) i są niezależne, to zmienna:
ma rozkład chi-kwadrat.
Liczbę v nazywamy liczbą stopni swobody, wskazuje ona liczbę niezależnych składników zmiennej , jest jednocześnie wartością oczekiwaną tej zmiennej losowej. Wariancja tej zmiennej jest równa 2v.
4
Rozkład Chi-kwadrat (c.d.)
Poniżej podane są wykresy funkcji gęstości prawdopodo-
bieństwa zmiennej dla trzech wybranych stopni swobody.
0.000
0.010
0.020
0.030
0.040
0.050
v = 2
v = 6
v = 10
5
Rozkład t-Studenta
f tv
t
vt R v Nv
vv
v
vv
( )( )
( )
11
1
2
21
dla i
Et v 0 1dla D tv
vv2
22
dla
Zmienna losowa t ma rozkład t-Studenta, jeśli jej funkcja gęstości prawdopodobieństwa dana jest wzorem:
Liczba v jest liczbą stopni swobody, a parametrami rozkładu tej zmiennej losowej są odpowiednio:
6
Rozkład t-Studenta (c.d.)
X X X X v0 1 2, , , . . . ,
tX
Xv ii
v
0
1 2
1
Jeżeli zmienne losowe są nie-zależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to zmienna:
ma rozkład t-Studenta z liczbą stopni swobody v.
7
Rozkład t-Studenta (c.d.)
Poniżej podane są przykładowe wykresy funkcji gęstości
rozkładu t-Studenta dla trzech wybranych stopni swobody.
0
0.1
0.2
0.3
0.4
-3 -2 -1 0 1 2 3
v=1
v=4
v=30
8
Rozkład F-Fishera-Snedecora
Zmienna losowa X ma rozkład F-Fishera-Snedecora, jeżeli jej funkcja gęstości prawdopodobieństwa dana jest wzorem:
gdzie u i v są liczbami stopni swobody.
Parametrami zmiennej losowej F-Fishera-Snedecora są odpowiednio:
f x
x
u vx
ux vxu v
u v
u v
u v
u
u v, ( )
( )
0 0
02 2
2
2
2
2 2
1
dla
dla
EFv
vv
22dla D F
v u v
u v vv2
2
2
2 2
2 44
( )
( ) ( )dla
9
Rozkład F-Fishera-Snedecora (c.d.)
Jeżeli zmienne losowe i są niezależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to zmienna:
ma rozkład F-Fishera-Snedecora z liczbami stopni swobody
u i v.
X X X u1 2, , . . . , Y Y Yv1 2, , . . . ,
1 2
1
1 2
1
u ii
u
v ii
v
X
Y
10
Rozkład F-Fishera-Snedecora (c.d.)
Poniżej podane są przykładowe wykresy funkcji gęstości rozkładu F-Fischera-Snedecora dla trzech wybranych par stopni swobody
11
Wielowymiarowe zmienne losowe
12
Wprowadzenie
Niech E będzie zbiorem zdarzeń elementarnych danego ekspery-mentu. Układ n funkcji (X1, X2, ..., Xn) przyporządkowujących każdemu zdarzeniu elementarnemu eE n liczb rzeczywistych (x1, x2, ..., xn) nazywamy zmienną losową n-wymiarową.Przykład: W badaniach sytuacji finansowej rodzin analizujemy takie cechy jak:
x1 - liczbę członków rodziny;
x2 - dochód na członka;
x3 - liczbę izb w mieszkaniu.Wyniki pomiarów dla poszczególnych rodzin, uporządkowane w podany wyżej sposób można traktować jako realizację 3-wymia-rowej zmiennej losowej (X1, X2, X3).
13
Dwuwymiarowe zmienne losowe
Zmienne losowe (dwuwymiarowe) wielowymiarowe mogą być zarówno skokowe jak i ciągłe.
Dwuwymiarowa zmienna losowa (X, Y) jest typu skokowego, jeżeli przyjmuje skończoną lub przeliczalną liczbę wartości (xi, yj) z odpowiednimi prawdopodobieństwami pij.
Rozkład dwuwymiarowej zmiennej losowej typu skokowego może być określony funkcją rozkładu prawdopodobieństwa:
P X x Y y p
gdzie p
i j ij
iji j
( )
,
1
14
Dwuwymiarowe zmienne losowe
Rozkład dwuwymiarowej zmiennej losowej typu skokowego
może być także określony funkcją dystrybuanty:
F x y P X x Y y
P X x Y yi jy yx x ji
( , ) ( )
( )
15
Przykład liczbowy
Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej będzie dana tabelką
1 2 3 pi.
1 0,06 0,03 0,04 0,13
2 0,07 0,04 0,13 0,24
3 0,07 0,06 0,20 0,33
4 0,05 0,12 0,13 0,30
p.j 0,25 0,25 0,50 1,00
X Y
16
Rozkłady brzegowe
Rozkład jednej tylko zmiennej, X lub Y, bez względu na rozkład drugiej, będziemy nazywali rozkładem brzegowym tej zmiennej.
Rozkłady brzegowe są rozkładami jednowymiarowymi, a ich f.r.p. określone są następująco:
P X x p p
P Y y p p
i i ijj
j j iji
( )
( )
.
.
17
Niezależność zmiennych losowych
Dwuwymiarowe zmienne losowe skokowe (X,Y) są niezależne, jeżeli:
dla każdego i,j.
Dla dwuwymiarowych zmiennych losowych dowolnego typu warunek niezależności można zdefiniować następująco:
zmienne losowe (X,Y) są niezależne wtedy i tylko wtedy, gdy F(x,y)=F(x)F(y)
p p pij i j . .
18
Rozkłady warunkowe
W przypadku rozkładów dwuwymiarowych istnieje możli-wość określenia rozkładu jednej zmiennej pod warunkiem, że druga zmienna przyjmie określone wartości.
Warunkowe funkcje rozkładu prawdopodobieństwa określone są następująco:
P X x Y yp
p
P Y y X xp
p
i jij
j
j iij
i
( )
( )
.
.
19
Warunkowe funkcje prawdopodobieństwa
Obliczając warunkowe f.r.p. dla zmiennej losowej Y w naszym przykładzie otrzymamy:
1 2 3
1 0,46 0,23 0,31 1
2 0,29 0,17 0,54 1
3 0,21 0,18 0,61 1
4 0,17 0,40 0,43 1
p
pij
ij .Y
ixX
20
Parametry rozkładu dwuwymiarowej zmiennej losowej
Momentem zwykłym rzędu k+l (k, l = 0, 1,...) dwuwymiarowej zmiennej losowej (X,Y) typu skokowego nazywamy wyrażenie:
Z powyższego wynika, że istnieją dwa momenty rzędu pierwszego m10 i m01, przy czym
m10=EX oraz m01=EY,
tym samym momenty te są wartościami oczekiwanymi w rozkładach brzegowych zmiennych X i Y.
m EX Y x y pklk l
ik
jl
ijji
21
Parametry rozkładu (c.d.)
Podobnie istnieją trzy momenty rzędu drugiego:
m20=EX2; m02=EY2; m11=EXY
Przykład: Obliczając momenty rzędu pierwszego i drugiego w naszym przykładzie otrzymujemy:m10=EX=1 • 0,13 + 2 • 0,24 + 3 • 0,33 + 4 • 0,30 = 2,8
m01=EY=1 • 0,25 + 2 • 0,25 + 3 • 0,50 = 2,25
m20=EX2=12 • 0,13+22 • 0,24+32 • 0,33+42 • 0,30 = 0,13+0,96+2,97+4,80 = 8,86
m02=EY2=12 • 0,25 + 22 • 0,25 + 32 • 0,50 = 0,25 + 1,00 + 4,50 = 5,75
m11=EXY=1 • 1 • 0,06 + 1 • 2 • 0,03 +1 • 3 • 0,04+2 • 1 • 0,07+ 2 • 2 • 0,04 +
+ 2 • 3 • 0,13 +3 • 1 • 0,07 +3 • 2 • 0,06 +3 • 3 • 0,20+
+ 4 • 1 • 0,05 + 4 • 2 • 0,12 + 4 • 3 • 0,13 = 0,24 + 1,08 + 2,37 + 2,72 = 6,41
22
Parametry rozkładu (c.d.)
Momentem centralnym rzędu k+l (k, l = 0, 1,...) dwuwy-miarowego rozkładu zmiennej losowej (X,Y) typu skokowego nazywamy wyrażenie:
klk l
ik
jl
ijji
E X m Y m
x m y m p
( ) ( )
( ) ( )
10 01
10 01
23
Obliczanie momentów centralnych
Z definicji momentu centralnego wynika, że:
Istnieje jeszcze jeden moment centralny rzędu drugiego:
Moment ten nazywamy kowariancją i oznaczamy symbolem CXY.
10 10 01 010 0 E X m E Y m( ) , ( )
20 102 2
02 022 2 E X m D X E Y m D Y( ) , ( )
11 10 01 E X m Y m( )( )
24
Związki między momentami
Między momentami centralnymi a zwykłymi zachodzą związki:
Można udowodnić, że jeżeli zmienne losowe (X,Y) są niezależne, to kowariancja jest równa zero. O zmiennych (X,Y), dla których CXY=0 mówimy, że są nieskorelowane.
20 20 102
02 02 012
11 11 10 01
m m
m m
m m m EXY EX EY
25
Współczynnik korelacji
Z kowariancją związany jest jeszcze jeden parametr rozkładu dwuwymiarowego, tzw. współczynnik korelacji zmiennych losowych (X,Y):
Z własności kowariancji wynika następująca własność współczynnika korelacji:
Współczynnik korelacji jest miarą siły związku między zmiennymi losowymi.
CXY
DX DY
1 1
26
Obliczenia momentów centralnych i współczynnika korelacji
Korzystając ze związków między momentami otrzymujemy
w naszym przykładzie:
Możemy już obliczyć współczynnik korelacji:
202
022
8 86 2 8 8 86 7 84 1 02
5 75 2 25 5 75 5 0625 0 6875
, , , , ,
, , , , ,
11 6 41 2 8 2 25 6 41 6 3 0 11 , , , , , ,
0 11
1 02 0 6815
0 11
0 8340 131
,
, ,
,
,,
27
Warunkowe wartości oczekiwane
Warunkową wartością oczekiwaną zmiennej losowej Y przy warunku, że zmienna X = xi nazywamy wyrażenie:
Analogicznie definiujemy warunkową wartość oczekiwaną zmiennej X:
E Y X x yp
pi jij
ij
( ).
E X Y y xp
pj iij
ji
( ).
28
Obliczanie warunkowych wartości oczekiwanych
Obliczmy warunkowe wartości oczekiwane zmiennej losowej Y w naszym przykładzie. Kolejno otrzymujemy:
E(Y/X=1)=10,46+20,23+30,31=1,85
E(Y/X=2)=10,29+20,17+30,54=2,25
E(Y/X=3)=10,21+20,18+30,61=2,40
E(Y/X=4)=10,17+20,40+30,43=2,26
29
Funkcja regresji I rodzaju
Warunkowe wartości oczekiwane zmiennej Y zależą od wartości zmiennej X, są pewną funkcją tej zmiennej. Funkcję tę możemy zapisać następująco:
Tak określoną funkcję nazywamy funkcją regresji I rodzaju zmiennej losowej Y względem zmiennej losowej X.
W naszym przykładzie funkcję tę można zapisać następująco:
E Y X x m xi( ) ( )
m x
dla x
dla x
dla x
dla x
( )
,
,
,
,
185 1
2 25 2
2 40 3
2 26 4
30
Wykres funkcji regresji I rodzaju
0.00
0.50
1.00
1.50
2.00
2.50
0 1 2 3 4
31
Funkcja regresji II rodzaju
W praktyce najwygodniej jest zastąpić nieliniowe krzywe regresji I rodzaju funkcjami liniowymi, jeżeli tylko takie przybliżenie jest wystarczające.
Spośród wszystkich możliwych prostych wybieramy taką, dla której średnie odchylenie kwadratowe wartości danej zmiennej od tej prostej jest minimalne:
E Y a bX{[ ( )] } min 2
32
Funkcja regresji II rodzaju (c.d.)
Rozwiązując ten warunek otrzymujemy:
Parametr b nazywamy współczynnikiem regresji liniowej zmiennej Y względem X.
W naszym przykładzie otrzymujemy:
Tym samym prosta regresji ma postać:
bCXY
D Xa EY bEX
2
b oraz
a
0 11
1 020 1078
2 25 0 1078 2 8 1 9481
,
,,
, , , ,
~, ,Y X 0 1078 1 9481
33
Wykres funkcji regresji II rodzaju
0
0.5
1
1.5
2
2.5
0 1 2 3 4
I r
II r