2015-10-26
1
Estymacja:
• Punktowa (ocena, błędy szacunku)
• Przedziałowa (przedział ufności)
IV. Estymacja parametrów
Załóżmy, że rozkład zmiennej losowej X w populacji generalnej jest opisany dystrybuantą F(x;α), gdzie α jest nieznanym parametrem tego rozkładu; jego wartość będzie szacowana na podstawie n elementowej próby
Estymatorem A(n) parametru α rozkładu zmiennej losowej X jest statystyka , której rozkład zależy od tego parametru.
Oceną a(n) parametru α jest wartość liczbowa ,
jaką przyjmuje estymator A(n) dla konkretnej realizacji próby
.
1
)x,...,x,x(aa n21)n(
)X,...X,X( n21
)X,...,X,X(aA n21)n(
)x,...,x,x( n21
2015-10-26
2
Estymator jest zgodny, jeśli jest stochastycznie zbieżny
do szacowanego parametru; tzn. spełnia warunek
Estymator jest nieobciążony, jeśli jego wartość oczekiwana jest równa szacowanemu parametrowi , tzn. E(A(n)) = α
Estymator jest najefektywniejszy w danej klasie estymatorów, jeśli ma najmniejszą wariancję spośród estymatorów danej klasy.
1)|A(|Plim )n(n0
Różnica A(n)-α jest zmienną losową zwaną błędem szacunku parametru α, jego miarą jest
Jeśli estymator A(n) jest nieobciążony, to błąd szacunku jest wariancją tego estymatora;
wtedy odchylenie standardowe: D(A(n))
zwane jest średnim (standardowym) błędem szacunku parametru α,
a względnym średnim błędem szacunku jest:
2
)n( )A(E
)A(D )n(
2015-10-26
3
Estymacja przedziałowa
DEF: Niech cecha X ma w populacji rozkład z nieznanym parametrem Q. Załóżmy, że na podstawie próby losowej pochodzącej z tej populacji wyznaczono funkcje:
i takie, że:
1. dla każdego zachodzi oraz
2. dla z góry ustalonego prawdopodobieństwa 1 - mamy
Losowy przedział nazywa się przedziałem ufności parametru Q, a ustalone z góry prawdopodobieństwo, z jakim ten przedział pokrywa nieznaną wartość parametru Q,(1 - )
- współczynnikiem (poziomem) ufności.
)X,...,X,X(T n21 )X,...,X,X(T n21
TT )x,...,x,x( n21
1)),...,,(),...,,(( 2121 nn XXXTQXXXTP
)T;T(
Przedział ufności dla średniej m w populacji normalnej ze znanym odchyleniem standardowym
Niech cecha X ma w populacji rozkład ; m – nieznane, - znane. Niech (1 - ) – współczynnik ufności, 0 < < 1
- próba losowa.
Estymatorem parametru m uzyskanym MNW jest średnia arytmetyczna , która ma rozkład
Standaryzując zmienną otrzymuje się zmienną o rozkładzie N(0,1).
),m(N
)X,...,X,X( n21
n
1i
iXn
1X )
n,m(N
X
nmX
U
2015-10-26
4
Niech będzie taką wartością, że
Po podstawieniu za U mamy
Stąd
Na postawie definicji losowy przedział
jest przedziałem ufności dla średniej m, przy współczynniku ufności 1 - .
u
1)uUu(P
1)un
mXu(P
1)n
uXmn
uX(P
)n
uX ; n
uX(
Dysponując konkretną próbą , otrzyma się konkretny przedział liczbowy:
Uwaga: Przedział ufności określony powyższym wzorem ma stałą długość równą , a losowe są tylko jego granice.
)x,...,x,x( n21
)n
ux ; n
ux(
2n
u
Maksymalny błąd szacunku jest równy połowie długości przedziału ufności: (im mniejszy błąd szacunku (węższy przedział), tym większa dokładność oszacowania)
nud x
2015-10-26
5
Przykład 14.
Waga jabłek przeznaczonych na export ma rozkład
normalny z odchyleniem standardowym
równym 30 g.
Zbadano 50 jabłek otrzymując średnią wagę
równą 250 g.
Wyznacz długość przedziału ufności pokrywającego
nieznaną średnią oraz
dokładność oszacowania,
przy współczynniku ufności 1 – α = 0,95.
Wyznacz przedział ufności.
Przykład 14 - rozwiązanie
N(m, 30)
(m – nieznane, - znane)
= 30 g - odchylenie standardowe w populacji
n = 50 - liczebność próby
= 250 g – średnia wyliczona z próby
1 – α = 0,95 – poziom ufności (czyli = 0,05)
X
)50
30502 ;
50
30250( uu
0,9752
α1 025,01u
Przedział ufności:
Długość przedziału ufności: 50
302 u
u odczytujemy z tablic rozkładu normalnego dla
: ?975,0 u
2015-10-26
6
Przykład 14 - rozwiązanie
u0,975= 1,96
Przykład 14 - rozwiązanie
Długość przedziału ufności:
50
302 u
Błąd szacunku:
63,1624,492,3 50
3096,12
31,824,496,150
3096,1
nud x
)31,8502 ; 31,8250(
Przedział ufności:
95,0)31,852 m 69,241( P
2015-10-26
7
Przedział ufności dla średniej m w populacji normalnej
z nieznanym odchyleniem standardowym
Niech cecha X ma w populacji rozkład ; m – nieznane, - nieznane. Niech (1 - ) – współczynnik ufności, 0 < < 1
- próba losowa.
Estymatorem parametru m uzyskanym MNW jest średnia arytmetyczna . Nie można wyznaczyć rozkładu tego estymatora, gdyż nie jest znana wartość parametru .
Wiadomo jednak, że statystyka
ma rozkład t-Studenta z n-1 stopniami swobody, niezależny od . (S – odchylenie standardowe z próby)
),m(N
)X,...,X,X( n21
n
1i
iXn
1X
1nS
mXt
Niech będzie taką wartością, że
Po podstawieniu za t mamy
Stąd
Na postawie definicji losowy przedział
jest przedziałem ufności dla średniej m, przy współczynniku ufności 1 - .
1n,t
1)tUt(P 1n,1n,
1)t1nS
mXt(P 1n,1n,
1)1n
StXm
1n
StX(P 1n,1n,
)1n
StX ;
1n
StX( 1n,1n,
2015-10-26
8
Dysponując konkretną próbą , otrzyma się konkretny przedział liczbowy
Uwaga: Przedział ufności określony powyższym wzorem ma nie tylko losowe granice, ale także losową długość równą (bo S – zmienna losowa).
)x,...,x,x( n21
)1n
Stx ;
1n
Stx( 1n,1n,
1n
St2 1n,
Maksymalny błąd szacunku jest równy połowie długości przedziału ufności:
11,
n
Std nx
Przy tej samej liczebności próby przedział ufności dla średniej m jest na ogół dłuższy, gdy nie jest znane w porównaniu do przypadku, gdy znamy (rozkład t-Studenta ma większe rozproszenie niż rozkład normalny).
Ponieważ rozkład t-Studenta dąży do N(0,1), gdy liczba stopni swobody , to w praktyce przy dużych próbach (n > 120; lub mniej rygorystycznie n > 30) wartość zastępuje się wartością .
1n,t
u
2015-10-26
9
Przykład 15.
Wiadomo, że czas potrzebny na rozwiązanie zadania
ma rozkład N(m, σ).
Chcąc ustalić średni czas potrzebny na rozwiązanie
zadania przeprowadzono eksperyment, polegający
na losowym wybraniu grupy studentów, którym
zmierzono czas rozwiązywania zadania.
Okazało się, że w badanej 10 osobowej grupie średni
czas wyniósł 50 minut, a odchylenie standardowe
15 minut.
Ile wynosi średni czas rozwiązania zadania przy
współczynniku ufności 1 – α = 0,97?
Przykład 15 - rozwiązanie
N(m, )
(m – nieznane, - znane)
S = 15 min - odchylenie standardowe w próbie
n = 10 - liczebność próby (mała próba)
= 50 min – średnia wyliczona z próby
1 – α = 0,97 – poziom ufności (czyli = 0,03)
X
)110
1550 ;
110
1550( 1,1,
nn tt
Przedział ufności:
Z tablic rozkładu Studenta:
9;03,01, tt n
2015-10-26
10
Przykład 15 - rozwiązanie
Tablice rozkładu t-Studenta:
2,57t t 0,03;91nα,
Przykład 15 - rozwiązanie
)110
1557,250 ;
110
1557,250(
Przedział ufności:
)85,1250 ; 85,1250(
)85,62 ; 15,37(
97,0)85,62 m 15,37( P
2015-10-26
11
Przedział ufności dla średniej m w populacji o nieznanym rozkładzie
Niech (duża) próba losowa pochodzi z populacji o dowolnym rozkładzie z nieznaną wartością oczekiwaną m i ze znanym odchyleniem standardowym .
Średnia arytmetyczna , wyznaczana z próby
pochodzącej z populacji o dowolnym rozkładzie, ma
graniczny rozkład ,
a statystyka - rozkład N(0,1).
)X,...,X,X( n21
n
1i
iXn
1X
),(n
mN
nmX
U
Wtedy
Stąd
Uwaga: W tym przypadku przedział ma charakter przybliżony i należy wyznaczać go na podstawie dużej próby (n > 120 lub n > 30).
gdy odchylenie standardowe nie jest znane, a dysponujemy dużą próbą można przyjąć, że , gdzie S – odchylenie standardowe z próby. Wtedy przedział ufności dla m wyznacza się ze wzoru
1)un
mXu(P
1)n
uXmn
uX(P
S
1)n
SuXm
n
SuX(P
2015-10-26
12
Duża próba (n>30) Mała próba (n<30)
ZNANE odchylenie standardowe populacji ()
NIE ZNANE odchylenie standardowe populacji ()
)1
; 1
( 1,1,
n
Stx
n
Stx nn
)n
σux ;
n
σux( αα
) ; (n
Sux
n
Sux
S
Wybór przedziału
Przykład 16.
W centrali telefonicznej przeprowadzono 17 obserwacji długości losowo wybranych
rozmów w ciągu jednego dnia i otrzymano (w min.): = 5,48, S = 1,2; na tej podstawie –
przy założeniu, że długości rozmów telefonicznych mają rozkład normalny –
wyznacz 95%-ową realizację przedziału ufności dla wartości przeciętnej długości rozmowy
telefonicznej przeprowadzonej za pośrednictwem tej centrali w danym dniu.
X
2015-10-26
13
Przykład 16 - rozwiązanie
n = 17 – mała próba = 5,48, S = 1,2, 1 – α = 0,95 ( nie znane)
X
95011
11 ,)n
Stxm
n
StxP( α,nα,n
12,216;05,0 t
950117
2,112,248,5
117
2,112,248,5 ,)m P(
95012,684,4 ,)m P(
)(m 12,6;84,4
Przykład 17.
W centrali telefonicznej przeprowadzono 121 obserwacje długości losowo wybranych
rozmów w ciągu jednego dnia i otrzymano (w min.): = 5,48, S = 1,2; na tej podstawie –
przy założeniu, że długości rozmów telefonicznych mają rozkład normalny –
wyznacz 95%-ową realizację przedziału ufności dla wartości przeciętnej długości rozmowy
telefonicznej przeprowadzonej za pośrednictwem tej centrali w danym dniu.
X
2015-10-26
14
Przykład 17 - rozwiązanie
n = 121 – duża próba = 5,48, S = 1,2, 1 – α = 0,95 nie znane, ale przyjmujemy S X
950,)n
Suxm
n
SuxP( αα
96,1975,0 u
950121
2,196,148,5
121
2,196,148,5 ,)m P(
95069,527,5 ,)m P(
)(m 69,5;27,5
(tak jak w przykładzie 14)
Węższy niż w przykładzie 16!
Przykład 18.
Roczne wydatki na zakup książek przez studentów
pewnej uczelni mają rozkład normalny
o odchyleniu standardowym równym 300 zł.
Jakie jest prawdopodobieństwo,
że w wylosowanej 25-osobowej grupie studentów
średnie roczne wydatki różnić się będą od średnich
wydatków całej zbiorowości
studentów tej uczelni o więcej niż 120 zł?
2015-10-26
15
Przykład 18 - rozwiązanie
N(m, 300) n = 25 mała próba, ale znane ?120 mxP
1201201120 xmxPmxP
120120 xmzatemmx
120120 xmzatemmxlub
120x 120x
Przykład 18 - rozwiązanie
αxmxP 1120120
ααxmxP )1(11201201 - szukamy!
120n
σuα
2300
25120120
σ
nuα
2)
21(
αu
9772,02
1 α
stąd
0456,0α
2015-10-26
16
Prawdopodobieństwo,
że w wylosowanej 25-osobowej grupie
studentów średnie roczne wydatki różnić się
będą od średnich wydatków całej zbiorowości
studentów tej uczelni o więcej niż 120 zł
wynosi 0,0456.
Przykład 18 – odpowiedź:
Przedział ufności dla wariancji w populacji normalnej
Niech cecha X ma w populacji rozkład ; m, – nieznane, - próba losowa; (1 - ) – współczynnik ufności, 0 < < 1
Estymatorem parametru uzyskanym MNW jest wariancja z próby:
Statystyka ma rozkład z n-1 stopniami swobody.
Niech i będą takie, że
i
)X,...,X,X( n21
),m(N
2
2
2n
1i
i
2 )XX(n
1S
2
22 nS
2
2
1-n ;2
1
2
1-n ;2
21)(P 2
1-n ;2
1
2
2)(P 2
1-n ;2
2
2015-10-26
17
Wtedy
a po uwzględnieniu definicji i przekształceniach mamy:
1)(P 2
1-n ;2
22
1-n ;2
1
12
1-n ;2
1
22
2
1-n ;2
2 nSnSP
2
Uwaga: dla dużej próby (n > 30) rozkład można przybliżyć rozkładem normalnym:
1
21
21
n
u
S
n
u
SP
2
Badano zróżnicowanie czasu potrzebnego na wykonanie oprawy książki w zakładzie introligatorskim. Losowo wybrano 20
zamówień i otrzymano, że średnio czas potrzebny na oprawę książki wyniósł 5 godzin,
przy czterogodzinnej wariancji. Zakładamy, że rozkład czasu potrzebnego na
oprawę jest rozkładem normalnym. Jaki wynik uzyskano, jeżeli przyjęto współczynnik ufności
1 – α = 0,90?
Przykład 19.
2015-10-26
18
n = 20 – mała próba,
x = 5 godzin, S2 = 4, 1 – α = 0,90, N(m, )
Przykład 19 - rozwiązanie
9,0420420
2
19 ;2
1,01
2
2
19 ;2
1,0
P
?2
19 ;05,0 ?2
19 ;95,0
144,302
19 ;05,0
117,102
19 ;95,0
Przykład 19 - rozwiązanie
2015-10-26
19
Przykład 19 - rozwiązanie
9,0117,10
80
144,30
80 2
P
9,0907,7654,2 2 P
907,7;654,22
812,2;629,1
Wylosowano 48 ziaren pszenicy i zbadano w nich zawartość białka (w procentach). Otrzymano średnią równą 16,8[%] i
odchylenie standardowe 2,1[%]. Znaleźć 98%-ową realizację przedziału ufności dla wariancji
zawartości białka w ziarnach pszenicy całej partii.
Przykład 20.
2015-10-26
20
n = 48 – duża próba
x = 16,8%, S = 2,1%, 1 - = 0,98 (czyli = 0,02)
Przykład 20 - rozwiązanie
98,0
4821
1,2
4821
1,2
uu
P
99001012
1 ,,α
uα 33,299,0 u
Przykład 20 - rozwiązanie
98,0
96
33,21
1,2
96
33,21
1,2
P
98,0755,2697,1 P
98,0591,7880,2 2 P
591,7;880,22
2015-10-26
21
Przedział ufności dla wskaźnika struktury (frakcji)
Jaki procent badanej zbiorowości generalnej posiada wyróżnioną cechę?
Tylko dla n ≥ 100
u odczytujemy z tablic rozkładu normalnego dla
n
n
X
n
X
un
Xp
n
n
X
n
X
un
X
11
2
1α
uα
W pewnej przychodni wśród losowo wybranych 980 ludzi poddanych prześwietleniu
stwierdzono zmiany chorobowe u 100 osób. Wyznacz 95%-ową realizację przedziału ufności dla frakcji osób chorych spośród wszystkich ludzi obsługiwanych przez tę
przychodnię.
Przykład 21.
2015-10-26
22
Przykład 21 - rozwiązanie
X = 100, n = 980, 1 - = 0,95
980
980
1001
980
100
980
100
980
980
1001
980
100
980
100
upu
0,9752
α1 025,01u 96,1975,0 u
019,0102,0019,0102,0 p
121,0083,0 p
Od 8,3% do 12,1% pacjentów tej przychodni jest chorych – z prawdopodobieństwem 0,95.
Problem minimalnej liczebności próby
Długość przedziału ufności może być miarą dokładności estymacji przedziałowej parametru α. Jakie czynniki wpływają na długość przedziału ufności i czy można otrzymać oszacowanie o pożądanej dokładności rozpatrzmy na przykładzie estymacji wartości oczekiwanej m w populacji normalnej ze znanym odchyleniem standardowym.
2015-10-26
23
-przedział ufności dla średniej
- długość przedziału ufności
Dokładność estymacji parametru m zależy od:
• przyjętego współczynnika ufności 1 - ,
• dyspersji cechy w populacji - (stała),
• liczebności próby.
)n
uX ; n
uX(
n
u2
Przedział ufności można „skrócić” poprzez przyjęcie niskiej wartości współczynnika ufności lub zwiększenie liczebności próby. Przyjęcie niskiej wartości współczynnika ufności zwiększa prawdopodobieństwo tego, że otrzymany przedział nie pokryje wartości estymowanego
parametru, zatem lepiej wpływać na dokładność szacunku poprzez ustalenie „dobrej” liczebności próby.
2015-10-26
24
Chcemy, aby maksymalny błąd szacunku (połowa długości przedziału ufności) nie przekraczał ustalonej wartości d, tzn.:
stąd
Więc minimalna liczebność próby zapewniająca, że błąd szacunku nie przekroczy d wynosi
dn
u
2
22
α
d
σun
minn
Nd
u
d
u
Nd
u
d
u
n
2
22
2
22
2
22
2
22
min
gdy 1
gdy
Przykład 22.
Ilu studentów należy wziąć do próby,
aby przy współczynniku ufności 0,90 oszacować
średni wynik ogółu studentów tej uczelni w skoku
wzwyż za pomocą przedziału ufności o rozpiętości
2 cm?
Przyjąć odchylenie standardowe równe 5 cm.
2015-10-26
25
Przykład 22 - rozwiązanie
1 - = 0,90 = 5 cm.
cm 2 2 n
u
czyli: 2d = 2, stąd: d = 1
2
22
d
σun α 95,0
1,0
21u 65,195,0 u
0625,681
565,12
22
n
6916810625,68min n
N
Należy do próby wziąć co najmniej 69 studentów.
Top Related