ZIP 2007/2008 (zaoczne) Statystyka – wykładdydaktyka.polsl.pl/roz6/ameczynska/Shared...

15
Estymacja parametrów Estymacja parametrów Załóżmy, że rozkład zmiennej losowej X w populacji generalnej jest opisany dystrybuantą F(x;α), gdzie α jest nieznanym parametrem tego rozkładu; jego wartośd będzie szacowana na podstawie n elementowej próby Estymatorem A (n) parametru α rozkładu zmiennej losowej X jest statystyka , której rozkład zależy od tego parametru. Oceną a (n) parametru α jest wartośd liczbowa , jaką przyjmuje estymator A (n) dla konkretnej realizacji próby . 1 ) x ,..., x , x ( a a n 2 1 ) n ( ) X ,... X , X ( n 2 1 ) X ,..., X , X ( a A n 2 1 ) n ( ) x ,..., x , x ( n 2 1

Transcript of ZIP 2007/2008 (zaoczne) Statystyka – wykładdydaktyka.polsl.pl/roz6/ameczynska/Shared...

Estymacja parametrów

Estymacja parametrów

Załóżmy, że rozkład zmiennej losowej X w populacji generalnej jest opisany dystrybuantą F(x;α), gdzie α jest nieznanym parametrem tego rozkładu; jego wartośd będzie szacowana na podstawie n elementowej próby

Estymatorem A(n) parametru α rozkładu zmiennej losowej X jeststatystyka , której rozkład zależy od tegoparametru.

Oceną a(n) parametru α jest wartośd liczbowa ,

jaką przyjmuje estymator A(n) dla konkretnej realizacji próby

.

1

)x,...,x,x(aa n21)n(

)X,...X,X( n21

)X,...,X,X(aA n21)n(

)x,...,x,x( n21

Estymacja parametrów

Estymacja parametrów

Estymator jest zgodny, jeśli jest stochastycznie zbieżny do szacowanego parametru; tzn. spełnia warunek

Estymator jest nieobciążony, jeśli jego wartośd oczekiwana jest równa szacowanemu parametrowi , tzn. E(A(n)) = α

2

1)|A(|Plim )n(n0

Estymacja parametrów

Estymator jest najefektywniejszy w danej klasie estymatorów, jeśli ma najmniejszą wariancję spośród estymatorów danej klasy.

Różnica A(n)-α jest zmienną losową zwaną błędem szacunku parametru α, jego miarą jest .

Jeśli estymator A(n) jest nieobciążony, to błąd szacunku jest wariancją tego estymatora; wtedy odchylenie standardowe D(A(n))

zwane jest średnim (standardowym) błędem szacunku parametru α, a względnym średnim błędem szacunku jest .

Estymacja:

• Punktowa (ocena, błędy szacunku)

• Przedziałowa (przedział ufności)

3

2

)n( )A(E

)A(D )n(

Estymacja parametrów

Estymacja przedziałowa

DEF: Niech cecha X ma w populacji rozkład z nieznanymparametrem . Załóżmy, że na podstawie próby losowejpochodzącej z tej populacji wyznaczono funkcje:

i takie, że

1. dla każdego zachodzi oraz

2. dla z góry ustalonego prawdopodobieostwa 1 - mamy

Losowy przedział nazywa się przedziałem ufności parametru, a ustalone z góry prawdopodobieostwo, z jakim ten przedział

pokrywa nieznaną wartośd parametru ,(1 - ) - współczynnikiem

(poziomem) ufności.4

)X,...,X,X(T n21 )X,...,X,X(T n21

TT)x,...,x,x( n21

1))X,...,X,X(T)X,...,X,X(T(P n21n21

)T;T(

Estymacja parametrów

Przedział ufności dla średniej m w populacji normalnej ze znanym odchyleniem standardowym

Niech cecha X ma w populacji rozkład ; m – nieznane,

- znane. Niech (1 - ) – współczynnik ufności, 0 < < 1

- próba losowa.

Estymatorem parametru m uzyskanym MNW jest średnia

arytmetyczna , która ma rozkład .

Standaryzując zmienną otrzymuje się zmienną

o rozkładzie N(0,1).

5

),m(N

)X,...,X,X( n21

n

1i

iXn

1X )

n,m(N

X nmX

U

Estymacja parametrów

Niech będzie taką wartością, że

Po podstawieniu za U mamy

Stąd

Na postawie definicji losowy przedział

jest przedziałem ufności dla średniej m, przy współczynnikuufności 1 - .

Dysponując konkretną próbą , otrzyma się konkretny przedział liczbowy .

Uwaga: Przedział ufności określony powyższym wzorem ma stałą długośd równą , a losowe są tylko jego granice.

6

)x,...,x,x( n21

u 1)uUu(P

1)unmX

u(P

1)n

uXmn

uX(P

)n

uX ; n

uX(

n

u2

)n

ux ; n

ux(

Estymacja parametrów

Przedział ufności dla średniej m w populacji normalnej

z nieznanym odchyleniem standardowym

Niech cecha X ma w populacji rozkład ; m – nieznane,

- nieznane. Niech (1 - ) – współczynnik ufności, 0 < < 1

- próba losowa.

Estymatorem parametru m uzyskanym MNW jest średnia

arytmetyczna . Nie można wyznaczyd rozkładu tego

estymatora, gdyż nie jest znana wartośd parametru .

Wiadomo jednak, że statystyka

ma rozkład t-Studenta z n-1 stopniami swobody, niezależny od .

S – odchylenie standardowe z próby

7

),m(N

)X,...,X,X( n21

n

1i

iXn

1X

1nS

mXt

Estymacja parametrów

Niech będzie taką wartością, że

Po podstawieniu za t mamy

Stąd

Na postawie definicji losowy przedział

jest przedziałem ufności dla średniej m, przy współczynnikuufności 1 - .

Dysponując konkretną próbą , otrzyma się konkretny przedział liczbowy .

Uwaga: Przedział ufności określony powyższym wzorem ma nie tylko

losowe granice, ale także losową długośd równą

(bo S – zmienna losowa). 8

)x,...,x,x( n21

1n,t 1)tUt(P 1n,1n,

1)t1nS

mXt(P 1n,1n,

1)1n

StXm

1n

StX(P 1n,1n,

)1n

StX ;

1n

StX( 1n,1n,

)1n

Stx ;

1n

Stx( 1n,1n,

1n

St2 1n,

Estymacja parametrów

Przy tej samej liczebności próby przedział ufności dla średniej mjest na ogół dłuższy, gdy nie jest znane w porównaniu doprzypadku, gdy znamy (rozkład t-Studenta ma większerozproszenie niż rozkład normalny). Ponieważ rozkład t-Studentadąży do N(0,1), gdy liczba stopni swobody , to w praktyceprzy dużych próbach(n > 120; mniej rygorystycznie n > 30) wartośd

zastępuje się wartością .

9

1n,t u

Estymacja parametrów

Przedział ufności dla średniej m w populacji o nieznanymrozkładzie

Niech (duża) próba losowa pochodzi z populacji odowolnym rozkładzie z nieznaną wartością oczekiwaną m i zeznanym odchyleniem standardowym .

Średnia arytmetyczna , wyznaczana z próby

pochodzącej z populacji o dowolnym rozkładzie, ma

graniczny rozkład ,

a statystyka - rozkład N(0,1).

10

)X,...,X,X( n21

n

1i

iXn

1X

)n

,m(N

nmX

U

Estymacja parametrów

Wtedy

Stąd

Uwaga: W tym przypadku przedział ma charakter przybliżony inależy wyznaczad go na podstawie dużej próby (n > 120).

gdy odchylenie standardowe nie jest znane, a dysponujemy dużąpróbą można przyjąd, że , gdzie S – odchylenie standardowez próby. Wtedy przedział ufności dla m wyznacza się ze wzoru

11

1)unmX

u(P

1)n

uXmn

uX(P

S

1)n

SuXm

n

SuX(P

Estymacja parametrów

Przedział ufności dla wariancji w populacji normalnej

Niech cecha X ma w populacji rozkład ; m, – nieznane,

- próba losowa; (1 - ) – współczynnik ufności, 0 < < 1

Estymatorem parametru uzyskanym MNW jest wariancja

z próby .

Statystyka ma rozkład z n-1 stopniami swobody.

Niech i będą takie, że

i

12

)X,...,X,X( n21

),m(N

2

2

2n

1i

i

2 )XX(n

1S

2

22 nS 2

2

1-n ;2

1

2

1-n ;2

21)(P 2

1-n ;2

1

2

2)(P 2

1-n ;2

2

Estymacja parametrów

Wtedy

a po uwzględnieniu definicji i przekształceniach mamy

Problem minimalnej liczebności próby

Długośd przedziału ufności może byd miarą dokładności estymacjiprzedziałowej parametru α. Jakie czynniki wpływają na długośdprzedziału ufności i czy można otrzymad oszacowanie o pożądanejdokładności rozpatrzmy na przykładzie estymacji wartościoczekiwanej m w populacji normalnej ze znanym odchyleniemstandardowym.

13

1)(P 2

1-n ;2

22

1-n ;2

1

2

1)nSnS

(P2

1-n ;2

1

22

2

1-n ;2

2

Estymacja parametrów

-przedział ufności dla średniej

- długośd przedziału ufności

Dokładnośd estymacji parametru m zależy od:

• przyjętego współczynnika ufności 1 - ,

• dyspersji cechy w populacji - (stała),

• liczebności próby.

Przedział ufności można „skrócid” poprzez przyjęcie niskiejwartości współczynnika ufności lub zwiększenie liczebności próby.Przyjęcie niskiej wartości współczynnika ufności zwiększaprawdopodobieostwo tego, że otrzymany przedział nie pokryjewartości estymowanego parametru, zatem lepiej wpływad nadokładnośd szacunku poprzez ustalenie „dobrej” liczebności próby.

14

)n

uX ; n

uX(

n

u2

Estymacja parametrów

Chcemy, aby maksymalny błąd szacunku (połowa długościprzedziału ufności) nie przekraczał ustalonej wartości d,

tzn.

Stąd .

Więc minimalna liczebnośd próby zapewniająca, że błądszacunku nie przekroczy d wynosi

15

dn

u

2

22

d

un

minn

Nd

ugdy 1

d

u

Nd

ugdy

d

u

n

2

22

2

22

2

22

2

22

min