Wykład 5 Standardowy błąd a odchylenie standardowe

Post on 18-Mar-2016

82 views 0 download

description

Wykład 5 Standardowy błąd a odchylenie standardowe. Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji  Używane do przewidywań dotyczących indywidualnych obserwacji. - PowerPoint PPT Presentation

Transcript of Wykład 5 Standardowy błąd a odchylenie standardowe

Wykład 5Standardowy błąd a odchylenie standardowe

• Odchylenie standardowe z próby s:– Służy do oceny zmienności w zbiorze danych– Gdy n wzrasta s zbliża się do odchylenia

standardowego w populacji – Używane do przewidywań dotyczących

indywidualnych obserwacji

• Błąd standardowy średniej SE = :– Służy do oceny niepewności związanej z

estymacją średniej w populacji– Maleje do zera wraz ze wzrostem n– Używane do przewidywań dotyczących

średniej

sn

Jak duża powinna być próba?

• Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości

• Możemy estymować z zadaną precyzją • Przykład: znajdź rozmiar próby taki, aby

95% PU dla średniej miał szerokość 5.

Załóżmy, że =10. Wtedy

• Na ogół nie znamy, możemy jednak wykonać badanie wstępne (mała próba) i użyć s.

Podstawowe założenie (jeszcze raz)

• Próba musi być losowa:

– każdy element w populacji ma jednakową szansę być wybranym

– poszczególne wybory są od siebie niezależne• Jeżeli to założenie nie jest spełnione to

wzrost n może nie gwarantować zmniejszenia SE.

Przedział ufności dla frakcji w populacji

• Estymujemy p za pomocą • Chcemy skonstruować przedział ufności dla p• Moglibyśmy skorzystać z rozkładu

dwumianowego, ale wymagałoby to uciążliwych rachunków.

• Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym

• Gdy Y ma rozkład dwumianowy (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład normalny

, (1 )N np np p

• = Y/n ma wartość oczekiwaną=

i =

• Zatem ma w przybliżeniu rozkład

Przedział ufności dla p

• Będziemy korzystali z przybliżonego przedziału ufności Agrestiego-Coula (patrz np. Brown, Cai i DasGupta, Annals of Statistics, 2002):

– Środkiem przedziału będzie (modyfikacja ) – Przypomnijmy, że Z/2 jest taką liczbą, że

Pr(Z < - Z/2) = Pr(Z > Z/2) = /2

– Dla 95% PU, = 0.05 i Z/2 = 1.96

p p̂

• Definiujemy

• SE dla definiujemy jako

• Np. dla 95% PU wstawiamy Z0.025 = 1.96 i dostajemy

2/ 20.5

2/ 2

y Zp

n Z

p 2/ 2

(1 )p

p pSEn Z

2

2

0.5(1.96 ) 1.92 23.84 41.96

y y ypn nn

2

(1 ) (1 ) (1 )3.84 41.96p

p p p p p pSEn nn

Przedział ufności dla p (cd.)• Skonstruujemy przybliżony przedział ufności dla

p, z centrum w • Użyjemy kwantyli z rozkładu normalnego Z/2

• Dla 95% PU użyjemy Z0.025 =1.96

• Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58.

• przybliżony 95% PU dla p wynosi

p

11.96 1.96

4p

p pp SE p

n

Przykład:

• Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na biało

• p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki

• 95% PU dla p:

90% PU dla p

• Sformułowanie konkluzji:Mamy 90% pewności że frakcja myszek w tej

populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a .

• Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.

Klasyczny przybliżony przedział ufności (informacja)

• Klasyczny przedział ufności uzyskuje się biorąc za jego środek i zastępując p przez we wzorze na i błąd standardowy.

• Klasyczne przedziały ufności zachowują się źle, gdy liczba sukcesów (Y) jest bliska zeru lub n. Może się wtedy zdarzyć np., że klasyczny PU zawiera ujemne wartości.

p̂p̂

Jak duża powinna być próba ?• Chcemy aby 95% PU miał długość nie większą od

zadanej. Jak ustalić rozmiar próby? • Idea: długość przedziału zależy od n, skąd można

wyznaczyć wystarczający rozmiar próby.• Uwaga – długość przedziału zależy też od , którego nie

znamy.• Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej

przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n)

• Jeżeli nie mamy żadnych wstępnych informacji, to użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n: szerokość PU skonstruowanego w oparciu o próbę o wyliczonym rozmiarze nie będzie większa od założonej, a może być dużo mniejsza. (Czy to dobrze?)

p

Przykład

• Chcemy aby SE było równe 0.005 (95% PU będzie miał długość około 0.02).

• Przypuszczamy, że prawdziwe p jest bliskie 0.05. Rachunki:

• Konkluzja: „Proszę złapać myszy.”

• Obliczenia, gdy nie wiemy nic o p:

• Konkluzja: „Proszę złapać myszy.”

• Asymptotyczne przedzialy ufnosci dla estymatorow najwiekszej wiarogodnosci – patrz tablica