Wykład 5 Standardowy błąd a odchylenie standardowe

19
Wykład 5 Standardowy błąd a odchylenie standardowe Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji Używane do przewidywań dotyczących indywidualnych obserwacji

description

Wykład 5 Standardowy błąd a odchylenie standardowe. Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji  Używane do przewidywań dotyczących indywidualnych obserwacji. - PowerPoint PPT Presentation

Transcript of Wykład 5 Standardowy błąd a odchylenie standardowe

Page 1: Wykład 5 Standardowy błąd a odchylenie standardowe

Wykład 5Standardowy błąd a odchylenie standardowe

• Odchylenie standardowe z próby s:– Służy do oceny zmienności w zbiorze danych– Gdy n wzrasta s zbliża się do odchylenia

standardowego w populacji – Używane do przewidywań dotyczących

indywidualnych obserwacji

Page 2: Wykład 5 Standardowy błąd a odchylenie standardowe

• Błąd standardowy średniej SE = :– Służy do oceny niepewności związanej z

estymacją średniej w populacji– Maleje do zera wraz ze wzrostem n– Używane do przewidywań dotyczących

średniej

sn

Page 3: Wykład 5 Standardowy błąd a odchylenie standardowe

Jak duża powinna być próba?

• Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości

• Możemy estymować z zadaną precyzją • Przykład: znajdź rozmiar próby taki, aby

95% PU dla średniej miał szerokość 5.

Page 4: Wykład 5 Standardowy błąd a odchylenie standardowe

Załóżmy, że =10. Wtedy

• Na ogół nie znamy, możemy jednak wykonać badanie wstępne (mała próba) i użyć s.

Page 5: Wykład 5 Standardowy błąd a odchylenie standardowe

Podstawowe założenie (jeszcze raz)

• Próba musi być losowa:

– każdy element w populacji ma jednakową szansę być wybranym

– poszczególne wybory są od siebie niezależne• Jeżeli to założenie nie jest spełnione to

wzrost n może nie gwarantować zmniejszenia SE.

Page 6: Wykład 5 Standardowy błąd a odchylenie standardowe

Przedział ufności dla frakcji w populacji

• Estymujemy p za pomocą • Chcemy skonstruować przedział ufności dla p• Moglibyśmy skorzystać z rozkładu

dwumianowego, ale wymagałoby to uciążliwych rachunków.

• Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym

• Gdy Y ma rozkład dwumianowy (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład normalny

, (1 )N np np p

Page 7: Wykład 5 Standardowy błąd a odchylenie standardowe

• = Y/n ma wartość oczekiwaną=

i =

• Zatem ma w przybliżeniu rozkład

Page 8: Wykład 5 Standardowy błąd a odchylenie standardowe

Przedział ufności dla p

• Będziemy korzystali z przybliżonego przedziału ufności Agrestiego-Coula (patrz np. Brown, Cai i DasGupta, Annals of Statistics, 2002):

– Środkiem przedziału będzie (modyfikacja ) – Przypomnijmy, że Z/2 jest taką liczbą, że

Pr(Z < - Z/2) = Pr(Z > Z/2) = /2

– Dla 95% PU, = 0.05 i Z/2 = 1.96

p p̂

Page 9: Wykład 5 Standardowy błąd a odchylenie standardowe

• Definiujemy

• SE dla definiujemy jako

• Np. dla 95% PU wstawiamy Z0.025 = 1.96 i dostajemy

2/ 20.5

2/ 2

y Zp

n Z

p 2/ 2

(1 )p

p pSEn Z

2

2

0.5(1.96 ) 1.92 23.84 41.96

y y ypn nn

2

(1 ) (1 ) (1 )3.84 41.96p

p p p p p pSEn nn

Page 10: Wykład 5 Standardowy błąd a odchylenie standardowe
Page 11: Wykład 5 Standardowy błąd a odchylenie standardowe

Przedział ufności dla p (cd.)• Skonstruujemy przybliżony przedział ufności dla

p, z centrum w • Użyjemy kwantyli z rozkładu normalnego Z/2

• Dla 95% PU użyjemy Z0.025 =1.96

• Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58.

• przybliżony 95% PU dla p wynosi

p

11.96 1.96

4p

p pp SE p

n

Page 12: Wykład 5 Standardowy błąd a odchylenie standardowe

Przykład:

• Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na biało

• p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki

• 95% PU dla p:

Page 13: Wykład 5 Standardowy błąd a odchylenie standardowe

90% PU dla p

Page 14: Wykład 5 Standardowy błąd a odchylenie standardowe

• Sformułowanie konkluzji:Mamy 90% pewności że frakcja myszek w tej

populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a .

• Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.

Page 15: Wykład 5 Standardowy błąd a odchylenie standardowe

Klasyczny przybliżony przedział ufności (informacja)

• Klasyczny przedział ufności uzyskuje się biorąc za jego środek i zastępując p przez we wzorze na i błąd standardowy.

• Klasyczne przedziały ufności zachowują się źle, gdy liczba sukcesów (Y) jest bliska zeru lub n. Może się wtedy zdarzyć np., że klasyczny PU zawiera ujemne wartości.

p̂p̂

Page 16: Wykład 5 Standardowy błąd a odchylenie standardowe

Jak duża powinna być próba ?• Chcemy aby 95% PU miał długość nie większą od

zadanej. Jak ustalić rozmiar próby? • Idea: długość przedziału zależy od n, skąd można

wyznaczyć wystarczający rozmiar próby.• Uwaga – długość przedziału zależy też od , którego nie

znamy.• Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej

przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n)

• Jeżeli nie mamy żadnych wstępnych informacji, to użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n: szerokość PU skonstruowanego w oparciu o próbę o wyliczonym rozmiarze nie będzie większa od założonej, a może być dużo mniejsza. (Czy to dobrze?)

p

Page 17: Wykład 5 Standardowy błąd a odchylenie standardowe

Przykład

• Chcemy aby SE było równe 0.005 (95% PU będzie miał długość około 0.02).

• Przypuszczamy, że prawdziwe p jest bliskie 0.05. Rachunki:

• Konkluzja: „Proszę złapać myszy.”

Page 18: Wykład 5 Standardowy błąd a odchylenie standardowe

• Obliczenia, gdy nie wiemy nic o p:

• Konkluzja: „Proszę złapać myszy.”

Page 19: Wykład 5 Standardowy błąd a odchylenie standardowe

• Asymptotyczne przedzialy ufnosci dla estymatorow najwiekszej wiarogodnosci – patrz tablica