Podstawy wnioskowania statystycznego

37
Podstawy wnioskowania statystycznego Wojciech Zieliński http:\\wojtek.zielinski.statystyka.info http:\\biostatystykanzc.wum.edu.pl WZ WUM W nioskowanie 1 : nauka poświęcona metodom ba- dania (analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w po- staci zestawień tabelarycznych, wykresów, itp.; po- sługuje się rachunkiem prawdopodobieństwa. STATYSTYKAMATEMATYCZNA: dział matematyki stosowanej oparty na rachunku praw- dopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części. Encyklopedia Popularna PWN, Warszawa 1982 BIOSTATYSTYKA (biometria): nauka z pogra- nicza biologii i statystyki, adaptacja metod staty- stycznych na potrzeby prac badawczych w dziedzinie biologii, związanych przede wszystkim z medycyną, genetyką, fizjologią, antropologią, ekologią i rolnic- twem. WZ WUM W nioskowanie 2

Transcript of Podstawy wnioskowania statystycznego

Page 1: Podstawy wnioskowania statystycznego

P � � � � � � � � � � � � � � � � � � �

Podstawy wnioskowania statystycznego

Wojciech Zieliński

http:\\wojtek.zielinski.statystyka.info

http:\\biostatystykanzc.wum.edu.pl

WZ WUM Wnioskowanie 1

S � � S � � : nauka poświęcona metodom ba-dania (analizowania) zjawisk masowych; polega nasystematyzowaniu obserwowanych cech ilościowychi jakościowych oraz przedstawianiu wyników w po-staci zestawień tabelarycznych, wykresów, itp.; po-sługuje się rachunkiem prawdopodobieństwa.

STATYSTYKA MATEMATYCZNA: działmatematyki stosowanej oparty na rachunku praw-dopodobieństwa; zajmuje się badaniem zbiorów napodstawie znajomości własności ich części.

Encyklopedia Popularna PWN, Warszawa 1982

BIOSTATYSTYKA (biometria): nauka z pogra-nicza biologii i statystyki, adaptacja metod staty-stycznych na potrzeby prac badawczych w dziedziniebiologii, związanych przede wszystkim z medycyną,genetyką, fizjologią, antropologią, ekologią i rolnic-twem.

WZ WUM Wnioskowanie 2

Page 2: Podstawy wnioskowania statystycznego

.

.....

.....

.....

.....

.....

..........................................................................................................................................

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.....

.....

.....

.....

................................................................................................

..................................................................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................

.......................................

............................................................................................................................................................................................................

.......................................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

..........................................

.......................................

Populacja

Próba

Wnioski

o populacji

Wnioskiz próby

WZ WUM Wnioskowanie 3

F F F F F5 2 4 1 527 29 12 8 33

M M M F F8 8 6 6 840 52 33 38 22

M M F M M9 10 7 11 935 73 30 50 67

M M F M M14 12 8 14 1168 75 40 64 69

F F M M M9 8 11 10 1554 40 51 55 66

Próba 1: 5 2 4 1 5 Średnia z próby: 3.40Próba 2: 8 8 6 6 8 Średnia z próby: 7.20Próba 3: 9 10 7 11 9 Średnia z próby: 9.20Próba 4: 14 12 8 14 11 Średnia z próby: 11.80Próba 5: 9 8 11 10 15 Średnia z próby: 10.60

Średnia populacji: 8.44

WZ WUM Wnioskowanie 4

Page 3: Podstawy wnioskowania statystycznego

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

...................

..................

8.44

Pytania

Czy mając do dyspozycji tylko jedną próbę możnaocenić na ile dobrze średnia z tej próby przybliżaprawdziwą średnią?

Co zrobić, by być „pewniejszym” wyniku?

WZ WUM Wnioskowanie 5

� � � � � � � � �

Zbiór obiektów z wyróżnioną cechą (cechami)

PróbaWybrana część populacji podlegająca badaniu

CechaWielkość losowa charakteryzująca obiekty danej po-pulacji

Cecha jakościowaCecha przyjmująca wartości nie będące liczbami (np.kolor, płeć, smakowitość)

Cecha (ilościowa) skokowaCecha przyjmująca pewne wartości liczbowe i nieprzyjmująca wartości pośrednich (np. ilość bakterii,ilość pracowników, ilość pasażerów). Cechy te nazy-wane są również dyskretnymi.

Cecha (ilościowa) ciągłaCecha przyjmująca wartości z pewnego przedziałuliczbowego (np. wzrost, waga, plon)

WZ WUM Wnioskowanie 6

Page 4: Podstawy wnioskowania statystycznego

J � � � � �

wnioskowania statystycznego

Oceniamy parametr θ cechy na podstawie próbyX1, X2, . . . , Xn. Niech θ(X1, X2, . . . , Xn) będzie „ja-kąś” oceną parametru θ

NieobciążonośćJeżeli średnia wartość oceny θ jest równa wartościparametru θ, to ocenę θ nazywamy nieobciążoną

Minimalna wariancja

Z dwóch różnych nieobciążonych ocen θ oraz ˆθ tegosamego parametru θ za lepszą uznajemy tę, która„średnio” przyjmuje wartości bliższe parametrowi θ

Minimalny błąd średniokwadratowyJeżeli ocena θ nie jest nieobciążona, to wówczas jakomiernik jakości stosuje się błąd średniokwadratowy.Jest to „uśrednienie” obciążenia oraz wariancji

WZ WUM Wnioskowanie 7

R � � � � ! ! " # $ # % � & � " '

Zmienna losowa X ma rozkład D(p), jeżeli

P{X = 1} = p = 1− P{X = 0}

EX = p D2X = p(1− p)

Doświadczenie BernoulliegoWykonujemy dwuwynikowe doświadczenie. Wynikinazywane są umownie sukces oraz porażka. Praw-dopodobieństwo sukcesu wynosi p (porażki: 1 − p).Niech zmienną losową X będzie uzyskanie sukcesu.

Zmienna losowa X ma rozkład D(p).

Przykłady.

Płeć osoby.Wadliwość produktu.

WZ WUM Wnioskowanie 8

Page 5: Podstawy wnioskowania statystycznego

( ) * + , - / / 0 1 2 3 - 4 ) 0 5

Zmienna losowa X ma rozkład B(n, p), jeżeli

Pn,p{X = k} =(

n

k

)

pk(1− p)n−k, k = 0, 1, . . . , n.

EX = np D2X = np(1− p)

Schemat BernoulliegoZmienną losową o rozkładzie D(p) obserwujemy nkrotnie w sposób niezależny. Niech zmienną losowąX będzie ilość sukcesów.

Zmienna losowa X ma rozkład B(n, p).

Przykłady.

Ilość nasion, z których wzeszły rośliny.Ilość wadliwych produktów.„Popularność” danej osobistości publicznej.

WZ WUM Wnioskowanie 9

6 7 8 9 : ; < = 7 > ? ; @ = A

Zmienna losowa X ma rozkład normalny N(µ, σ2)o wartości średniej µ i wariancji σ2, jeżeli jej funkcjagęstości wyraża się wzorem

fµ,σ2(x) =1

σ√2πe−

1

2 ( x−µσ )2

, −∞ < x <∞.

EX = µ D2X = σ2.

Przykłady.

Błędy pomiarowe.Ciężar ciała.Zawartość białka w mięsie.

Standardowy rozkład normalny: N(0, 1)

Dystrybuanta F (x) standardowego rozkładunormalnego (N(0, 1)) jest stablicowana.

F (x) = 1− F (−x)

WZ WUM Wnioskowanie 10

Page 6: Podstawy wnioskowania statystycznego

B C D E G H I K C L M H N K O

µ = 0

µ = −1 µ = 1µ = 1

σ = 0.5σ = 1.0σ = 2.0

WZ WUM Wnioskowanie 11

Q T U wo trzech sigm

P{|X − µ| < σ} = 0.68268 ≈ 0.68

P{|X − µ| < 2σ} = 0.95450 ≈ 0.95

P{|X − µ| < 3σ} = 0.99730 ≈ 0.997

µ..............................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

...←−−−−−−−−−−−−− 0.997 −−−−−−−−−−−−−→

µ− 3σ µ+ 3σ................................................................................................................................................................................................................................

..................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

...................

..................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.←−−−−−−−− 0.95 −−−−−−−−→

µ− 2σ µ+ 2σ............................................................................................................................................................

..................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....................

..................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....←−− 0.68 −−→

µ− σ µ+ σ.......................................................................................

..................

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

.....

......................

..................

WZ WUM Wnioskowanie 12

Page 7: Podstawy wnioskowania statystycznego

V W X Y Z [ \ ] [ ^ [ _ [ Z ` X _ a b

rozkładu cechy

Estymujemy parametr θ rozkładu cechy XPróba: X1, X2, . . . , Xn

Estymator (punktowy) jest funkcją próby

θ = θ(X1, X2, . . . , Xn)

przybliżającą wartość parametru θ

Przedział ufności (estymator przedziałowy)jest przedziałem o końcach zależnych od próby, któryz pewnym z góry zadanym prawdopodobieństwempokrywa nieznaną wartość parametru θ

P{θ ∈ (θ(X1, . . . , Xn), θ(X1, . . . , Xn))} = 1− α

Poziom ufności: prawdopodobieństwo 1− α

Co wpływa na długość d przedziału ufności?1. Liczność próby (nր=⇒ dց)2. Poziom ufności (1− αր=⇒ dր)3. Wariancja cechy (σ2 ց=⇒ dց)

WZ WUM Wnioskowanie 13

c d e f g h i j d k l h m j n

Estymacja parametrówPróba (prosta): X1, X2, . . . , Xn

Estymator średniej µ — średnia arytmetyczna

X =1n

n∑

i=1

Xi =X1 + · · ·+Xn

n

Estymator wariancji σ2 — wariancja próbkowa

S2 =1n− 1

n∑

i=1

(Xi − X)2

Suma kwadratów odchyleń od średniej

varX =n∑

i=1

(Xi − X)2 =n∑

i=1

X2i − nX2

Estymator odchylenia standardowego σ

S =√S2

WZ WUM Wnioskowanie 14

Page 8: Podstawy wnioskowania statystycznego

o p q r dział ufności dla średniej

Wariancja σ2 jest nieznana

Poziom ufności: 1− α

(

X − t(α;n− 1) S√n, X + t(α;n− 1) S√

n

)

t(α;n− 1): wartość krytyczna rozkładu t (Studenta)z ν stopniami swobody

Długość przedziału: d = 2t(α;n− 1) S√n

Przedziały jednostronne

(−∞, X + t(2α;n− 1) S√n)

(X − t(2α;n− 1) S√n, ∞)

WZ WUM Wnioskowanie 15

s t u v kład.

Na podstawie próby 1.1, 1.2, 0.8, 0.9, 1.2, 1.3, 1.0,0.7, 0.8, 1.0 oszacować wartość średnią rozkładu ob-serwowanej cechy.

x =1.1 + 1.2 + · · ·+ 1.0

10= 1.0

varX = (1.1− 1.0)2 + · · ·+ (1.0− 1.0)2 = 0.36

s2 =0.3610− 1 = 0.04, s =

√s2 = 0.2

Poziom ufności 1− α = 0.95, czyli α = 0.05.

t(0.05; 9) = 2.2622

t(0.05; 9)s√n= 2.2622

0.2√10= 0.14

(1− 0.14, 1 + 0.14) = (0.86, 1.14)

Wniosek. Średnia wartość cechy jest jakąś liczbąz przedziału (0.86, 1.14). Zaufanie do tego wnioskuwynosi 95%.

WZ WUM Wnioskowanie 16

Page 9: Podstawy wnioskowania statystycznego

w x y z kład.Oszacować przeciętną ilość punktów uzyskiwanychna klasówce.

n = 300∑

xi = 176.566∑

x2i = 107.845302

Populacja:Słuchacze podstawowego kursu statystyki

Cecha X:ilość punktów zdobytych na klasówce

Założenie:cecha X ma rozkład normalny N(µ, σ2)

Zadanie: oszacować parametr µ

Technika statystyczna:przedział ufności dla średniejpoziom ufności 1− α = 0.95

WZ WUM Wnioskowanie 17

{ | } ~ � � � � ~ �

x =1n

xi =176.566300

= 0.589

varX =∑

x2i −1n

(

xi

)2

= 107.845302− 176.5662

300= 3.92679

s2 =3.92679300− 1 = 0.01313, s =

√s2 = 0.11460

t(0.05; 299) ≈ 1.96

t(0.05; 299)s√n= 1.96

0.11460√300

= 0.01297

(0.589− 0.013, 0.589 + 0.013) = (0.576, 0.602)

Odpowiedź: µ ∈ (0.576, 0.602)

Wniosek. Przeciętna liczba punktów zdobywana naklasówce jest liczbą z przedziału (0.576, 0.602). Za-ufanie do tego wniosku wynosi 95%.

WZ WUM Wnioskowanie 18

Page 10: Podstawy wnioskowania statystycznego

� � � � dział ufności dla wariancji

Średnia µ jest nieznana

Poziom ufności: 1− α

(

varXχ2(

α2 ;n− 1

) ,varX

χ2(

1− α2 ;n− 1)

)

χ2 (α;n− 1) jest stablicowaną wartością krytycznąrozkładu chi–kwadrat z ν stopniami swobody.

Przedziały jednostronne

(

0,varX

χ2 (α;n− 1)

)

(

varXχ2 (1− α;n− 1) , ∞

)

WZ WUM Wnioskowanie 19

� � � � kład.

Na podstawie próby 1.1, 1.2, 0.8, 0.9, 1.2, 1.3, 1.0,0.7, 0.8, 1.0 oszacować zróżnicowanie rozkładu ob-serwowanej cechy.

x =1.1 + 1.2 + · · ·+ 1.0

10= 1.0

varX = (1.1− 1.0)2 + · · ·+ (1.0− 1.0)2 = 0.36

s2 =0.3610− 1 = 0.04, s =

√s2 = 0.2

Poziom ufności 1− α = 0.95, czyli α = 0.05.

χ2(α

2;n− 1

)

= χ2 (0.025; 9) = 19.0228

χ2(

1− α2;n− 1

)

= χ2 (0.975; 9) = 2.7004(

0.3619.0228

,0.362.7004

)

= (0.019, 0.133)

Wniosek. Wariancja cechy jest jakąś liczbą z prze-działu (0.019, 0.133). Zaufanie do tego wniosku wy-nosi 95%.

WZ WUM Wnioskowanie 20

Page 11: Podstawy wnioskowania statystycznego

� � � � dział ufności dlaodchylenia standardowego

Średnia µ jest nieznana

Poziom ufności: 1− α(√

varXχ2(α2 ;n− 1)

,

varXχ2(1− α2 ;n− 1)

)

Przedziały jednostronne

(0,

√varX

χ2 (α;n− 1)

)

(√varX

χ2 (1− α;n− 1) ,∞)

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Przykład (cd).

Przedział ufności dla odchylenia standardowego:

(√0.019,

√0.133) = (0.136, 0.365)

WZ WUM Wnioskowanie 21

� � � � kład.Oszacować zróżnicowanie ilości punktów uzyskiwa-nych na klasówce.

n = 300∑xi = 176.566

∑x2i = 107.845302

Populacja:Słuchacze podstawowego kursu statystyki

Cecha X:ilość punktów zdobytych na klasówce

Założenie:cecha X ma rozkład normalny N(µ, σ2)

Zadanie: oszacować parametr σ

Technika statystyczna:przedział ufności dla odchylenia standardowegopoziom ufności 0.95

WZ WUM Wnioskowanie 22

Page 12: Podstawy wnioskowania statystycznego

� � � � � � � � � �

x = 0.589 varX = 3.92679

χ2(α2;n− 1

)= χ2 (0.025; 299) = 348.79420

χ2(1− α2;n− 1

)= χ2 (0.975; 299) = 252.99251

(√3.92679348.79420

,

√3.92679252.99251

)= (0.10610, 0.12458)

Odpowiedź: σ ∈ (0.10610, 0.12458)

Wniosek. Odchylenie standardowe liczby punktówzdobywanych na klasówce jest liczbą z przedziału(0.106, 0.125). Zaufanie do tego wniosku wynosi 95%.

WZ WUM Wnioskowanie 23

� � �   ¡ ¢ £ £ ¤ ¥ ¦ ¥ §   ¨ � ¤ ©

Estymacja parametru

p — frakcja, wskaźnik struktury

Próba: X1, . . . , Xn (Xi = 0 lub = 1)

k =∑ni=1Xi — ilość jedynek (sukcesów)

Estymator punktowy:

p =k

n

Przedział ufności na poziomie ufności 1− α(p1

(1− α2; k, n− k

), 1− p1

(1− α2;n− k, k

))

Jednostronne przedziały ufności

(p1 (1− α; k, n− k) , 1)

(0, 1− p1 (1− α;n− k, k))

WZ WUM Wnioskowanie 24

Page 13: Podstawy wnioskowania statystycznego

ª « ¬ ­ kład.Wśród 20 zbadanych detali znaleziono dwa braki.Ocenić na tej podstawie wadliwość produkcji.

Cecha X — jakość detalu (dobry, zły).Sukces — detal wybrakowanyPytanie: p =?

n = 20, k = 2 =⇒ p = 2/20 = 0.1

Poziom ufności 1− α = 0.9, czyli α = 0.1

p1

(1− α2; k, n− k

)= p1(0.95; 2, 18) = 0.0123

p1

(1− α2;n− k, k

)= p1(0.95; 18, 2) = 0.6830

(0.0123, 1− 0.6830) = (0.0123, 0.3170)

Wniosek. Wadliwość produkcji wyraża się liczbąz przedziału (1.23%, 31.70%). Zaufanie do wnioskuwynosi 90%.

WZ WUM Wnioskowanie 25

® ¯ ° ± bliżony przedział ufności

(p− u1−α/2

√p(1− p)n, p+ u1−α/2

√p(1− p)n

)

uα jest kwantylem rzędu α rozkładu N(0, 1).. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Przykład. (cd)

n = 200, k = 20 =⇒ p = 20/200 = 0.1

Poziom ufności 1− α = 0.9, czyli α = 0.1

u1−α/2 = u0.95 = 1.6449

0.1− 1.6449√0.1(1− 0.1)200

= 0.0651

0.1 + 1.6449

√0.1(1− 0.1)200

= 0.1349

Wniosek. Wadliwość produkcji wyraża się liczbąz przedziału (6.51%, 13.49%). Zaufanie do wnioskuwynosi 90%.

WZ WUM Wnioskowanie 26

Page 14: Podstawy wnioskowania statystycznego

² ³ ´ µ kład.Oszacować odsetek ocen dostatecznych otrzymywa-nych na klasówce.

n = 300 k = 88

Populacja:Słuchacze podstawowego kursu statystyki

Cecha X:ocena dostateczna z klasówki

Założenie:cecha X ma rozkład D(p)

Zadanie: oszacować parametr p

Technika statystyczna:przybliżony przedział ufności dla prawdopodobień-stwapoziom ufności 0.95

WZ WUM Wnioskowanie 27

¶ · ¸ ¹ º » ¼ ½ ¹ ¾

p =88300= 0.29

u1−α/2 = u0.975 = 1.96

0.29− 1.96√0.29(1− 0.29)

300= 0.2387

0.29 + 1.96

√0.29(1− 0.29)

300= 0.3413

Odpowiedź: p ∈ (0.2387, 0.3413)

Wniosek.Odsetek ocen dostatecznych zdobywanych na kla-sówce jest liczbą z przedziału (23.87%, 34.13%). Za-ufanie do tego wniosku wynosi 95%.

WZ WUM Wnioskowanie 28

Page 15: Podstawy wnioskowania statystycznego

¿ À Á Â Ã Ä Å Ä Æ Ç È Ã Â É Ê

rozkładów normalnych

Założenia:1. X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ22)2. X1, X2 są niezależne

Ocena µ1 − µ2 oraz σ21/σ22 .

Próby: X11, . . . , X1n1 ; X21, . . . , X2n2

X1, varX1, s21 =varX1n1 − 1

X2, varX2, s22 =varX2n2 − 1

WZ WUM Wnioskowanie 29

Ë Ì Í Î Ï Ð Ñ Ò Î Ó Ì Ô Õ Ó Ö × Ø Ô Ù Ð Í × Î Ó Õ Ó µ1 − µ2

Ocena punktowa: X1 − X2

Przedział ufności (poziom ufności 1− α)

1. Założenie σ21 = σ22

(X1 − X2−t(α;n1 + n2 − 2)sr,X1 − X2 + t(α;n1 + n2 − 2)sr)

s2e =varX1 + varX2n1 + n2 − 2

, s2r = s2e

(1n1+1n2

)

2. Bez założenia σ21 = σ22

(X1 − X2−V (α;n1 − 1, n2 − 1, c)sr,X1 − X2 + V (α;n1 − 1, n2 − 1, c)sr)

s2r =(s21n1+s22n2

)c =

s21/n1s21/n1 + s

22/n2

V (α;n1 − 1, n2 − 1, c) — wartość krytyczna testuBehrensa–Fishera

WZ WUM Wnioskowanie 30

Page 16: Podstawy wnioskowania statystycznego

Ú Û Ü Ý kład. Ocenić różnicę między średnimi wyni-kami klasówki pań i panów.Panowie:n1 = 138,

∑x1i = 82.833, varx1 = 1.65841

Panie:n2 = 162,

∑x2i = 93.733, varx2 = 2.23348

Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

Cecha X: ilość punktów zdobytych na klasówce

Założenie:cecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)σ21 = σ

22

Zadanie: oszacować różnicę µ1 − µ2Technika statystyczna:przedział ufności t dla różnicy średnichpoziom ufności 0.95

WZ WUM Wnioskowanie 31

Þ ß à á â ã ä å á æ

x1 = 0.60024, x2 = 0.57860,

s2r =1.65841 + 2.23348138 + 162− 2

(1138+1162

)

= 0.000175255

t(0.05; 298) ≈ 1.96; t(0.05; 298)sr = 0.02595(0.60024−0.57860±0.00034) = (−0.00431, 0.04759)

Odpowiedź: µ1 − µ2 ∈ (−0.00431, 0.04759)

Wniosek.Różnica średnich ilości punktów zdobywanych naklasówce przez panie i panów jest liczbą z przedziału(−0.00431, 0.04759). Zaufanie do tego wniosku wy-nosi 95%.

Sugestia. Ponieważ przedział „obejmuje” zero, więcmożna uznać, że µ1 = µ2.

WZ WUM Wnioskowanie 32

Page 17: Podstawy wnioskowania statystycznego

ç è é ê ë ì í î ï ë ð ñ ò ë ï ì ë ê è ó ì σ21/σ22

Ocena punktowa: S21/S22

Przedział ufności (poziom ufności 1− α)

(S21S22·F(1− α2;n1 − 1, n2 − 1

),

S21S22· F(α2;n1 − 1, n2 − 1

))

F (α;u, v) jest stablicowaną wartością krytyczną roz-kładu F–Snedecora (Fishera–Snedecora)

F (1− α;u, v) = 1F (α; v, u)

WZ WUM Wnioskowanie 33

ô õ ö ÷ kład. Porównać zróżnicowanie ocen wynikówklasówek pań i panów.Panowie:n1 = 138,

∑x1i = 82.833, varx1 = 1.65841

Panie:n2 = 162,

∑x2i = 93.733, varx2 = 2.23348

Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

Cecha X: ilość punktów zdobytych na klasówce

Założenie:cecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)

Zadanie: oszacować iloraz σ21/σ22

Technika statystyczna:przedział ufności dla ilorazu wariancjipoziom ufności 0.90

WZ WUM Wnioskowanie 34

Page 18: Podstawy wnioskowania statystycznego

ø ù ú û ü ý þ ÿ û O

s21 =1.65841138− 1 = 0.01211, s

22 =2.23348162− 1 = 0.01387,

F (0.05; 137, 161) = 1.30936

F (0.95; 137, 161) =1

F (0.05; 161, 137)

=1

1.31386= 0.76111

(0.012110.01387

· 0.76111, 0.012110.0138

· 1.30936)

= (0.66415, 1.14255)

Odpowiedź: σ21/σ22 ∈ (0.66415, 1.14255)

Wniosek.Iloraz wariancji ilości punktów zdobywanych naklasówce jest liczbą z przedziału (0.66415, 1.14255).Zaufanie do tego wniosku wynosi 90%.

Sugestia. Ponieważ przedział „obejmuje” jedynkę,więc można uznać, że σ21 = σ

22 .

WZ WUM Wnioskowanie 35

P � � � � � � � � � � � �

rozkładów dwupunktowych

Założenia:1. X1 ∼ D(p1), X2 ∼ D(p2)2. X1, X2 są niezależne

Ocena p1 − p2.

Próby: X11, . . . , X1n1 ; X21, . . . , X2n2 (Xij = 0 lub 1)

k1 =n1∑

i=1

X1i k2 =n2∑

i=1

X12

p1 = k1/n1 p2 = k2/n2 p = (k1 + k2)/(n1 + n2)

Przedział ufności (poziom ufności 1− α)

p1 − p2 − u1−α2

p(1− p)(1n1+1n2

),

p1 − p2 + u1−α2

p(1− p)(1n1+1n2

)

WZ WUM Wnioskowanie 36

Page 19: Podstawy wnioskowania statystycznego

� � � kład.Oszacować różnicę między „niezaliczalnością” kla-sówki ze statystyki przez panie i panów. Na pod-stawie dotychczasowych danych wiadomo, że na 162pań nie zaliczyło klasówki 46 pań oraz na 138 panów30 uzyskało ocenę negatywną.

Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

Cecha X: uzyskanie z klasówki oceny negatywnej

Założenie:cecha X ma w populacji 1 rozkład D(p1)cecha X ma w populacji 2 rozkład D(p2)

Zadanie: oszacować różnicę p1 − p2

Technika statystyczna:przybliżony przedział ufności dla różnicy prawdopo-dobieństwpoziom ufności 0.95: u0.975 = 1.96

WZ WUM Wnioskowanie 37

� � � � � � � � � �

n1 = 162 k1 = 46 n2 = 138 k2 = 30

p1 =k1n1=46162= 0.2840 p2 =

k2n2=30138= 0.2174

p =(k1 + k2)(n1 + n2)

=(46 + 30)(162 + 138)

= 0.2533

1.96 ·√0.2533(1− 0.2533)

300

(1162+1138

)= 0.0987

(0.2840− 0.2174− 0.0987, 0.2840− 0.2174 + 0.0987)

(−0.0321, 0.1653)

Wniosek. Różnica prawdopodobieństw jest liczbąz przedziału (−0.0321, 0.1653).

Sugestia. Ponieważ przedział „obejmuje” zero, więcodsetki pań i panów niezaliczających klasówki możnatraktować jako porównywalne.

WZ WUM Wnioskowanie 38

Page 20: Podstawy wnioskowania statystycznego

W � � � � � � � � �

hipotez statystycznych

Hipotezą statystyczną nazywamy dowolne przy-puszczenie dotyczące rozkładu prawdopodobieństwacechy w populacji.Oznaczenie H0

Testem hipotezy statystycznej nazywamy postępo-wanie mające na celu odrzucenie lub nie odrzuceniehipotezy statystycznej.

Statystyką testową nazywamy funkcję próby napodstawie której wnioskuje się o odrzuceniu lub niehipotezy statystycznej.

Rzeczywistość: Wniosek o hipotezie H0hipoteza H0 nie odrzucać odrzucićprawdziwa prawidłowy nieprawidłowynieprawdziwa nieprawidłowy prawidłowy

WZ WUM Wnioskowanie 39

B ! " # $ % & ' " ( ) * + nazywamy błąd wnioskowaniapolegający na odrzuceniu hipotezy, gdy w rzeczywi-stości jest ona prawdziwa.

Błędem II rodzaju nazywamy błąd wnioskowaniapolegający na nieodrzuceniu hipotezy, gdy w rzeczy-wistości jest ona fałszywa.

Poziomem istotności nazywamy dowolną liczbęz przedziału (0, 1) określającą prawdopodobieństwopopełnienia błędu I rodzaju.Oznaczenie: α

Mocą testu nazywamy prawdopodobieństwo od-rzucenia testowanej hipotezy, gdy jest ona niepraw-dziwa, czyli prawdopodobieństwo nie popełnieniabłędu II rodzaju.Oznaczenie: 1− β

WZ WUM Wnioskowanie 40

Page 21: Podstawy wnioskowania statystycznego

R , - . / 0 1 2 , 3 4 0 5 2 6

Porównanie z normą

H0 : µ = µ0

Cecha X ma rozkład normalny N(µ, σ2)Średnia µ oraz wariancja σ2 są nieznane

Test Studenta (poziom istotności α)

Próba: X1, . . . , XnStatystyka testowa

temp =X − µ0S

√n .

Wartość krytyczna t(α;n− 1)

Jeżeli |temp| > t(α;n − 1), to hipotezę H0 : µ = µ0odrzucamy.

WZ WUM Wnioskowanie 41

7 8 9 : kład. Przypuszczenie: maszyna pakująca kost-ki masła nastawiona na jednostkową masę 250 g ule-gła po pewnym czasie rozregulowaniu. W celu wery-fikacji tego przypuszczenia z bieżącej produkcji po-brano próbę otrzymując wyniki 254, 269, 254, 248,263, 256, 258, 261, 264, 258. Czy można na tej pod-stawie sądzić, że maszyna uległa rozregulowaniu?

Populacja:paczkowane kostki masła

Cecha X:masa kostki masła

Założenie:cecha X ma rozkład normalny N(µ, σ2)

Formalizacja:Rozregulowanie maszyny może być interpretowanejako odejście od nominalnej wagi. Zatem należy zba-dać, czy średnia µ wynosi 250, czyli weryfikujemyhipotezę H0 : µ = 250

WZ WUM Wnioskowanie 42

Page 22: Podstawy wnioskowania statystycznego

T ; < = > ? @ A C D A D E C D E < F > A G

test Studenta (test t)poziom istotności α = 0.05

Obliczenia

x = 258.5, s2 = 36.05, temp = 4.47

Wartość krytyczna: t(0.05; 9) = 2.2622

Odpowiedź: hipotezę odrzucamy

Wniosek: maszyna uległa rozregulowaniu

WZ WUM Wnioskowanie 43

M H I J K L J N

Moc testu = 1− P{błąd II rodzaju}Moc testu = P{odrzucenie nieprawdziwej H0}

Moc testu Studenta hipotezy H0 : µ = µ0

M(µ) = P{|temp| > t(α;n− 1)|X ∼ N(µ, σ2)}

M(µ0) = α

n = 10n = 20n = 30

WZ WUM Wnioskowanie 44

Page 23: Podstawy wnioskowania statystycznego

Q S U V dział ufności a test hipotezy H0 : µ = µ0

Cecha X ∼ N(µ, σ2)

H0 : µ = µ0

H0 nie odrzucamy na poziomie istotności α

m|temp| < t(α;n− 1)

m

−t(α;n− 1) < X − µ0S

√n < t(α;n− 1)

m

µ0 ∈(X − t(α;n− 1) S√

n, X + t(α;n− 1) S√

n

)

mµ0 należy do przedziału ufności

na poziomie ufności 1− α

WZ WUM Wnioskowanie 45

X 0 : σ2 = σ20

Cecha X ma rozkład normalny N(µ, σ2)Średnia µ oraz wariancja σ2 są nieznane

Test chi–kwadrat (poziom istotności α)

Próba: X1, . . . , XnStatystyka testowa

χ2emp =varXσ20

Wartości krytyczneχ2

(

1− α2 ;n− 1)

oraz χ2(

α2 ;n− 1

)

Jeżeli

χ2emp < χ2(

1− α2 ;n− 1)

lub

χ2emp > χ2(

α2 ;n− 1

)

,

to hipotezę H0 : σ2 = σ20 odrzucamy.

WZ WUM Wnioskowanie 46

Page 24: Podstawy wnioskowania statystycznego

Y Z [ \ kład. Na podstawie obserwacji prowadzonychprzez długi okres czasu stwierdzono, że dzienny udójuzyskiwany w pewnym stadzie krów jest wielkościąlosową, zaś przeciętny dzienny udój mleka wyrażasie liczbą z przedziału (900, 1200). Rachunek finan-sowy pokazał, że produkcja mleka jest opłacalna, je-żeli całkowity dzienny udój będzie wynosił nie mniejniż d = 700 lmleka przez co najmniej 280 dni w roku.W jaki sposób można zbadać, czy produkcja mlekajest opłacalna?

Populacja:

Cecha:całkowity dzienny udój

Założenia:Cecha X ma rozkład N(µ, σ2)µd = 900 ≤ µ ≤ µg = 1200

WZ WUM Wnioskowanie 47

] ^ _ ` a b c d a e f a g _ ^ h b i ` j

P{X ≥ d} ≥ p = 280350

P{X ≥ d} = 1− F(d− µσ

)≥ 1− F

(d− µdσ

)

1− F(d− µdσ

)≥ 1− p⇒ F

(d− µdσ

)≤ 1− p

d− µdσ

≤ F−1(1− p) = u1−p

d, µd oraz p są ustalone, więc

σ2 ≥ σ20 =(d− µdu1−p

)2= 56472

Produkcja mleka jest opłacalna, jeżeli wariancja σ2

dziennych udojów jest większa niż σ20 = 56472.

H0 : σ2 ≤ 56472

WZ WUM Wnioskowanie 48

Page 25: Podstawy wnioskowania statystycznego

k l m n o p q q r s t s u n v l r w

Porównanie z normą

H0 : p = p0

Cecha X ma rozkład D(p)Próba: X1, . . . , Xn (Xi = 0 lub = 1)Test przybliżony (poziom istotności α)Przypadek: n „duże”

Statystyka testowa

uemp =Y − np0√np0(1− p0)

Wartość krytyczna u1−α/2

Jeżeli |uemp| > u1−α/2, to H0 : p = p0 odrzucamy

WZ WUM Wnioskowanie 49

x y z { kład. W swojej ofercie sprzedaży stawu ryb-nego jego właściciel podaje, iż w stawie żyje co naj-mniej tysiąc karpi. Potencjalny nabywca zaintereso-wany jest sprawdzeniem prawdziwości tego twierdze-nia. W tym celu wyłowiono sto karpi i po zaobrącz-kowaniu ich wpuszczono je z powrotem do stawu. Pojakimś czasie ponownie odłowiono sto ryb i stwier-dzono, że wśród nich jest piętnaście zaobrączkowa-nych. Czy w świetle uzyskanych wyników można re-klamę uznać za prawdziwą?

Populacja:ryby w stawie

Cecha:zaobrączkowanie ryby

Założenia:Cecha X ma rozkład D(p)

WZ WUM Wnioskowanie 50

Page 26: Podstawy wnioskowania statystycznego

| } ~ � � � � � � � � � � ~ } � � � � �

Jeżeli w stawie żyje co najmniej N ryb, to odsetekzaobrączkowanych jest co najwyżej 100/N . Zgodniez twierdzeniem właściciela, N ≥ 1000, czyli odsetekryb zaobrączkowanych nie przekracza 0.1.

Technika statystycznaPrzybliżony test hipotezy H0 : p ≤ 0.1Poziom istotności: α = 0.05

Obliczenia

Y = 15 n = 100

uemp =Y − np0√np0(1− p0)

=15− 10√100 · 0.1 · 0.9

= 1.6667

Wartość krytyczna: u1−0.05 = 1.6449

Odpowiedź: hipotezę odrzucamy

Wniosek: należy uznać, że ogólna liczb ryb w stawiejest mniejsza niż podana w ofercie

WZ WUM Wnioskowanie 51

� � � � � � � � � � � � � � �

rozkładów normalnych

Założenia:1. X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ22)2. X1, X2 są niezależne

Czy µ1 = µ2?

Czy σ21 = σ22?

Próby: X11, . . . , X1n1 ; X21, . . . , X2n2

X1, varX1, s21 =varX1n1 − 1

X2, varX2, s22 =varX2n2 − 1

WZ WUM Wnioskowanie 52

Page 27: Podstawy wnioskowania statystycznego

� 0 : µ1 = µ2

Założenie σ21 = σ22

Test Studenta (poziom istotności α)

Statystyka testowa

temp =X1 − X2Sr

Sr =

S2e

(1n1+1n2

), S2e =

varX1 + varX2n1 + n2 − 2

Wartość krytyczna t(α;n1 + n2 − 2)

Jeżeli |temp| > t(α;n1 + n2 − 2),to hipotezę H0 : µ1 = µ2 odrzucamy

WZ WUM Wnioskowanie 53

� � � � kład. Porównać przeciętne osiągnięcia punk-towe pań i panów na klasówce ze statystykiPanowie:n1 = 138,

∑x1i = 82.833, varx1 = 1.65841

Panie:n2 = 162,

∑x2i = 93.733, varx2 = 2.23348

Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

Cecha X: ilość punktów zdobytych na klasówce

Założenia:cecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)σ21 = σ

22

Zadanie: zweryfikować hipotezę H0 : µ1 = µ2

Technika statystyczna:test tpoziom istotności 0.05

WZ WUM Wnioskowanie 54

Page 28: Podstawy wnioskowania statystycznego

� � � � �   ¡ ¢ � £

x1 = 0.60024 x2 = 0.57860

s2r =1.65841 + 2.23348138 + 162− 2

(1138+1162

)

= 0.000175255

temp =0.60024− 0.57860√0.000175255

= 1.634

Wartość krytyczna t(0.05; 298) ≈ 1.96

Odpowiedź: hipotezy nie odrzucamy

Wniosek.Średnie ilości punktów uzyskiwane przez panie i pa-nów można traktować jako porównywalne.

WZ WUM Wnioskowanie 55

¤ ¥ ¦ § dział ufności a test hipotezy H0 : µ1 = µ2

Cecha X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ22), σ21 = σ22

H0 : µ1 = µ2

H0 nie odrzucamy na poziomie istotności α

m|temp| < t(α;n1 + n2 − 2)

m

−t(α;n1 + n2 − 2) <X1 − X2Sr

< t(α;n1 + n2 − 2)

m0 ∈

(

X1 − X2 ± t(α;n1 + n2 − 2)Sr)

m0 należy do przedziału ufności

na poziomie ufności 1− α

WZ WUM Wnioskowanie 56

Page 29: Podstawy wnioskowania statystycznego

¨ 0 : σ21 = σ22

Test F (poziom istotności α)

Statystyka testowa

Femp =S21S22

Wartości krytyczneF(1− α2;n1 − 1, n2 − 1

)

F(α2;n1 − 1, n2 − 1

)

JeżeliFemp < F

(1− α2;n1 − 1, n2 − 1

)

lubFemp > F

(α2;n1 − 1, n2 − 1

)

to hipotezę H0 : σ21 = σ22 odrzucamy

WZ WUM Wnioskowanie 57

© ª « ¬ «

F (1− α;u, v) = 1F (α; v, u)

Reguła: większa wariancja do licznika.

Jeżeli S21 > S22 , to wyznaczana jest statystyka

Femp =S21S22

i hipoteza jest odrzucana, gdy

Femp > F(α2;n1 − 1, n2 − 1

)

Jeżeli zaś S21 < S22 , to wyznaczana jest statystyka

Femp =S22S21

i hipoteza jest odrzucana, gdy

Femp > F(α2;n2 − 1, n1 − 1

)

WZ WUM Wnioskowanie 58

Page 30: Podstawy wnioskowania statystycznego

­ ® ¯ ° kład. Dla sprawdzenia stabilności pracy ma-szyny pobrano dwie próbki: pierwszą w początko-wym okresie eksploatacji oraz drugą po miesięcznymokresie pracy tej maszyny. Wykonano pomiary wylo-sowanych produktów i otrzymano wyniki: n1 = 25,x1 = 3.24, s21 = 0.1447 oraz n2 = 19, x2 = 3.19,s22 = 0.1521. Zbadać na tej podstawie czy maszynanie rozregulowała się w trakcie pracy.

Populacja 1produkcja maszyny w początkowym okresie

Populacja 2produkcja maszyny po miesiącu eksploatacji

Cecha Xpomiar produktu

Założeniacecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)

WZ WUM Wnioskowanie 59

± ² ³ ´ µ ¶ · ¸ µ ¹ º µ

Stabilność pracy maszyny może być mierzona podo-bieństwem wytwarzanych produktów: im własnościproduktów są do siebie bardziej zbliżone, tym bar-dziej stabilna jest praca maszyny. Podobieństwo ta-kie jest wyrażane wariancją cechy. Zatem stabilnośćpracy można wyrazić liczbowo jako wariancję inte-resującej cechy produktu, a problem stabilności jakozagadnienie weryfikacji hipotezy H0 : σ21 = σ

22

Technika statystycznaTest F (poziom istotności α = 0.10)

Obliczenia

Femp =s22s21= 1.051

Wartość krytyczna F (0.05; 19, 24) = 2.114

Odpowiedź: hipotezy nie odrzucamy

Wniosek: można uznać że maszyna nie rozregulo-wała się w trakcie pracy

WZ WUM Wnioskowanie 60

Page 31: Podstawy wnioskowania statystycznego

» ¼ ½ ¾ ¿ À Á À Â Ã Ä ¿ ¾ Å Æ

rozkładów dwupunktowych

Założenia:1. X1 ∼ D(p1), X2 ∼ D(p2)2. X1, X2 są niezależne

H0 : p1 = p2

Test przybliżony (poziom istotności α)

p1 =k1n1, p2 =

k2n2, p =

(k1 + k2)(n1 + n2)

Statystyka testowa

uemp =p1 − p2√

p(1− p)( 1n1 +1n2)

|uemp| ≥ u1−α/2 =⇒ H0 : p1 = p2 odrzucamy

WZ WUM Wnioskowanie 61

Ç È É Ê kład. Celem badania było porównanie przy-gotowania z matematyki kandydatów na studia bę-dących absolwentami liceów oraz techników. W tymcelu spośród kandydatów zdających matematykę wy-losowano 400 absolwentów liceów oraz 600 absol-wentów techników. W wylosowanej grupie stwier-dzono, że 385 absolwentów liceów oraz 501 absolwen-tów techników rozwiązało test wstępny. Czy możnana tej podstawie sądzić, że przygotowanie w obu gru-pach absolwentów jest jednakowe?

Populacja 1:absolwenci liceów zdający egzamin wstępnyPopulacja 2:absolwenci techników zdający egzamin wstępny

Cecha X: umiejętność rozwiązania testu (tak/nie)

Założenia:cecha X ma w populacji 1 rozkład D(p1)cecha X ma w populacji 2 rozkład D(p2)

FormalizacjaWeryfikacja hipotezy H0 : p1 = p2

WZ WUM Wnioskowanie 62

Page 32: Podstawy wnioskowania statystycznego

Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Ò Ô Õ Ó Ô Õ Í Ö Ï Ò

Test przybliżony (poziom istotności α = 0.05)

Obliczenia

n1 = 400 k1 = 385 p1 = 385/400 = 0.9625

n2 = 600 k2 = 501 p2 = 501/600 = 0.8350

p = (385 + 501)/(400 + 600) = 0.886

uemp =0.9625− 0.8350√

0.886(1− 0.886)(

1400 +

1600

)

= 6.215.

Wartość krytyczna u0.975 = 1.96

Odpowiedź: hipotezę H0 : p1 = p2 odrzucamy

Wniosek:przygotowanie absolwentów liceów i techników z ma-tematyki nie jest takie same.

WZ WUM Wnioskowanie 63

× Ø Ù Ú Û Ü Ý Ü Þ ß Û Þ ß à á

rozkładów normalnych

Założenia:1. Xi ∼ N(µi, σ2i ), i = 1, . . . , k2. X1, . . . , Xk są niezależne

Czy µ1 = · · · = µk?

Czy σ21 = · · · = σ2k?

Próby: Xi1, . . . , Xini , i = 1, . . . , k

Xi, varXi, s2i =varXini − 1

; i = 1, . . . , k

WZ WUM Wnioskowanie 64

Page 33: Podstawy wnioskowania statystycznego

â 0 : µ1 = · · · = µk

Założenie σ21 = · · · = σ2kTest F (poziom istotności α)

Statystyka testowa

Femp =S2aS2e

S2a =1k − 1

k∑

i=1

ni(Xi − X)2

S2e =1N − k

k∑

i=1

ni∑

j=1

(Xij − Xi)2

Xi =1ni

ni∑

j=1

Xij , X =1N

k∑

i=1

ni∑

j=1

Xij

N =k∑

i=1

ni

WZ WUM Wnioskowanie 65

ã ä å ä æ ç Femp > F (α; k − 1, N − k),to hipotezę H0 : µ1 = · · · = µk odrzucamy.

Wniosek praktyczny:przynajmniej jedna ze średnich µ1, . . . , µk jest innaod pozostałych

Model analizy wariancji

Xij = µi + εij

Błąd losowy εij ∼ N(0, σ2)

PrzykładyPlenność kilku odmian pewnej rośliny uprawnejWydajność pracowników kilku zakładów pracyZarobki kilku grup społecznych

Czynnik: odmiana, zakład, grupaPoziomy czynnika: badane odmiany, badane za-kłady, badane grupy

WZ WUM Wnioskowanie 66

Page 34: Podstawy wnioskowania statystycznego

è é ê ë ì í î í ì ï ð ñ ò í ó ï í î ô õ ï

Xij = µ+ ai + εij

ai — efekt i–tego poziomu czynnika:∑ki=1 ai = 0

H0 : a1 = · · · = ak = 0, H0 :k∑

i=1

a2i = 0

Tabela analizy wariancji

Źródło Stopnie Sumy Średnie Femp

zmienności swobody kwadratów kwadraty

Czynnik k − 1 varA S2a =varAk−1 S

2a/S

2e

Błąd losowy N − k varE S2e =varEN−k

Ogółem N − 1 varT

varA =k∑

i=1

ni(Xi− X)2, varE =k∑

i=1

ni∑

j=1

(Xij − Xi)2,

varT =k∑

i=1

ni∑

j=1

(Xij − X)2,

varA+ varE = varT

WZ WUM Wnioskowanie 67

ö ÷ ø ù ú û ü ý þ ÿ ÷ ÿ ý þ ü — podzbiory średnich, któremożna uznać za takie same

Procedury porównań wielokrotnych — postę-powanie statystyczne zmierzające do podzieleniazbioru średnich na grupy jednorodne

Procedury: Tukeya, Scheffego, Bonfferroniego, Dun-cana, Newmana–Kuelsa i inne.

Ogólna idea procedur porównań wielokrotnych(n1 = · · · = nk)

NIR — najmniejsza istotna różnica

Jeżeli |Xi − Xj | < NIR, to uznajemy, że µi = µj .

Jeżeli|Xi − Xj | < NIR|Xi − Xl| < NIR|Xl − Xj | < NIR,to uznajemy, że µi = µj = µl.

Badając w ten sposób wszystkie pary średnich prób-kowych otrzymujemy podział zbioru średnich na gru-py jednorodne.

WZ WUM Wnioskowanie 68

Page 35: Podstawy wnioskowania statystycznego

P � � cedura Tukeya

Założenie: n1 = · · · = nk = n

NIR = t(α; k,N − k)Se√1n

t(α; k,N − k) — wartość krytyczna studentyzowa-nego rozstępu

Przypadek nierównolicznych próbJedna z modyfikacji procedury Tukeya

NIRij = t(α; k,N − k)Se

√12

(1ni+1nj

)

WZ WUM Wnioskowanie 69

� � � � kład. Przeprowadzić analizę porównawczą wy-ników punktowych klasówki w grupach studenckich.

PopulacjeMożemy wyodrębnić dziesięć populacji indeksowa-nych numerami grup studenckich

Cecha XIlość punktów uzyskanych na klasówce

Założeniacecha X ma w i–tej populacji rozkład N(µi, σ2i )(i = 1, . . . , 10)σ21 = · · · = σ210

Formalizacjaweryfikacja hipotezy H0 : µ1 = · · · = µ10

Techniki statystyczna• Jednoczynnikowa analiza wariancji• Porównania szczegółowePoziom istotności 0.05

WZ WUM Wnioskowanie 70

Page 36: Podstawy wnioskowania statystycznego

O � � � � � �

i ni∑xi

∑x2i

1 30 18.230 11.3759502 30 16.672 9.5967903 30 14.292 7.0874584 30 18.879 12.0696555 30 18.200 11.3559826 30 19.568 13.1728847 30 16.522 9.4209608 30 19.134 12.5148749 30 18.548 11.94596410 30 16.521 9.304785

300 176.566 107.845302

i ni xi ni(xi−x)2 varxi1 30 0.607667 0.010960 0.2981872 30 0.555733 0.032315 0.3316043 30 0.476400 0.377351 0.2787494 30 0.629300 0.049809 0.1891005 30 0.606667 0.009843 0.3146496 30 0.652267 0.121782 0.4093307 30 0.550733 0.042911 0.3217448 30 0.637800 0.072757 0.3112099 30 0.618267 0.026486 0.47835410 30 0.550700 0.042986 0.206670

N=300 x=0.588553 varA=0.787199 varE=3.139595

varT = 107.845302− 176.5662/300 = 3.926794

WZ WUM Wnioskowanie 71

T � � � � � � � � � � � � � � � � � � � � �

Źródło Stopnie Sumy Średnie Femp

zmienności swobody kwadratów kwadraty

Grupa 9 0.787199 0.087467 8.079

Błąd losowy 290 3.139595 0.010826

Ogółem 299 3.926794

Wartość krytyczna

F (0.05; 9, 290) = 1.912

Odpowiedź:hipotezę H0 : µ1 = · · · = µ10 odrzucamy

Wniosek:przynajmniej jedna grupa uzyskała inną średnią licz-bę punktów niż pozostałe

WZ WUM Wnioskowanie 72

Page 37: Podstawy wnioskowania statystycznego

W � � � � � � � � � ! " # $ % � & � ' " ' & � � � (

Procedura Tukeya (α = 0.05)

Wartość krytyczna: t(0.05; 10, 290) = 4.474

NIR = 4.474 ·√0.010826 ·

√130= 0.084990

i xi3 0.476400 ∗10 0.550700 ∗ ∗7 0.550733 ∗ ∗2 0.555733 ∗ ∗ ∗5 0.606667 ∗ ∗ ∗1 0.607667 ∗ ∗ ∗9 0.618267 ∗ ∗ ∗4 0.629300 ∗ ∗ ∗8 0.637800 ∗ ∗6 0.652267 ∗

WZ WUM Wnioskowanie 731 ) * + , - . / 0 1 2

••

• ••

•• •

•............................................................................................................................................................................................................................................................................................................................................................................................................................···

·

·

·

··

·

···

·

···········

·

··

·

··

··

·

··

·

·······

·

·

·

···

····

·

·

·

·

··

··

·

··

···

··

·····

·······

·

··

·

···

··

·

···

·····

······

··

·······

··

··

·

· ·

··

·

·····

···

··

···

····

·

··

·

····

·

·

·

········

·

··

··

·

·

·

·····

··

··

···

·

·

·

··

··

·

··

···

·

·

·

······

·

··

·

···

·

··

··

·

·

············

·

·

···

·

··

·

··

·

··

·

·

··

·

·

·

··

·

···

·

·····

·

·

·

·

·

·

·

·

·

···

·

··

···

····

········

··

·

·

··

··

·

1 2 3 4 5 6 7 8 9 10

••

• ••

•• •

•......................................

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

... ......................................

.....

.....

.....

.....

.....

.....

.....

...

.....

.....

.....

.....

.....

.....

.....

...

WZ WUM Wnioskowanie 74