Biostatystyka - wum wnioskowanie wykladbiostatystykanzc.wum.edu.pl/.../biostatystyka_wyklad.pdf ·...

37
Podstawy wnioskowania statystycznego Wojciech Zieliński http:\\wojtek.zielinski.statystyka.info http:\\biostatystykanzc.wum.edu.pl WZ WUM W nioskowanie 1 : nauka poświęcona metodom ba- dania (analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w po- staci zestawień tabelarycznych, wykresów, itp.; po- sługuje się rachunkiem prawdopodobieństwa. STATYSTYKAMATEMATYCZNA: dział matematyki stosowanej oparty na rachunku praw- dopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części. Encyklopedia Popularna PWN, Warszawa 1982 BIOSTATYSTYKA (biometria): nauka z pogra- nicza biologii i statystyki, adaptacja metod staty- stycznych na potrzeby prac badawczych w dziedzinie biologii, związanych przede wszystkim z medycyną, genetyką, fizjologią, antropologią, ekologią i rolnic- twem. WZ WUM W nioskowanie 2

Transcript of Biostatystyka - wum wnioskowanie wykladbiostatystykanzc.wum.edu.pl/.../biostatystyka_wyklad.pdf ·...

  • P � � � � � � � � � � � � � � � � � � �

    Podstawy wnioskowania statystycznego

    Wojciech Zieliński

    http:\\wojtek.zielinski.statystyka.info

    http:\\biostatystykanzc.wum.edu.pl

    WZ WUM Wnioskowanie 1

    S � � S � � : nauka poświęcona metodom ba-dania (analizowania) zjawisk masowych; polega nasystematyzowaniu obserwowanych cech ilościowychi jakościowych oraz przedstawianiu wyników w po-staci zestawień tabelarycznych, wykresów, itp.; po-sługuje się rachunkiem prawdopodobieństwa.

    STATYSTYKA MATEMATYCZNA: działmatematyki stosowanej oparty na rachunku praw-dopodobieństwa; zajmuje się badaniem zbiorów napodstawie znajomości własności ich części.

    Encyklopedia Popularna PWN, Warszawa 1982

    BIOSTATYSTYKA (biometria): nauka z pogra-nicza biologii i statystyki, adaptacja metod staty-stycznych na potrzeby prac badawczych w dziedziniebiologii, związanych przede wszystkim z medycyną,genetyką, fizjologią, antropologią, ekologią i rolnic-twem.

    WZ WUM Wnioskowanie 2

  • .

    .....

    .....

    .....

    .....

    .....

    ..........................................................................................................................................

    ..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    .....

    .....

    .....

    .....

    ................................................................................................

    ..................................................................................................................................................................................................................................................................................................................................................................................................................

    .................................................................................................................................................................................................................................

    .......................................

    ............................................................................................................................................................................................................

    .......................................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ..........................................

    .......................................

    Populacja

    Próba

    Wnioski

    o populacji

    Wnioskiz próby

    WZ WUM Wnioskowanie 3

    F F F F F5 2 4 1 527 29 12 8 33

    M M M F F8 8 6 6 840 52 33 38 22

    M M F M M9 10 7 11 935 73 30 50 67

    M M F M M14 12 8 14 1168 75 40 64 69

    F F M M M9 8 11 10 1554 40 51 55 66

    Próba 1: 5 2 4 1 5 Średnia z próby: 3.40Próba 2: 8 8 6 6 8 Średnia z próby: 7.20Próba 3: 9 10 7 11 9 Średnia z próby: 9.20Próba 4: 14 12 8 14 11 Średnia z próby: 11.80Próba 5: 9 8 11 10 15 Średnia z próby: 10.60

    Średnia populacji: 8.44

    WZ WUM Wnioskowanie 4

  • .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...................

    ..................

    8.44

    Pytania

    Czy mając do dyspozycji tylko jedną próbę możnaocenić na ile dobrze średnia z tej próby przybliżaprawdziwą średnią?

    Co zrobić, by być „pewniejszym” wyniku?

    WZ WUM Wnioskowanie 5

    � � � � � � � � �

    Zbiór obiektów z wyróżnioną cechą (cechami)

    PróbaWybrana część populacji podlegająca badaniu

    CechaWielkość losowa charakteryzująca obiekty danej po-pulacji

    Cecha jakościowaCecha przyjmująca wartości nie będące liczbami (np.kolor, płeć, smakowitość)

    Cecha (ilościowa) skokowaCecha przyjmująca pewne wartości liczbowe i nieprzyjmująca wartości pośrednich (np. ilość bakterii,ilość pracowników, ilość pasażerów). Cechy te nazy-wane są również dyskretnymi.

    Cecha (ilościowa) ciągłaCecha przyjmująca wartości z pewnego przedziałuliczbowego (np. wzrost, waga, plon)

    WZ WUM Wnioskowanie 6

  • J � � � � �

    wnioskowania statystycznego

    Oceniamy parametr θ cechy na podstawie próbyX1, X2, . . . , Xn. Niech θ̂(X1, X2, . . . , Xn) będzie „ja-kąś” oceną parametru θ

    NieobciążonośćJeżeli średnia wartość oceny θ̂ jest równa wartościparametru θ, to ocenę θ̂ nazywamy nieobciążoną

    Minimalna wariancja

    Z dwóch różnych nieobciążonych ocen θ̂ oraz ˆ̂θ tegosamego parametru θ za lepszą uznajemy tę, która„średnio” przyjmuje wartości bliższe parametrowi θ

    Minimalny błąd średniokwadratowyJeżeli ocena θ̂ nie jest nieobciążona, to wówczas jakomiernik jakości stosuje się błąd średniokwadratowy.Jest to „uśrednienie” obciążenia oraz wariancji

    WZ WUM Wnioskowanie 7

    R � � � � ! ! " # $ # % � & � " '

    Zmienna losowa X ma rozkład D(p), jeżeli

    P{X = 1} = p = 1− P{X = 0}

    EX = p D2X = p(1− p)

    Doświadczenie BernoulliegoWykonujemy dwuwynikowe doświadczenie. Wynikinazywane są umownie sukces oraz porażka. Praw-dopodobieństwo sukcesu wynosi p (porażki: 1 − p).Niech zmienną losową X będzie uzyskanie sukcesu.

    Zmienna losowa X ma rozkład D(p).

    Przykłady.

    Płeć osoby.Wadliwość produktu.

    WZ WUM Wnioskowanie 8

  • ( ) * + , - / / 0 1 2 3 - 4 ) 0 5

    Zmienna losowa X ma rozkład B(n, p), jeżeli

    Pn,p{X = k} =(

    n

    k

    )

    pk(1− p)n−k, k = 0, 1, . . . , n.

    EX = np D2X = np(1− p)

    Schemat BernoulliegoZmienną losową o rozkładzie D(p) obserwujemy nkrotnie w sposób niezależny. Niech zmienną losowąX będzie ilość sukcesów.

    Zmienna losowa X ma rozkład B(n, p).

    Przykłady.

    Ilość nasion, z których wzeszły rośliny.Ilość wadliwych produktów.„Popularność” danej osobistości publicznej.

    WZ WUM Wnioskowanie 9

    6 7 8 9 : ; < = 7 > ? ; @ = A

    Zmienna losowa X ma rozkład normalny N(µ, σ2)o wartości średniej µ i wariancji σ2, jeżeli jej funkcjagęstości wyraża się wzorem

    fµ,σ2(x) =1

    σ√2πe−

    1

    2 ( x−µσ )2

    , −∞ < x

  • B C D E G H I K C L M H N K O

    µ = 0

    µ = −1 µ = 1µ = 1

    σ = 0.5σ = 1.0σ = 2.0

    WZ WUM Wnioskowanie 11

    Q T U wo trzech sigm

    P{|X − µ| < σ} = 0.68268 ≈ 0.68

    P{|X − µ| < 2σ} = 0.95450 ≈ 0.95

    P{|X − µ| < 3σ} = 0.99730 ≈ 0.997

    µ..............................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...←−−−−−−−−−−−−− 0.997 −−−−−−−−−−−−−→

    µ− 3σ µ+ 3σ................................................................................................................................................................................................................................

    ..................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...................

    ..................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .←−−−−−−−− 0.95 −−−−−−−−→

    µ− 2σ µ+ 2σ............................................................................................................................................................

    ..................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....................

    ..................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....←−− 0.68 −−→

    µ− σ µ+ σ.......................................................................................

    ..................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ......................

    ..................

    WZ WUM Wnioskowanie 12

  • V W X Y Z [ \ ] [ ^ [ _ [ Z ` X _ a b

    rozkładu cechy

    Estymujemy parametr θ rozkładu cechy XPróba: X1, X2, . . . , Xn

    Estymator (punktowy) jest funkcją próby

    θ̂ = θ̂(X1, X2, . . . , Xn)

    przybliżającą wartość parametru θ

    Przedział ufności (estymator przedziałowy)jest przedziałem o końcach zależnych od próby, któryz pewnym z góry zadanym prawdopodobieństwempokrywa nieznaną wartość parametru θ

    P{θ ∈ (θ(X1, . . . , Xn), θ(X1, . . . , Xn))} = 1− α

    Poziom ufności: prawdopodobieństwo 1− α

    Co wpływa na długość d przedziału ufności?1. Liczność próby (nր=⇒ dց)2. Poziom ufności (1− αր=⇒ dր)3. Wariancja cechy (σ2 ց=⇒ dց)

    WZ WUM Wnioskowanie 13

    c d e f g h i j d k l h m j n

    Estymacja parametrówPróba (prosta): X1, X2, . . . , Xn

    Estymator średniej µ — średnia arytmetyczna

    X̄ =1n

    n∑

    i=1

    Xi =X1 + · · ·+Xn

    n

    Estymator wariancji σ2 — wariancja próbkowa

    S2 =1n− 1

    n∑

    i=1

    (Xi − X̄)2

    Suma kwadratów odchyleń od średniej

    varX =n∑

    i=1

    (Xi − X̄)2 =n∑

    i=1

    X2i − nX̄2

    Estymator odchylenia standardowego σ

    S =√S2

    WZ WUM Wnioskowanie 14

  • o p q r dział ufności dla średniej

    Wariancja σ2 jest nieznana

    Poziom ufności: 1− α

    (

    X̄ − t(α;n− 1) S√n, X̄ + t(α;n− 1) S√

    n

    )

    t(α;n− 1): wartość krytyczna rozkładu t (Studenta)z ν stopniami swobody

    Długość przedziału: d = 2t(α;n− 1) S√n

    Przedziały jednostronne

    (−∞, X̄ + t(2α;n− 1) S√n)

    (X̄ − t(2α;n− 1) S√n, ∞)

    WZ WUM Wnioskowanie 15

    s t u v kład.

    Na podstawie próby 1.1, 1.2, 0.8, 0.9, 1.2, 1.3, 1.0,0.7, 0.8, 1.0 oszacować wartość średnią rozkładu ob-serwowanej cechy.

    x̄ =1.1 + 1.2 + · · ·+ 1.0

    10= 1.0

    varX = (1.1− 1.0)2 + · · ·+ (1.0− 1.0)2 = 0.36

    s2 =0.3610− 1 = 0.04, s =

    √s2 = 0.2

    Poziom ufności 1− α = 0.95, czyli α = 0.05.

    t(0.05; 9) = 2.2622

    t(0.05; 9)s√n= 2.2622

    0.2√10= 0.14

    (1− 0.14, 1 + 0.14) = (0.86, 1.14)

    Wniosek. Średnia wartość cechy jest jakąś liczbąz przedziału (0.86, 1.14). Zaufanie do tego wnioskuwynosi 95%.

    WZ WUM Wnioskowanie 16

  • w x y z kład.Oszacować przeciętną ilość punktów uzyskiwanychna klasówce.

    n = 300∑

    xi = 176.566∑

    x2i = 107.845302

    Populacja:Słuchacze podstawowego kursu statystyki

    Cecha X:ilość punktów zdobytych na klasówce

    Założenie:cecha X ma rozkład normalny N(µ, σ2)

    Zadanie: oszacować parametr µ

    Technika statystyczna:przedział ufności dla średniejpoziom ufności 1− α = 0.95

    WZ WUM Wnioskowanie 17

    { | } ~ ~

    x̄ =1n

    xi =176.566300

    = 0.589

    varX =∑

    x2i −1n

    (

    xi

    )2

    = 107.845302− 176.5662

    300= 3.92679

    s2 =3.92679300− 1 = 0.01313, s =

    √s2 = 0.11460

    t(0.05; 299) ≈ 1.96

    t(0.05; 299)s√n= 1.96

    0.11460√300

    = 0.01297

    (0.589− 0.013, 0.589 + 0.013) = (0.576, 0.602)

    Odpowiedź: µ ∈ (0.576, 0.602)

    Wniosek. Przeciętna liczba punktów zdobywana naklasówce jest liczbą z przedziału (0.576, 0.602). Za-ufanie do tego wniosku wynosi 95%.

    WZ WUM Wnioskowanie 18

  • dział ufności dla wariancji

    Średnia µ jest nieznana

    Poziom ufności: 1− α

    (

    varXχ2(

    α2 ;n− 1

    ) ,varX

    χ2(

    1− α2 ;n− 1)

    )

    χ2 (α;n− 1) jest stablicowaną wartością krytycznąrozkładu chi–kwadrat z ν stopniami swobody.

    Przedziały jednostronne

    (

    0,varX

    χ2 (α;n− 1)

    )

    (

    varXχ2 (1− α;n− 1) , ∞

    )

    WZ WUM Wnioskowanie 19

    kład.

    Na podstawie próby 1.1, 1.2, 0.8, 0.9, 1.2, 1.3, 1.0,0.7, 0.8, 1.0 oszacować zróżnicowanie rozkładu ob-serwowanej cechy.

    x̄ =1.1 + 1.2 + · · ·+ 1.0

    10= 1.0

    varX = (1.1− 1.0)2 + · · ·+ (1.0− 1.0)2 = 0.36

    s2 =0.3610− 1 = 0.04, s =

    √s2 = 0.2

    Poziom ufności 1− α = 0.95, czyli α = 0.05.

    χ2(α

    2;n− 1

    )

    = χ2 (0.025; 9) = 19.0228

    χ2(

    1− α2;n− 1

    )

    = χ2 (0.975; 9) = 2.7004(

    0.3619.0228

    ,0.362.7004

    )

    = (0.019, 0.133)

    Wniosek. Wariancja cechy jest jakąś liczbą z prze-działu (0.019, 0.133). Zaufanie do tego wniosku wy-nosi 95%.

    WZ WUM Wnioskowanie 20

  • dział ufności dlaodchylenia standardowego

    Średnia µ jest nieznana

    Poziom ufności: 1− α(√

    varXχ2(α2 ;n− 1)

    ,

    varXχ2(1− α2 ;n− 1)

    )

    Przedziały jednostronne

    (0,

    √varX

    χ2 (α;n− 1)

    )

    (√varX

    χ2 (1− α;n− 1) ,∞)

    . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Przykład (cd).

    Przedział ufności dla odchylenia standardowego:

    (√0.019,

    √0.133) = (0.136, 0.365)

    WZ WUM Wnioskowanie 21

    kład.Oszacować zróżnicowanie ilości punktów uzyskiwa-nych na klasówce.

    n = 300∑xi = 176.566

    ∑x2i = 107.845302

    Populacja:Słuchacze podstawowego kursu statystyki

    Cecha X:ilość punktów zdobytych na klasówce

    Założenie:cecha X ma rozkład normalny N(µ, σ2)

    Zadanie: oszacować parametr σ

    Technika statystyczna:przedział ufności dla odchylenia standardowegopoziom ufności 0.95

    WZ WUM Wnioskowanie 22

  • x̄ = 0.589 varX = 3.92679

    χ2(α2;n− 1

    )= χ2 (0.025; 299) = 348.79420

    χ2(1− α2;n− 1

    )= χ2 (0.975; 299) = 252.99251

    (√3.92679348.79420

    ,

    √3.92679252.99251

    )= (0.10610, 0.12458)

    Odpowiedź: σ ∈ (0.10610, 0.12458)

    Wniosek. Odchylenie standardowe liczby punktówzdobywanych na klasówce jest liczbą z przedziału(0.106, 0.125). Zaufanie do tego wniosku wynosi 95%.

    WZ WUM Wnioskowanie 23

      ¡ ¢ £ £ ¤ ¥ ¦ ¥ §   ¨ ¤ ©

    Estymacja parametru

    p — frakcja, wskaźnik struktury

    Próba: X1, . . . , Xn (Xi = 0 lub = 1)

    k =∑ni=1Xi — ilość jedynek (sukcesów)

    Estymator punktowy:

    p̂ =k

    n

    Przedział ufności na poziomie ufności 1− α(p1

    (1− α2; k, n− k

    ), 1− p1

    (1− α2;n− k, k

    ))

    Jednostronne przedziały ufności

    (p1 (1− α; k, n− k) , 1)

    (0, 1− p1 (1− α;n− k, k))

    WZ WUM Wnioskowanie 24

  • ª « ¬ kład.Wśród 20 zbadanych detali znaleziono dwa braki.Ocenić na tej podstawie wadliwość produkcji.

    Cecha X — jakość detalu (dobry, zły).Sukces — detal wybrakowanyPytanie: p =?

    n = 20, k = 2 =⇒ p̂ = 2/20 = 0.1

    Poziom ufności 1− α = 0.9, czyli α = 0.1

    p1

    (1− α2; k, n− k

    )= p1(0.95; 2, 18) = 0.0123

    p1

    (1− α2;n− k, k

    )= p1(0.95; 18, 2) = 0.6830

    (0.0123, 1− 0.6830) = (0.0123, 0.3170)

    Wniosek. Wadliwość produkcji wyraża się liczbąz przedziału (1.23%, 31.70%). Zaufanie do wnioskuwynosi 90%.

    WZ WUM Wnioskowanie 25

    ® ¯ ° ± bliżony przedział ufności

    (p̂− u1−α/2

    √p̂(1− p̂)n, p̂+ u1−α/2

    √p̂(1− p̂)n

    )

    uα jest kwantylem rzędu α rozkładu N(0, 1).. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Przykład. (cd)

    n = 200, k = 20 =⇒ p̂ = 20/200 = 0.1

    Poziom ufności 1− α = 0.9, czyli α = 0.1

    u1−α/2 = u0.95 = 1.6449

    0.1− 1.6449√0.1(1− 0.1)200

    = 0.0651

    0.1 + 1.6449

    √0.1(1− 0.1)200

    = 0.1349

    Wniosek. Wadliwość produkcji wyraża się liczbąz przedziału (6.51%, 13.49%). Zaufanie do wnioskuwynosi 90%.

    WZ WUM Wnioskowanie 26

  • ² ³ ´ µ kład.Oszacować odsetek ocen dostatecznych otrzymywa-nych na klasówce.

    n = 300 k = 88

    Populacja:Słuchacze podstawowego kursu statystyki

    Cecha X:ocena dostateczna z klasówki

    Założenie:cecha X ma rozkład D(p)

    Zadanie: oszacować parametr p

    Technika statystyczna:przybliżony przedział ufności dla prawdopodobień-stwapoziom ufności 0.95

    WZ WUM Wnioskowanie 27

    ¶ · ¸ ¹ º » ¼ ½ ¹ ¾

    p̂ =88300= 0.29

    u1−α/2 = u0.975 = 1.96

    0.29− 1.96√0.29(1− 0.29)

    300= 0.2387

    0.29 + 1.96

    √0.29(1− 0.29)

    300= 0.3413

    Odpowiedź: p ∈ (0.2387, 0.3413)

    Wniosek.Odsetek ocen dostatecznych zdobywanych na kla-sówce jest liczbą z przedziału (23.87%, 34.13%). Za-ufanie do tego wniosku wynosi 95%.

    WZ WUM Wnioskowanie 28

  • ¿ À Á Â Ã Ä Å Ä Æ Ç È Ã Â É Ê

    rozkładów normalnych

    Założenia:1. X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ22)2. X1, X2 są niezależne

    Ocena µ1 − µ2 oraz σ21/σ22 .

    Próby: X11, . . . , X1n1 ; X21, . . . , X2n2

    X̄1, varX1, s21 =varX1n1 − 1

    X̄2, varX2, s22 =varX2n2 − 1

    WZ WUM Wnioskowanie 29

    Ë Ì Í Î Ï Ð Ñ Ò Î Ó Ì Ô Õ Ó Ö × Ø Ô Ù Ð Í × Î Ó Õ Ó µ1 − µ2

    Ocena punktowa: X̄1 − X̄2

    Przedział ufności (poziom ufności 1− α)

    1. Założenie σ21 = σ22

    (X̄1 − X̄2−t(α;n1 + n2 − 2)sr,X̄1 − X̄2 + t(α;n1 + n2 − 2)sr)

    s2e =varX1 + varX2n1 + n2 − 2

    , s2r = s2e

    (1n1+1n2

    )

    2. Bez założenia σ21 = σ22

    (X̄1 − X̄2−V (α;n1 − 1, n2 − 1, c)sr,X̄1 − X̄2 + V (α;n1 − 1, n2 − 1, c)sr)

    s2r =(s21n1+s22n2

    )c =

    s21/n1s21/n1 + s

    22/n2

    V (α;n1 − 1, n2 − 1, c) — wartość krytyczna testuBehrensa–Fishera

    WZ WUM Wnioskowanie 30

  • Ú Û Ü Ý kład. Ocenić różnicę między średnimi wyni-kami klasówki pań i panów.Panowie:n1 = 138,

    ∑x1i = 82.833, varx1 = 1.65841

    Panie:n2 = 162,

    ∑x2i = 93.733, varx2 = 2.23348

    Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

    Cecha X: ilość punktów zdobytych na klasówce

    Założenie:cecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)σ21 = σ

    22

    Zadanie: oszacować różnicę µ1 − µ2Technika statystyczna:przedział ufności t dla różnicy średnichpoziom ufności 0.95

    WZ WUM Wnioskowanie 31

    Þ ß à á â ã ä å á æ

    x̄1 = 0.60024, x̄2 = 0.57860,

    s2r =1.65841 + 2.23348138 + 162− 2

    (1138+1162

    )

    = 0.000175255

    t(0.05; 298) ≈ 1.96; t(0.05; 298)sr = 0.02595(0.60024−0.57860±0.00034) = (−0.00431, 0.04759)

    Odpowiedź: µ1 − µ2 ∈ (−0.00431, 0.04759)

    Wniosek.Różnica średnich ilości punktów zdobywanych naklasówce przez panie i panów jest liczbą z przedziału(−0.00431, 0.04759). Zaufanie do tego wniosku wy-nosi 95%.

    Sugestia. Ponieważ przedział „obejmuje” zero, więcmożna uznać, że µ1 = µ2.

    WZ WUM Wnioskowanie 32

  • ç è é ê ë ì í î ï ë ð ñ ò ë ï ì ë ê è ó ì σ21/σ22

    Ocena punktowa: S21/S22

    Przedział ufności (poziom ufności 1− α)

    (S21S22·F(1− α2;n1 − 1, n2 − 1

    ),

    S21S22· F(α2;n1 − 1, n2 − 1

    ))

    F (α;u, v) jest stablicowaną wartością krytyczną roz-kładu F–Snedecora (Fishera–Snedecora)

    F (1− α;u, v) = 1F (α; v, u)

    WZ WUM Wnioskowanie 33

    ô õ ö ÷ kład. Porównać zróżnicowanie ocen wynikówklasówek pań i panów.Panowie:n1 = 138,

    ∑x1i = 82.833, varx1 = 1.65841

    Panie:n2 = 162,

    ∑x2i = 93.733, varx2 = 2.23348

    Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

    Cecha X: ilość punktów zdobytych na klasówce

    Założenie:cecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)

    Zadanie: oszacować iloraz σ21/σ22

    Technika statystyczna:przedział ufności dla ilorazu wariancjipoziom ufności 0.90

    WZ WUM Wnioskowanie 34

  • ø ù ú û ü ý þ ÿ û O

    s21 =1.65841138− 1 = 0.01211, s

    22 =2.23348162− 1 = 0.01387,

    F (0.05; 137, 161) = 1.30936

    F (0.95; 137, 161) =1

    F (0.05; 161, 137)

    =1

    1.31386= 0.76111

    (0.012110.01387

    · 0.76111, 0.012110.0138

    · 1.30936)

    = (0.66415, 1.14255)

    Odpowiedź: σ21/σ22 ∈ (0.66415, 1.14255)

    Wniosek.Iloraz wariancji ilości punktów zdobywanych naklasówce jest liczbą z przedziału (0.66415, 1.14255).Zaufanie do tego wniosku wynosi 90%.

    Sugestia. Ponieważ przedział „obejmuje” jedynkę,więc można uznać, że σ21 = σ

    22 .

    WZ WUM Wnioskowanie 35

    P � � � � � � � � � � � �

    rozkładów dwupunktowych

    Założenia:1. X1 ∼ D(p1), X2 ∼ D(p2)2. X1, X2 są niezależne

    Ocena p1 − p2.

    Próby: X11, . . . , X1n1 ; X21, . . . , X2n2 (Xij = 0 lub 1)

    k1 =n1∑

    i=1

    X1i k2 =n2∑

    i=1

    X12

    p̂1 = k1/n1 p̂2 = k2/n2 p̂ = (k1 + k2)/(n1 + n2)

    Przedział ufności (poziom ufności 1− α)

    p̂1 − p̂2 − u1−α2

    p̂(1− p̂)(1n1+1n2

    ),

    p̂1 − p̂2 + u1−α2

    p̂(1− p̂)(1n1+1n2

    )

    WZ WUM Wnioskowanie 36

  • � � � kład.Oszacować różnicę między „niezaliczalnością” kla-sówki ze statystyki przez panie i panów. Na pod-stawie dotychczasowych danych wiadomo, że na 162pań nie zaliczyło klasówki 46 pań oraz na 138 panów30 uzyskało ocenę negatywną.

    Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

    Cecha X: uzyskanie z klasówki oceny negatywnej

    Założenie:cecha X ma w populacji 1 rozkład D(p1)cecha X ma w populacji 2 rozkład D(p2)

    Zadanie: oszacować różnicę p1 − p2

    Technika statystyczna:przybliżony przedział ufności dla różnicy prawdopo-dobieństwpoziom ufności 0.95: u0.975 = 1.96

    WZ WUM Wnioskowanie 37

    � � � � � � � � � �

    n1 = 162 k1 = 46 n2 = 138 k2 = 30

    p̂1 =k1n1=46162= 0.2840 p̂2 =

    k2n2=30138= 0.2174

    p̂ =(k1 + k2)(n1 + n2)

    =(46 + 30)(162 + 138)

    = 0.2533

    1.96 ·√0.2533(1− 0.2533)

    300

    (1162+1138

    )= 0.0987

    (0.2840− 0.2174− 0.0987, 0.2840− 0.2174 + 0.0987)

    (−0.0321, 0.1653)

    Wniosek. Różnica prawdopodobieństw jest liczbąz przedziału (−0.0321, 0.1653).

    Sugestia. Ponieważ przedział „obejmuje” zero, więcodsetki pań i panów niezaliczających klasówki możnatraktować jako porównywalne.

    WZ WUM Wnioskowanie 38

  • W � � � � � � � � �

    hipotez statystycznych

    Hipotezą statystyczną nazywamy dowolne przy-puszczenie dotyczące rozkładu prawdopodobieństwacechy w populacji.Oznaczenie H0

    Testem hipotezy statystycznej nazywamy postępo-wanie mające na celu odrzucenie lub nie odrzuceniehipotezy statystycznej.

    Statystyką testową nazywamy funkcję próby napodstawie której wnioskuje się o odrzuceniu lub niehipotezy statystycznej.

    Rzeczywistość: Wniosek o hipotezie H0hipoteza H0 nie odrzucać odrzucićprawdziwa prawidłowy nieprawidłowynieprawdziwa nieprawidłowy prawidłowy

    WZ WUM Wnioskowanie 39

    B ! " # $ % & ' " ( ) * + nazywamy błąd wnioskowaniapolegający na odrzuceniu hipotezy, gdy w rzeczywi-stości jest ona prawdziwa.

    Błędem II rodzaju nazywamy błąd wnioskowaniapolegający na nieodrzuceniu hipotezy, gdy w rzeczy-wistości jest ona fałszywa.

    Poziomem istotności nazywamy dowolną liczbęz przedziału (0, 1) określającą prawdopodobieństwopopełnienia błędu I rodzaju.Oznaczenie: α

    Mocą testu nazywamy prawdopodobieństwo od-rzucenia testowanej hipotezy, gdy jest ona niepraw-dziwa, czyli prawdopodobieństwo nie popełnieniabłędu II rodzaju.Oznaczenie: 1− β

    WZ WUM Wnioskowanie 40

  • R , - . / 0 1 2 , 3 4 0 5 2 6

    Porównanie z normą

    H0 : µ = µ0

    Cecha X ma rozkład normalny N(µ, σ2)Średnia µ oraz wariancja σ2 są nieznane

    Test Studenta (poziom istotności α)

    Próba: X1, . . . , XnStatystyka testowa

    temp =X̄ − µ0S

    √n .

    Wartość krytyczna t(α;n− 1)

    Jeżeli |temp| > t(α;n − 1), to hipotezę H0 : µ = µ0odrzucamy.

    WZ WUM Wnioskowanie 41

    7 8 9 : kład. Przypuszczenie: maszyna pakująca kost-ki masła nastawiona na jednostkową masę 250 g ule-gła po pewnym czasie rozregulowaniu. W celu wery-fikacji tego przypuszczenia z bieżącej produkcji po-brano próbę otrzymując wyniki 254, 269, 254, 248,263, 256, 258, 261, 264, 258. Czy można na tej pod-stawie sądzić, że maszyna uległa rozregulowaniu?

    Populacja:paczkowane kostki masła

    Cecha X:masa kostki masła

    Założenie:cecha X ma rozkład normalny N(µ, σ2)

    Formalizacja:Rozregulowanie maszyny może być interpretowanejako odejście od nominalnej wagi. Zatem należy zba-dać, czy średnia µ wynosi 250, czyli weryfikujemyhipotezę H0 : µ = 250

    WZ WUM Wnioskowanie 42

  • T ; < = > ? @ A C D A D E C D E < F > A G

    test Studenta (test t)poziom istotności α = 0.05

    Obliczenia

    x̄ = 258.5, s2 = 36.05, temp = 4.47

    Wartość krytyczna: t(0.05; 9) = 2.2622

    Odpowiedź: hipotezę odrzucamy

    Wniosek: maszyna uległa rozregulowaniu

    WZ WUM Wnioskowanie 43

    M H I J K L J N

    Moc testu = 1− P{błąd II rodzaju}Moc testu = P{odrzucenie nieprawdziwej H0}

    Moc testu Studenta hipotezy H0 : µ = µ0

    M(µ) = P{|temp| > t(α;n− 1)|X ∼ N(µ, σ2)}

    M(µ0) = α

    n = 10n = 20n = 30

    WZ WUM Wnioskowanie 44

  • Q S U V dział ufności a test hipotezy H0 : µ = µ0

    Cecha X ∼ N(µ, σ2)

    H0 : µ = µ0

    H0 nie odrzucamy na poziomie istotności α

    m|temp| < t(α;n− 1)

    m

    −t(α;n− 1) < X̄ − µ0S

    √n < t(α;n− 1)

    m

    µ0 ∈(X̄ − t(α;n− 1) S√

    n, X̄ + t(α;n− 1) S√

    n

    )

    mµ0 należy do przedziału ufności

    na poziomie ufności 1− α

    WZ WUM Wnioskowanie 45

    X 0 : σ2 = σ20

    Cecha X ma rozkład normalny N(µ, σ2)Średnia µ oraz wariancja σ2 są nieznane

    Test chi–kwadrat (poziom istotności α)

    Próba: X1, . . . , XnStatystyka testowa

    χ2emp =varXσ20

    Wartości krytyczneχ2

    (

    1− α2 ;n− 1)

    oraz χ2(

    α2 ;n− 1

    )

    Jeżeli

    χ2emp < χ2(

    1− α2 ;n− 1)

    lub

    χ2emp > χ2(

    α2 ;n− 1

    )

    ,

    to hipotezę H0 : σ2 = σ20 odrzucamy.

    WZ WUM Wnioskowanie 46

  • Y Z [ \ kład. Na podstawie obserwacji prowadzonychprzez długi okres czasu stwierdzono, że dzienny udójuzyskiwany w pewnym stadzie krów jest wielkościąlosową, zaś przeciętny dzienny udój mleka wyrażasie liczbą z przedziału (900, 1200). Rachunek finan-sowy pokazał, że produkcja mleka jest opłacalna, je-żeli całkowity dzienny udój będzie wynosił nie mniejniż d = 700 lmleka przez co najmniej 280 dni w roku.W jaki sposób można zbadać, czy produkcja mlekajest opłacalna?

    Populacja:

    Cecha:całkowity dzienny udój

    Założenia:Cecha X ma rozkład N(µ, σ2)µd = 900 ≤ µ ≤ µg = 1200

    WZ WUM Wnioskowanie 47

    ] ^ _ ` a b c d a e f a g _ ^ h b i ` j

    P{X ≥ d} ≥ p = 280350

    P{X ≥ d} = 1− F(d− µσ

    )≥ 1− F

    (d− µdσ

    )

    1− F(d− µdσ

    )≥ 1− p⇒ F

    (d− µdσ

    )≤ 1− p

    d− µdσ

    ≤ F−1(1− p) = u1−p

    d, µd oraz p są ustalone, więc

    σ2 ≥ σ20 =(d− µdu1−p

    )2= 56472

    Produkcja mleka jest opłacalna, jeżeli wariancja σ2

    dziennych udojów jest większa niż σ20 = 56472.

    H0 : σ2 ≤ 56472

    WZ WUM Wnioskowanie 48

  • k l m n o p q q r s t s u n v l r w

    Porównanie z normą

    H0 : p = p0

    Cecha X ma rozkład D(p)Próba: X1, . . . , Xn (Xi = 0 lub = 1)Test przybliżony (poziom istotności α)Przypadek: n „duże”

    Statystyka testowa

    uemp =Y − np0√np0(1− p0)

    Wartość krytyczna u1−α/2

    Jeżeli |uemp| > u1−α/2, to H0 : p = p0 odrzucamy

    WZ WUM Wnioskowanie 49

    x y z { kład. W swojej ofercie sprzedaży stawu ryb-nego jego właściciel podaje, iż w stawie żyje co naj-mniej tysiąc karpi. Potencjalny nabywca zaintereso-wany jest sprawdzeniem prawdziwości tego twierdze-nia. W tym celu wyłowiono sto karpi i po zaobrącz-kowaniu ich wpuszczono je z powrotem do stawu. Pojakimś czasie ponownie odłowiono sto ryb i stwier-dzono, że wśród nich jest piętnaście zaobrączkowa-nych. Czy w świetle uzyskanych wyników można re-klamę uznać za prawdziwą?

    Populacja:ryby w stawie

    Cecha:zaobrączkowanie ryby

    Założenia:Cecha X ma rozkład D(p)

    WZ WUM Wnioskowanie 50

  • | } ~ ~ }

    Jeżeli w stawie żyje co najmniej N ryb, to odsetekzaobrączkowanych jest co najwyżej 100/N . Zgodniez twierdzeniem właściciela, N ≥ 1000, czyli odsetekryb zaobrączkowanych nie przekracza 0.1.

    Technika statystycznaPrzybliżony test hipotezy H0 : p ≤ 0.1Poziom istotności: α = 0.05

    Obliczenia

    Y = 15 n = 100

    uemp =Y − np0√np0(1− p0)

    =15− 10√100 · 0.1 · 0.9

    = 1.6667

    Wartość krytyczna: u1−0.05 = 1.6449

    Odpowiedź: hipotezę odrzucamy

    Wniosek: należy uznać, że ogólna liczb ryb w stawiejest mniejsza niż podana w ofercie

    WZ WUM Wnioskowanie 51

    rozkładów normalnych

    Założenia:1. X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ22)2. X1, X2 są niezależne

    Czy µ1 = µ2?

    Czy σ21 = σ22?

    Próby: X11, . . . , X1n1 ; X21, . . . , X2n2

    X̄1, varX1, s21 =varX1n1 − 1

    X̄2, varX2, s22 =varX2n2 − 1

    WZ WUM Wnioskowanie 52

  • 0 : µ1 = µ2

    Założenie σ21 = σ22

    Test Studenta (poziom istotności α)

    Statystyka testowa

    temp =X̄1 − X̄2Sr

    Sr =

    S2e

    (1n1+1n2

    ), S2e =

    varX1 + varX2n1 + n2 − 2

    Wartość krytyczna t(α;n1 + n2 − 2)

    Jeżeli |temp| > t(α;n1 + n2 − 2),to hipotezę H0 : µ1 = µ2 odrzucamy

    WZ WUM Wnioskowanie 53

    kład. Porównać przeciętne osiągnięcia punk-towe pań i panów na klasówce ze statystykiPanowie:n1 = 138,

    ∑x1i = 82.833, varx1 = 1.65841

    Panie:n2 = 162,

    ∑x2i = 93.733, varx2 = 2.23348

    Populacja 1:Słuchacze podstawowego kursu statystykiPopulacja 2:Słuchaczki podstawowego kursu statystyki

    Cecha X: ilość punktów zdobytych na klasówce

    Założenia:cecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)σ21 = σ

    22

    Zadanie: zweryfikować hipotezę H0 : µ1 = µ2

    Technika statystyczna:test tpoziom istotności 0.05

    WZ WUM Wnioskowanie 54

  •   ¡ ¢ £

    x̄1 = 0.60024 x̄2 = 0.57860

    s2r =1.65841 + 2.23348138 + 162− 2

    (1138+1162

    )

    = 0.000175255

    temp =0.60024− 0.57860√0.000175255

    = 1.634

    Wartość krytyczna t(0.05; 298) ≈ 1.96

    Odpowiedź: hipotezy nie odrzucamy

    Wniosek.Średnie ilości punktów uzyskiwane przez panie i pa-nów można traktować jako porównywalne.

    WZ WUM Wnioskowanie 55

    ¤ ¥ ¦ § dział ufności a test hipotezy H0 : µ1 = µ2

    Cecha X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ22), σ21 = σ22

    H0 : µ1 = µ2

    H0 nie odrzucamy na poziomie istotności α

    m|temp| < t(α;n1 + n2 − 2)

    m

    −t(α;n1 + n2 − 2) <X̄1 − X̄2Sr

    < t(α;n1 + n2 − 2)

    m0 ∈

    (

    X̄1 − X̄2 ± t(α;n1 + n2 − 2)Sr)

    m0 należy do przedziału ufności

    na poziomie ufności 1− α

    WZ WUM Wnioskowanie 56

  • ¨ 0 : σ21 = σ22

    Test F (poziom istotności α)

    Statystyka testowa

    Femp =S21S22

    Wartości krytyczneF(1− α2;n1 − 1, n2 − 1

    )

    F(α2;n1 − 1, n2 − 1

    )

    JeżeliFemp < F

    (1− α2;n1 − 1, n2 − 1

    )

    lubFemp > F

    (α2;n1 − 1, n2 − 1

    )

    to hipotezę H0 : σ21 = σ22 odrzucamy

    WZ WUM Wnioskowanie 57

    © ª « ¬ «

    F (1− α;u, v) = 1F (α; v, u)

    Reguła: większa wariancja do licznika.

    Jeżeli S21 > S22 , to wyznaczana jest statystyka

    Femp =S21S22

    i hipoteza jest odrzucana, gdy

    Femp > F(α2;n1 − 1, n2 − 1

    )

    Jeżeli zaś S21 < S22 , to wyznaczana jest statystyka

    Femp =S22S21

    i hipoteza jest odrzucana, gdy

    Femp > F(α2;n2 − 1, n1 − 1

    )

    WZ WUM Wnioskowanie 58

  • ® ¯ ° kład. Dla sprawdzenia stabilności pracy ma-szyny pobrano dwie próbki: pierwszą w początko-wym okresie eksploatacji oraz drugą po miesięcznymokresie pracy tej maszyny. Wykonano pomiary wylo-sowanych produktów i otrzymano wyniki: n1 = 25,x̄1 = 3.24, s21 = 0.1447 oraz n2 = 19, x̄2 = 3.19,s22 = 0.1521. Zbadać na tej podstawie czy maszynanie rozregulowała się w trakcie pracy.

    Populacja 1produkcja maszyny w początkowym okresie

    Populacja 2produkcja maszyny po miesiącu eksploatacji

    Cecha Xpomiar produktu

    Założeniacecha X ma w populacji 1 rozkład N(µ1, σ21)cecha X ma w populacji 2 rozkład N(µ2, σ22)

    WZ WUM Wnioskowanie 59

    ± ² ³ ´ µ ¶ · ¸ µ ¹ º µ

    Stabilność pracy maszyny może być mierzona podo-bieństwem wytwarzanych produktów: im własnościproduktów są do siebie bardziej zbliżone, tym bar-dziej stabilna jest praca maszyny. Podobieństwo ta-kie jest wyrażane wariancją cechy. Zatem stabilnośćpracy można wyrazić liczbowo jako wariancję inte-resującej cechy produktu, a problem stabilności jakozagadnienie weryfikacji hipotezy H0 : σ21 = σ

    22

    Technika statystycznaTest F (poziom istotności α = 0.10)

    Obliczenia

    Femp =s22s21= 1.051

    Wartość krytyczna F (0.05; 19, 24) = 2.114

    Odpowiedź: hipotezy nie odrzucamy

    Wniosek: można uznać że maszyna nie rozregulo-wała się w trakcie pracy

    WZ WUM Wnioskowanie 60

  • » ¼ ½ ¾ ¿ À Á À Â Ã Ä ¿ ¾ Å Æ

    rozkładów dwupunktowych

    Założenia:1. X1 ∼ D(p1), X2 ∼ D(p2)2. X1, X2 są niezależne

    H0 : p1 = p2

    Test przybliżony (poziom istotności α)

    p̂1 =k1n1, p̂2 =

    k2n2, p̂ =

    (k1 + k2)(n1 + n2)

    Statystyka testowa

    uemp =p̂1 − p̂2√

    p̂(1− p̂)( 1n1 +1n2)

    |uemp| ≥ u1−α/2 =⇒ H0 : p1 = p2 odrzucamy

    WZ WUM Wnioskowanie 61

    Ç È É Ê kład. Celem badania było porównanie przy-gotowania z matematyki kandydatów na studia bę-dących absolwentami liceów oraz techników. W tymcelu spośród kandydatów zdających matematykę wy-losowano 400 absolwentów liceów oraz 600 absol-wentów techników. W wylosowanej grupie stwier-dzono, że 385 absolwentów liceów oraz 501 absolwen-tów techników rozwiązało test wstępny. Czy możnana tej podstawie sądzić, że przygotowanie w obu gru-pach absolwentów jest jednakowe?

    Populacja 1:absolwenci liceów zdający egzamin wstępnyPopulacja 2:absolwenci techników zdający egzamin wstępny

    Cecha X: umiejętność rozwiązania testu (tak/nie)

    Założenia:cecha X ma w populacji 1 rozkład D(p1)cecha X ma w populacji 2 rozkład D(p2)

    FormalizacjaWeryfikacja hipotezy H0 : p1 = p2

    WZ WUM Wnioskowanie 62

  • Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Ò Ô Õ Ó Ô Õ Í Ö Ï Ò

    Test przybliżony (poziom istotności α = 0.05)

    Obliczenia

    n1 = 400 k1 = 385 p̂1 = 385/400 = 0.9625

    n2 = 600 k2 = 501 p̂2 = 501/600 = 0.8350

    p̂ = (385 + 501)/(400 + 600) = 0.886

    uemp =0.9625− 0.8350√

    0.886(1− 0.886)(

    1400 +

    1600

    )

    = 6.215.

    Wartość krytyczna u0.975 = 1.96

    Odpowiedź: hipotezę H0 : p1 = p2 odrzucamy

    Wniosek:przygotowanie absolwentów liceów i techników z ma-tematyki nie jest takie same.

    WZ WUM Wnioskowanie 63

    × Ø Ù Ú Û Ü Ý Ü Þ ß Û Þ ß à á

    rozkładów normalnych

    Założenia:1. Xi ∼ N(µi, σ2i ), i = 1, . . . , k2. X1, . . . , Xk są niezależne

    Czy µ1 = · · · = µk?

    Czy σ21 = · · · = σ2k?

    Próby: Xi1, . . . , Xini , i = 1, . . . , k

    X̄i, varXi, s2i =varXini − 1

    ; i = 1, . . . , k

    WZ WUM Wnioskowanie 64

  • â 0 : µ1 = · · · = µk

    Założenie σ21 = · · · = σ2kTest F (poziom istotności α)

    Statystyka testowa

    Femp =S2aS2e

    S2a =1k − 1

    k∑

    i=1

    ni(X̄i − X̄)2

    S2e =1N − k

    k∑

    i=1

    ni∑

    j=1

    (Xij − X̄i)2

    X̄i =1ni

    ni∑

    j=1

    Xij , X̄ =1N

    k∑

    i=1

    ni∑

    j=1

    Xij

    N =k∑

    i=1

    ni

    WZ WUM Wnioskowanie 65

    ã ä å ä æ ç Femp > F (α; k − 1, N − k),to hipotezę H0 : µ1 = · · · = µk odrzucamy.

    Wniosek praktyczny:przynajmniej jedna ze średnich µ1, . . . , µk jest innaod pozostałych

    Model analizy wariancji

    Xij = µi + εij

    Błąd losowy εij ∼ N(0, σ2)

    PrzykładyPlenność kilku odmian pewnej rośliny uprawnejWydajność pracowników kilku zakładów pracyZarobki kilku grup społecznych

    Czynnik: odmiana, zakład, grupaPoziomy czynnika: badane odmiany, badane za-kłady, badane grupy

    WZ WUM Wnioskowanie 66

  • è é ê ë ì í î í ì ï ð ñ ò í ó ï í î ô õ ï

    Xij = µ+ ai + εij

    ai — efekt i–tego poziomu czynnika:∑ki=1 ai = 0

    H0 : a1 = · · · = ak = 0, H0 :k∑

    i=1

    a2i = 0

    Tabela analizy wariancji

    Źródło Stopnie Sumy Średnie Femp

    zmienności swobody kwadratów kwadraty

    Czynnik k − 1 varA S2a = varAk−1 S2a/S2eBłąd losowy N − k varE S2e = varEN−kOgółem N − 1 varT

    varA =k∑

    i=1

    ni(X̄i− X̄)2, varE =k∑

    i=1

    ni∑

    j=1

    (Xij − X̄i)2,

    varT =k∑

    i=1

    ni∑

    j=1

    (Xij − X̄)2,

    varA+ varE = varT

    WZ WUM Wnioskowanie 67

    ö ÷ ø ù ú û ü ý þ ÿ ÷ ÿ ý þ ü — podzbiory średnich, któremożna uznać za takie same

    Procedury porównań wielokrotnych — postę-powanie statystyczne zmierzające do podzieleniazbioru średnich na grupy jednorodne

    Procedury: Tukeya, Scheffégo, Bonfferroniego, Dun-cana, Newmana–Kuelsa i inne.

    Ogólna idea procedur porównań wielokrotnych(n1 = · · · = nk)

    NIR — najmniejsza istotna różnica

    Jeżeli |X̄i − X̄j | < NIR, to uznajemy, że µi = µj .

    Jeżeli|X̄i − X̄j | < NIR|X̄i − X̄l| < NIR|X̄l − X̄j | < NIR,to uznajemy, że µi = µj = µl.

    Badając w ten sposób wszystkie pary średnich prób-kowych otrzymujemy podział zbioru średnich na gru-py jednorodne.

    WZ WUM Wnioskowanie 68

  • P � � cedura Tukeya

    Założenie: n1 = · · · = nk = n

    NIR = t(α; k,N − k)Se√1n

    t(α; k,N − k) — wartość krytyczna studentyzowa-nego rozstępu

    Przypadek nierównolicznych próbJedna z modyfikacji procedury Tukeya

    NIRij = t(α; k,N − k)Se

    √12

    (1ni+1nj

    )

    WZ WUM Wnioskowanie 69

    � � � � kład. Przeprowadzić analizę porównawczą wy-ników punktowych klasówki w grupach studenckich.

    PopulacjeMożemy wyodrębnić dziesięć populacji indeksowa-nych numerami grup studenckich

    Cecha XIlość punktów uzyskanych na klasówce

    Założeniacecha X ma w i–tej populacji rozkład N(µi, σ2i )(i = 1, . . . , 10)σ21 = · · · = σ210

    Formalizacjaweryfikacja hipotezy H0 : µ1 = · · · = µ10

    Techniki statystyczna• Jednoczynnikowa analiza wariancji• Porównania szczegółowePoziom istotności 0.05

    WZ WUM Wnioskowanie 70

  • O � � � � � �

    i ni∑xi

    ∑x2i

    1 30 18.230 11.3759502 30 16.672 9.5967903 30 14.292 7.0874584 30 18.879 12.0696555 30 18.200 11.3559826 30 19.568 13.1728847 30 16.522 9.4209608 30 19.134 12.5148749 30 18.548 11.94596410 30 16.521 9.304785

    300 176.566 107.845302

    i ni x̄i ni(x̄i−x̄)2 varxi1 30 0.607667 0.010960 0.2981872 30 0.555733 0.032315 0.3316043 30 0.476400 0.377351 0.2787494 30 0.629300 0.049809 0.1891005 30 0.606667 0.009843 0.3146496 30 0.652267 0.121782 0.4093307 30 0.550733 0.042911 0.3217448 30 0.637800 0.072757 0.3112099 30 0.618267 0.026486 0.47835410 30 0.550700 0.042986 0.206670

    N=300 x̄=0.588553 varA=0.787199 varE=3.139595

    varT = 107.845302− 176.5662/300 = 3.926794

    WZ WUM Wnioskowanie 71

    T � � � � � � � � � � � � � � � � � � � � �

    Źródło Stopnie Sumy Średnie Femp

    zmienności swobody kwadratów kwadraty

    Grupa 9 0.787199 0.087467 8.079

    Błąd losowy 290 3.139595 0.010826

    Ogółem 299 3.926794

    Wartość krytyczna

    F (0.05; 9, 290) = 1.912

    Odpowiedź:hipotezę H0 : µ1 = · · · = µ10 odrzucamy

    Wniosek:przynajmniej jedna grupa uzyskała inną średnią licz-bę punktów niż pozostałe

    WZ WUM Wnioskowanie 72

  • W � � � � � � � � � ! " # $ % � & � ' " ' & � � � (

    Procedura Tukeya (α = 0.05)

    Wartość krytyczna: t(0.05; 10, 290) = 4.474

    NIR = 4.474 ·√0.010826 ·

    √130= 0.084990

    i x̄i3 0.476400 ∗10 0.550700 ∗ ∗7 0.550733 ∗ ∗2 0.555733 ∗ ∗ ∗5 0.606667 ∗ ∗ ∗1 0.607667 ∗ ∗ ∗9 0.618267 ∗ ∗ ∗4 0.629300 ∗ ∗ ∗8 0.637800 ∗ ∗6 0.652267 ∗

    WZ WUM Wnioskowanie 731 ) * + , - . / 0 1 2

    ••

    • ••

    •• •

    •............................................................................................................................................................................................................................................................................................................................................................................................................................···

    ·

    ·

    ·

    ··

    ·

    ···

    ·

    ···········

    ·

    ··

    ·

    ··

    ··

    ·

    ··

    ·

    ·······

    ·

    ·

    ·

    ···

    ····

    ·

    ·

    ·

    ·

    ··

    ··

    ·

    ··

    ···

    ··

    ·····

    ·······

    ·

    ··

    ·

    ···

    ··

    ·

    ···

    ·····

    ······

    ··

    ·······

    ··

    ··

    ·

    · ·

    ··

    ·

    ·····

    ···

    ··

    ···

    ····

    ·

    ··

    ·

    ····

    ·

    ·

    ·

    ········

    ·

    ··

    ··

    ·

    ·

    ·

    ·····

    ··

    ··

    ···

    ·

    ·

    ·

    ··

    ··

    ·

    ··

    ···

    ·

    ·

    ·

    ······

    ·

    ··

    ·

    ···

    ·

    ··

    ··

    ·

    ·

    ············

    ·

    ·

    ···

    ·

    ··

    ·

    ··

    ·

    ··

    ·

    ·

    ··

    ·

    ·

    ·

    ··

    ·

    ···

    ·

    ·····

    ·

    ·

    ·

    ·

    ·

    ·

    ·

    ·

    ·

    ···

    ·

    ··

    ···

    ····

    ········

    ··

    ·

    ·

    ··

    ··

    ·

    1 2 3 4 5 6 7 8 9 10

    ••

    • ••

    •• •

    •......................................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ... ......................................

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    .....

    .....

    .....

    .....

    .....

    .....

    .....

    ...

    WZ WUM Wnioskowanie 74