Spis tre´sci -...

27
Spis tre´ sci Spis tre´ sci 1 Weryfikacja hipotez statystycznych 1 1.1 Poj˛ ecia ................................ 1 2 Porównania z normami 3 2.1 Wst˛ ep ................................ 3 2.2 Porównanie z normami: warto´ srednia .............. 3 2.3 Porównanie z normami: wariancja ................. 6 2.4 Porównanie z normami: frakcja ................... 6 3 Porównanie populacji 7 3.1 Wst˛ ep ................................ 7 3.2 Testowanie hipotez: porównanie dwóch ´ srednich ......... 9 3.3 Testowanie hipotez: porównanie dwóch wariancji ......... 11 3.4 Testowanie hipotez: porównanie dwóch frakcji .......... 12 3.5 Testowanie hipotez: porównanie wielu ´ srednich .......... 14 4 Test chi-kwadrat niezale˙ zno´ sci 17 5 Testy diagnostyczne 20 1 Weryfikacja hipotez statystycznych 1.1 Poj˛ ecia Poj˛ ecia Hipoteza statystyczna Dowolne przypuszczenie dotycz ˛ ace rozkladu prawdopodobie´ nstwa cechy w po- pulacji. Oznaczenie H 0 Test statystyczny Post˛ epowanie maj ˛ ace na celu odrzucenie lub nie odrzucenie hipotezy statystycz- nej. 1

Transcript of Spis tre´sci -...

Spis tresci

Spis tresci1 Weryfikacja hipotez statystycznych 1

1.1 Pojecia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Porównania z normami 32.1 Wstep . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.2 Porównanie z normami: wartosc srednia . . . . . . . . . . . . . . 32.3 Porównanie z normami: wariancja . . . . . . . . . . . . . . . . . 62.4 Porównanie z normami: frakcja . . . . . . . . . . . . . . . . . . . 6

3 Porównanie populacji 73.1 Wstep . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73.2 Testowanie hipotez: porównanie dwóch srednich . . . . . . . . . 93.3 Testowanie hipotez: porównanie dwóch wariancji . . . . . . . . . 113.4 Testowanie hipotez: porównanie dwóch frakcji . . . . . . . . . . 123.5 Testowanie hipotez: porównanie wielu srednich . . . . . . . . . . 14

4 Test chi-kwadrat niezaleznosci 17

5 Testy diagnostyczne 20

1 Weryfikacja hipotez statystycznych

1.1 PojeciaPojecia

Hipoteza statystycznaDowolne przypuszczenie dotyczace rozkładu prawdopodobienstwa cechy w po-pulacji.

Oznaczenie H0

Test statystycznyPostepowanie majace na celu odrzucenie lub nie odrzucenie hipotezy statystycz-nej.

1

Statystyka testowaFunkcja próby na podstawie której wnioskuje sie o odrzuceniu lub nie hipotezystatystycznej.

Pojecia

WnioskowanieRzeczywistosc: Wniosek o hipotezie H0

nie odrzucac odrzucicH0 prawdziwa prawidłowy nieprawidłowyH0 nieprawdziwa nieprawidłowy prawidłowy

Pojecia

WnioskowanieRzeczywistosc: Wniosek o hipotezie H0

nie odrzucac odrzucicH0 prawdziwa prawidłowy nieprawidłowyH0 nieprawdziwa nieprawidłowy prawidłowy

Pojecia

WnioskowanieRzeczywistosc: Wniosek o hipotezie H0

nie odrzucac odrzucicH0 prawdziwa prawidłowy bład I rodzajuH0 nieprawdziwa bład II rodzaju prawidłowy

Pojecia

Bład I rodzajuBład wnioskowania polegajacy na odrzuceniu hipotezy, gdy w rzeczywistosci jestona prawdziwa.

Poziom istotnosciDowolna liczba z przedziału (0, 1) okreslajaca prawdopodobienstwo popełnieniabłedu I rodzaju.

Oznaczenie: α

2

Pojecia

Bład II rodzajuBład wnioskowania polegajacy na nieodrzuceniu hipotezy, gdy w rzeczywistoscijest ona fałszywa.

Moc testuPrawdopodobienstwo nie popełnienia błedu II rodzaju.

Oznaczenie: 1− β

2 Porównania z normami

2.1 WstepJedna populacja

WstepAnalizujemy pewna ceche w populacji

Porównania z normami obejmuja m.in.:

• porównanie poziomu cechy

• porównanie zróznicowania cechy

Jedna populacja

Wstep - cecha ciagłaPróba: X1, . . . , Xn

Charakterystyki próby:

X, varX, s2 =varXn− 1

Jedna populacja

Wstep - cecha dychotomiczne

p =k

n

3

2.2 Porównanie z normami: wartosc sredniaRozkład normalny N(µ, σ2)

Hipoteza H0 : µ = µ0

Srednia µ oraz wariancja σ2 sa nieznane

Test StudentaStatystyka testowa

temp =X − µ0

S

√n

WnioskowanieWartosc krytyczna t(α;n− 1)

Jezeli |temp| > t(α;n− 1), to hipoteze H0 : µ = µ0 odrzucamy

Testowanie hipotezy H0 : µ = µ0

Przykład - trescPrzypuszczenie: maszyna pakujaca kostki masła nastawiona na jednostkowa mase250 g uległa po pewnym czasie rozregulowaniu. W celu weryfikacji tego przy-puszczenia z biezacej produkcji pobrano próbe otrzymujac wyniki 254, 269, 254,248, 263, 256, 258, 261, 264, 258. Czy mozna na tej podstawie sadzic, ze ma-szyna uległa rozregulowaniu?

Testowanie hipotezy H0 : µ = µ0

Przykład - rozwiazaniePopulacja: paczkowane kostki masła

Cecha X: masa kostki masłaZałozenie: cecha X ma rozkład normalny N(µ, σ2)Formalizacja: Rozregulowanie maszyny moze byc interpretowane jako odej-

scie od nominalnej wagi. Zatem nalezy zbadac, czy srednia µ wynosi 250, czyliweryfikujemy hipoteze H0 : µ = 250

Technika statystyczna: test Studenta (test t)poziom istotnosci α = 0.05

4

Testowanie hipotezy H0 : µ = µ0

Przykład - rozwiazanieObliczenia

n = 10

x = 258.5

s2 = 36.05

temp = 4.47

Testowanie hipotezy H0 : µ = µ0

Przykład - rozwiazanieWartosc krytyczna: t(0.05; 9) = 2.2622

Odpowiedz:Poniewaz |temp| > t(0.05; 9), wiec hipoteze H0 odrzucamyWniosek: maszyna uległa rozregulowaniu

Testowanie hipotezy H0 : µ = µ0

Przykład - inne rozwiazaniePopulacja: paczkowane kostki masła

Cecha X: masa kostki masłaZałozenie: cecha X ma rozkład normalny N(µ, σ2)Formalizacja: Rozregulowanie maszyny moze byc interpretowane jako odej-

scie od nominalnej wagi. Zatem nalezy zbadac, czy srednia µ wynosi 250, czyliweryfikujemy hipoteze H0 : µ = 250

Technika statystyczna: przedział ufnosci dla sredniej µpoziom ufnosci 1− α = 0.95

Testowanie hipotezy H0 : µ = µ0

Przykład - inne rozwiazanieObliczenia

µ ∈ (254.20, 262.80)

Odpowiedz: Poniewaz µ0 = 250 6∈ (254.20, 262.80), wiec hipoteze H0 odrzu-camy

Wniosek: maszyna uległa rozregulowaniu

5

Testowanie hipotezy H0 : µ = µ0

Przedział ufnosci a test hipotezyH0 nie odrzucamy na poziomie istotnosci α

mµ0 nalezy do przedziału ufnosci

na poziomie ufnosci 1− α

2.3 Porównanie z normami: wariancjaRozkład normalny N(µ, σ2)

Hipoteza H0 : σ2 = σ20

Srednia µ oraz wariancja σ2 sa nieznane

Test chi-kwadratStatystyka testowa

χ2emp =

varXσ20

WnioskowanieWartosci krytyczne χ2

(1− α

2;n− 1

)oraz χ2

(α2;n− 1

)Jezeli χ2

emp < χ2(1− α

2;n− 1

)lub χ2

emp > χ2(α2;n− 1

), to hipoteze H0 :

σ2 = σ20 odrzucamy

2.4 Porównanie z normami: frakcjaRozkład dwumianowy B(n, p)

Hipoteza H0 : p = p0k - liczba sukcesów w próbie n elementowej

Test przyblizony („duze” n)Statystyka testowa

uemp =k − np0√np0(1− p0)

WnioskowanieWartosc krytyczna u1−α/2

Jezeli |uemp| > u1−α/2, to H0 : p = p0 odrzucamy

6

Hipoteza H0 : p = p0

Przykład - trescW swojej ofercie sprzedazy stawu rybnego jego własciciel podaje, iz w stawiezyje tysiac karpi. Potencjalny nabywca zainteresowany jest sprawdzeniem praw-dziwosci tego twierdzenia. W tym celu wyłowiono sto karpi i po zaobraczkowaniuich wpuszczono je z powrotem do stawu. Po jakims czasie ponownie odłowionosto ryb i stwierdzono, ze wsród nich jest pietnascie zaobraczkowanych. Czy wswietle uzyskanych wyników mozna reklame uznac za prawdziwa?

Hipoteza H0 : p = p0

Przykład - rozwiazaniePopulacja: ryby w stawie

Cecha X: ryba zaobraczkowana/nie zaobraczkowanaZałozenie: cecha X ma rozkład dwupunktowy D(p)Formalizacja: Jezeli w stawie zyje N ryb, to odsetek zaobraczkowanych wy-

nosi 100/N . Zgodnie z twierdzeniem własciciela, N = 1000, czyli odsetek rybzaobraczkowanych wynosi 0.1

Technika statystyczna: Przyblizony test hipotezy H0 : p = 0.1Poziom istotnosci: α = 0.05

Hipoteza H0 : p = p0

Przykład - rozwiazanieObliczenia

n = 100

k = 15

uemp =k − np0√np0(1− p0)

=15− 10√

100 · 0.1 · 0.9= 1.6667

Hipoteza H0 : p = p0

Przykład - rozwiazanieWartosc krytyczna: u1−0.05/2 = u0.975 = 1.96

Odpowiedz: Poniewaz |uemp| < u0.975, wiec hipotezy H0 nie odrzucamyWniosek: mozna uznac, ze w stawie jest tysiac ryb

7

3 Porównanie populacji

3.1 WstepDwie populacjeWstepAnalizujemy te sama ceche w dwóch niezaleznych od siebie populacjach

Analiza porównawcza obejmuje m.in.:

• porównanie poziomu cech

• porównanie zróznicowania cech

Dwie populacjeWstep - cechy ciagłePróba z pierwszej populacji: X11, . . . , X1n1

Charakterystyki pierwszej próby:

X1, varX1, s21 =varX1

n1 − 1

Dwie populacjeWstep - cechy ciagłePróba z drugiej populacji: X21, . . . , X2n2

Charakterystyki drugiej próby:

X2, varX2, s22 =varX2

n2 − 1

Dwie populacjeWstep - cechy ciagłeCharakterystyki łaczne

S2e =

varX1 + varX2

n1 + n2 − 2

Sr =

√S2e

(1

n1

+1

n2

)

8

Dwie populacje

Wstep - cechy dychotomicznePierwsza populacja:

p1 =k1n1

Druga populacja:

p2 =k2n2

Razem:p =

k1 + k2n1 + n2

3.2 Testowanie hipotez: porównanie dwóch srednichRozkłady normalne N(µ1, σ

21) i N(µ2, σ

22)

Hipoteza H0 : µ1 = µ2

załozenie: σ21 = σ2

2

Test StudentaStatystyka testowa

temp =X1 − X2

Sr

WnioskowanieWartosc krytyczna t(α;n1 + n2 − 2)

Jezeli |temp| > t(α;n1 + n2 − 1), to hipoteze H0 : µ1 = µ2 odrzucamy

Hipoteza H0 : µ1 = µ2

Przykład - trescBadano zawartosc tłuszczu w serach zółtych produkowanych zima i latem. Wkazdym z dwóch okresów zbadano zawartosc tłuszczu w dziesieciu serach. Napodstawie uzyskanych wyników stwierdzic, czy zawartosc tłuszczu w serze zół-tym zalezy od pory roku.

Sery produkowane zima:∑x1i = 293.7, varx1 = 35.321

9

Sery produkowane latem:∑x2i = 271.2, varx2 = 18.176

Hipoteza H0 : µ1 = µ2

Przykład - rozwiazaniePopulacja 1: sery produkowane latem

Populacja 2: sery produkowane zimaCecha X: zawartosc tłuszczuZałozenia:cecha X ma w populacji 1 rozkład N(µ1, σ

21)

cecha X ma w populacji 2 rozkład N(µ2, σ22)

σ21 = σ2

2

Zadanie: weryfikacja hipotezy H0 : µ1 = µ2

Technika statystyczna: test Studenta porównania srednichpoziom istotnosci α = 0.05

Hipoteza H0 : µ1 = µ2

Przykład - rozwiazanieObliczenia

x1 = 29.37, varX1 = 35.321

x2 = 27.12, varX2 = 18.176

s2r =35.321 + 18.176

18

(1

10+

1

10

)= 0.5944

Hipoteza H0 : µ1 = µ2

Przykład - rozwiazanieObliczenia

temp =x1 − x2sr

=29.37− 27.12

0.771= 2.918

t(0.05; 18) ≈ 2.1009

10

Hipoteza H0 : µ1 = µ2

Przykład - rozwiazanieOdpowiedz: Poniewaz |temp| > t(0.05; 18), wiec hipoteze H0 : µ1 = µ2 odrzu-camy

Wniosek. Srednie zawartosci tłuszczu w serach produkowanych latem i zimanie sa takie same.

Hipoteza H0 : µ1 = µ2

Przykład - dalsze wnioskiPoniewaz weryfikowana hipoteza została odrzucona, wiec mozna pokusic sie oocene róznic miedzy srednimi zawartosciami tłuszczu.

Skonstruowac przedział ufnosci dla róznicy µ1−µ2 srednich (poziom ufnosci0.95)

Z przeprowadzonych wczesniej obliczen otrzymujemy:

(29.37− 27.12− 2.1009 · 0.771, 29.37− 27.12 + 2.1009 · 0.771)

(0.631, 3.869).

Hipoteza H0 : µ1 = µ2

Przykład - dalsze wnioskiµ1 − µ2 ∈ (0.631, 3.869).

Poniewaz oba konce tego przedziału sa dodatnie, wiec mozemy stwierdzic, zesrednia zawartosc tłuszczu w serach produkowanych latem jest wyzsza niz sred-nia zawartosc tłuszczu w serach produkowanych zima. Co wiecej, przecietnie wletnich serach jest tego tłuszczu wiecej o co najmniej 0.631, ale nie wiecej niz3.869 jednostek.

3.3 Testowanie hipotez: porównanie dwóch wariancjiRozkłady normalne N(µ1, σ

21) i N(µ2, σ

22)

Hipoteza H0 : σ21 = σ2

2

nieznane wartosci srednie µ1 oraz µ2

Test F

11

Statystyka testowa

Femp =S21

S22

Rozkłady normalne N(µ1, σ21) i N(µ2, σ

22)

Hipoteza H0 : σ21 = σ2

2

nieznane wartosci srednie µ1 oraz µ2

WnioskowanieWartosci krytyczne

F(

1− α

2;n1 − 1, n2 − 1

)oraz F

(α2

;n1 − 1, n2 − 1)

Jezeli Femp < F(1− α

2;n1 − 1, n2 − 1

)lub Femp > F

(α2;n1 − 1, n2 − 1

),

to hipoteze H0 : σ21 = σ2

2 odrzucamy

3.4 Testowanie hipotez: porównanie dwóch frakcjiRozkłady dwumianowe B(n1, p1) i B(n2, p2)

Hipoteza H0 : p1 = p2załozenie: n1 i n2 „duze”

Test przyblizonyStatystyka testowa

uemp =p1 − p2√

p(1− p)( 1n1

+ 1n2

)

WnioskowanieWartosc krytyczna u1−α/2

Jezeli |uemp| ≥ u1−α/2, to H0 : p1 = p2 odrzucamy

12

Hipoteza H0 : p1 = p2

Przykład - trescCelem badania było porównanie przygotowania z matematyki kandydatów na stu-dia bedacych absolwentami liceów oraz techników. W tym celu sposród kandy-datów zdajacych matematyke wylosowano 400 absolwentów liceów oraz 600 ab-solwentów techników. W wylosowanej grupie stwierdzono, ze 385 absolwentówliceów oraz 501 absolwentów techników rozwiazało test wstepny. Czy mozna natej podstawie sadzic, ze przygotowanie w obu grupach absolwentów jest jedna-kowe?

Hipoteza H0 : p1 = p2

Przykład - rozwiazaniePopulacja 1: absolwenci liceów zdajacy egzamin wstepny

Populacja 2: absolwenci techników zdajacy egzamin wstepnyCecha X: umiejetnosc rozwiazania testu (tak/nie)Załozenia:cecha X ma w populacji 1 rozkład B(n1, p1)cecha X ma w populacji 2 rozkład B(n2, p2)Zadanie: Weryfikacja hipotezy H0 : p1 = p2Technika statystyczna: Test przyblizony (poziom istotnosci α = 0.05)

Hipoteza H0 : p1 = p2

Przykład - rozwiazanieObliczenia

n1 = 400 k1 = 385 p1 = 385/400 = 0.9625

n2 = 600 k2 = 501 p2 = 501/600 = 0.8350

p = (385 + 501)/(400 + 600) = 0.886

uemp =0.9625− 0.8350√

0.886(1− 0.886)(

1400

+ 1600

) = 6.215

13

Hipoteza H0 : p1 = p2

Przykład - rozwiazanieWartosc krytyczna u0.975 = 1.96

Odpowiedz: poniewaz |uemp| > u0.975, wiec hipoteze H0 : p1 = p2 odrzu-camy

Wniosek: przygotowanie absolwentów liceów i techników z matematyki niejest takie same

Hipoteza H0 : p1 = p2

Przykład - dalsze wnioskiPoniewaz weryfikowana hipoteza została odrzucona, wiec mozna pokusic sie oocene róznic miedzy odsetkami absolwentów, którzy zdaja pomyslnie egzamin.

Skonstruowac przedział ufnosci dla róznicy p1 − p2 srednich (poziom ufnosci0.95)

Z przeprowadzonych wczesniej obliczen otrzymujemy:

(0.9625− 0.8350− 1.96 · 0.0205, 0.9625− 0.8350 + 1.96 · 0.0205)

(0.0873, 0.1677).

Hipoteza H0 : p1 = p2

Przykład - dalsze wnioskip1 − p2 ∈ (0.0873, 0.1677).

Poniewaz oba konce tego przedziału sa dodatnie, wiec mozemy stwierdzic, zeabsolwenci liceów sa lepiej przygotowani do egzaminu niz absolwenci techników.Co wiecej, odsetek absolwentów liceów pozytywnie zdajacych egzamin jest wyz-szy od odsetka absolwentów techników o co najmniej 8.7%, ale nie wiecej niz16.8%.

3.5 Testowanie hipotez: porównanie wielu srednichKilka populacji

WstepAnalizujemy te sama ceche w kilku niezaleznych od siebie populacjach

Analiza porównawcza obejmuje m.in.:

14

• porównanie poziomu cech

• porównanie zróznicowania cech

Kilka populacji

Wstep - cechy ciagłePróba z i-tej populacji: Xi1, . . . , Xini

(i = 1, . . . , K)Charakterystyki i-tej próby:

Xi, varX i, s2i =varX i

ni − 1

Kilka populacji

Wstep - cechy ciagłeCharakterystyki łaczne

N = n1 + · · ·+ nK

¯X =1

N

K∑i=1

ni∑j=1

Xij

S2e =

varX1 + · · ·+ varXK

N −K

Rozkłady normalne N(µi, σ2i ), i = 1, . . . , K

Hipoteza H0 : µ1 = · · · = µKzałozenie: σ2

1 = · · · = σ2K

Test FStatystyka testowa

Femp =

∑Ki=1(Xi − ¯X)2/(K − 1)

S2e

WnioskowanieWartosc krytyczna F (α;K − 1, N −K)

Jezeli Femp > F (α;K − 1, N −K), to hipoteze H0 : µ1 = · · · = µK odrzu-camy

15

Rozkłady normalne N(µi, σ2i ), i = 1, . . . , K

Tabela analizy wariancjiZródło Stopnie Sumy Srednie Femp

zmiennosci swobody kwadratów kwadratyCzynnik k − 1 varA S2

a = varAk−1

S2a/S

2e

Bład losowy N − k varE S2e = varE

N−kOgółem N − 1 varT

Rozkłady normalne N(µi, σ2i ), i = 1, . . . , K

Wniosek praktycznyPrzynajmniej jedna ze srednich µ1, . . . , µk jest inna od pozostałych.

PytanieJaki jest układ srednich?

Grupa jednorodnaPodzbiór srednich, które mozna uznac za takie same.

Rozkłady normalne N(µi, σ2i ), i = 1, . . . , K

Procedury porównan wielokrotnychTukeya, Scheffégo, Bonfferroniego, Duncana, Newmana–Kuelsa

Ogólna ideaNIR — najmniejsza istotna róznica

Jezeli|Xi − Xj| < NIR|Xi − Xl| < NIR|Xl − Xj| < NIR,to uznajemy, ze µi = µj = µl.

ANOVA - przykład

PrzykładPrzeprowadzic analize porównawcza wyników punktowych klasówki w grupachstudenckich.

16

ANOVA - przykład

PrzykładPopulacje: dziesiec populacji indeksowanych numerami grup studenckich

Badana cecha: ilosc punktów uzyskanych na klasówceZałozenia:cecha X ma w i–tej populacji rozkład N(µi, σ

2i ) (i = 1, . . . , 10)

σ21 = · · · = σ2

10

ANOVA - przykład

PrzykładFormalizacja

weryfikacja hipotezy H0 : µ1 = · · · = µ10

Techniki statystyczne• Jednoczynnikowa analiza wariancji• Porównania szczegółowePoziom istotnosci 0.05

4 Test chi-kwadrat niezaleznosciTest chi-kwadrat niezaleznosci

PrzykładW celu stwierdzenia, czy podanie chorym na pewna chorobe nowego leku przy-nosi poprawe w ich stanie zdrowia wylosowano dwie grupy pacjentów w jednako-wym stopniu chorych na te chorobe. Jednej grupie podawano nowy lek, zas dru-giej podawano leki tradycyjne. Na podstawie zanotowanych zmian stanu zdrowiazbadac, czy nowy lek daje inne efekty leczenia niz lek tradycyjny.

lek bez wyrazna całkowitepoprawy poprawa wyleczenie

nowy 20 40 60tradycyjny 45 20 15

17

Test chi-kwadrat niezaleznosci

Postac danychKlasy Klasy cechy X

cechy Y 1 2 . . . m1 n11 n12 . . . n1m

2 n21 n22 . . . n2m...

......

...k nk1 nk2 . . . nkm

Test chi-kwadrat niezaleznosci

Statystyka testowa

χ2emp =

k∑i=1

m∑j=1

(nij − ntij)2

ntij

gdzie

ntij =ni·n·j

N, N =

k∑i=1

m∑j=1

nij

ni· =m∑j=1

nij, n·j =k∑i=1

nij

Test chi-kwadrat niezaleznosci

WnioskowanieJezeli χ2

emp > χ2(α; (k − 1)(m − 1)), to hipoteze hipoteze o niezaleznosci cechodrzucamy

Test chi-kwadrat niezaleznosci

Przykład - rozwiazaniePopulacja: chorzy na pewna chorobe

Cechy (X, Y ): (zmiana stanu zdrowia, rodzaj leku)Załozenia: cechy maja charakter jakosciowyZadanie: Weryfikacja hipotezy badane cechy sa niezalezneTechnika statystyczna: Test niezaleznosci chi-kwadrat (poziom istotnosci

α = 0.05)

18

Test chi-kwadrat niezaleznosci

Przykład - rozwiazanieObliczenia:

liczba osób, których stan zdrowia:bez poprawy: 65wyrazna poprawa: 60całkowicie wyleczonych: 75

liczba osób:leczonych nowym lekiem: 120leczonych tradycyjnie: 80

Test chi-kwadrat niezaleznosci

Przykład - rozwiazanieGdyby stan zdrowia nie zalezał od leku, to powinno byc

lek bez wyrazna całkowitepoprawy poprawa wyleczenie

nowy 39 36 45tradycyjny 26 24 30

a jestlek bez wyrazna całkowite

poprawy poprawa wyleczenienowy 20 40 60

tradycyjny 45 20 15

Test chi-kwadrat niezaleznosci

Przykład - rozwiazanieWartosc statystyki testu chi-kwadrat niezaleznosci

χ2emp = 36.75

Wartosc krytyczna: 5.99Stwierdzamy, ze nowy lek ma inne działanie niz tradycyjny.

19

Test chi-kwadrat niezaleznosci

Przykład - rozwiazanielek bez wyrazna całkowite

poprawy poprawa wyleczenienowy 16.67% 33.33% 50.00%

tradycyjny 56.25% 25.00% 18.75%32.50% 30.00% 37.50%

Test chi-kwadrat niezaleznosci

Przykład - rozwiazanie

5 Testy diagnostycznePrzykład

Test CRPCRP (białko C-reaktywne) jest czułym wskaznikiem ostrych i przewlekłych sta-nów zapalnych o róznym pochodzeniu. Poziom CRP, jednego z tzw. białek ostrejfazy, wzrasta w surowicy i osoczu w trakcie ogólnej, niespecyficznej odpowie-dzi na infekcje (głównie bakteryjne) oraz stany zapalne bez tła infekcyjnego(...)Oznaczenie stezenia CRP wykorzystuje sie w diagnostyce (...)

Fizjologiczne stezenie CRP nie przekracza 5 mg/L, stezenie wieksze niz 10mg/L uznawane jest za patologiczne.

20

Pojecia

Wynik testuRzeczywistosc: Wynik testu

dodatni ujemnychory (+) prawidłowy nieprawidłowyzdrowy (-) nieprawidłowy prawidłowy

Pojecia

Wynik testuRzeczywistosc: Wynik testu

dodatni ujemnychory (+) prawidłowy nieprawidłowyzdrowy (-) nieprawidłowy prawidłowy

Pojecia

Wynik testuRzeczywistosc: Wynik testu

dodatni ujemnychory (+) prawdziwie dodatni nieprawdziwie ujemny

zdrowy (-)nieprawdziwie do-

datni prawdziwie ujemny

Pojecia

Czułosc testuprawdopodobienstwo uzyskania wyniku prawdziwie dodatniego

to znaczyprawdopodobienstwo uzyskania wyniku dodatniego dla osoby chorej

okresla zdolnosc testu do wykrywania osób chorych

21

Pojecia

Swoistosc testuprawdopodobienstwo uzyskania wyniku prawdziwie ujemnego

to znaczyprawdopodobienstwo uzyskania wyniku ujemnego dla osoby zdrowej

okresla zdolnosc testu do wykrywania osób zdrowych

Zadanie

CelWyznaczyc wartosc krytyczna dla testu minimalizujaca prawdopodobienstwa błe-dów.

To znaczy jak najbardziej czułego i o jak najwiekszej swoistosci

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

22

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

23

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

24

barierka swoistosc czułosc4 15.87% 99.87%5 50.00% 97.72%6 84.13% 84.13%7 97.72% 50.00%8 99.87% 15.87%9 100.00% 2.28%

Przykład

Krzywa ROC (odsetek wyników pozytywnych)

25

barierka 1-swoistosc czułosc4 84.13% 99.87%5 50.00% 97.72%6 15.87% 84.13%7 2.28% 50.00%8 0.13% 15.87%9 0.00% 2.28%

Przykład

Krzywa ROC

Nieznajomosc matematyki zabija

Irena Cieslinska GW 21.11.2014Zrobiłam mammografie. Dostałam wynik. Pozytywny. - Czy mam raka, dokto-

rze? - zapytałam.- Czułosc testu wynosi 87 proc. To nie oznacza z cała pewnoscia, ze ma

pani nowotwór, bo zawsze jest jeszcze szansa, ze zalicza sie pani do 13 proc.szczesliwców. Radziłbym wykonac teraz dodatkowe badania, biopsje.

- Ale ryzyko, ze mam raka, wynosi jakies 87 proc.?- Niestety tak. Przykro mi to mówic.

26

A jak powinno byc

Czułosc wynosi 87%P{wynik pozytywny|osoba chora} = 0.87

Swoistosc wynosi 93%P{wynik pozytywny|osoba zdrowa} = 0.07

A jak powinno byc

Czestosc wystepowania choroby wynosi 0.7%P{osoba chora} = 0.007

Ogólny odsetek wyników pozytywnychP{wynik pozytywny} =

P{wynik pozytywny|osoba chora} · P{osoba chora}+P{wynik pozytywny|osoba zdrowa} · P{osoba zdrowa} =

0.87 · 0.007 + 0.07 · 0.993 = 0.0756

A jak powinno byc

Ryzyko choroby przy pozytywnym wynikuP{osoba chora|wynik pozytywny} =

P{wynik pozytywny|osoba chora} · P{osoba chora}P{wynik pozytywny}

=

0.87 · 0.007

0.0756= 0.0805

27