Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

214
Statystyczna analiza danych Marek Ptak 10 pa´ zdziernika 2016 Marek Ptak Statystyka 10 pa´ zdziernika 2016 1 / 93

Transcript of Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

Page 1: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyczna analiza danych

Marek Ptak

10 pazdziernika 2016

Marek Ptak Statystyka 10 pazdziernika 2016 1 / 93

Page 2: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Czesc I

Wstep

Marek Ptak Statystyka 10 pazdziernika 2016 2 / 93

Page 3: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

LITERATURAA. Łomnicki, Wprowadzenie do statystyki dla przyrodników

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski,Rachunek prawdopodobienstwa i statystyka matematyczna w zadaniach

J. Koronacki, J. Mieliczuk, Statystyka dla studentów kierunkówtechnicznych i przyrodniczych

G. E. Box, G. M. Jenkins, Analiza szeregów czasowych, PWN, Warszawa1983;

J. Józwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2012.

Marek Ptak Statystyka 10 pazdziernika 2016 3 / 93

Page 4: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.

PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?

Marek Ptak Statystyka 10 pazdziernika 2016 4 / 93

Page 5: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.

PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?

Marek Ptak Statystyka 10 pazdziernika 2016 4 / 93

Page 6: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy, która kapusta: biała czy czerwona zawiera wiecej witaminy C. Wpróbkach po 100 g otrzymano nastepujace wyniki (w mg): biała: 45, 50, 64,38, 66, 43, 49, 58, 31, 49 oraz czerwona: 70, 68, 55, 61, 62, 74, 52, 71, 56,61. Który z gatunków zawiera wiecej witaminy C?

Marek Ptak Statystyka 10 pazdziernika 2016 5 / 93

Page 7: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93

Page 8: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93

Page 9: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93

Page 10: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 11: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 12: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 13: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 14: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 15: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 16: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 17: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

Page 18: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =

(nk

)pk(1− p)n−k

P(X = 0) =(

100

)( 1

2 )0( 12 )10 = 1

1024 = 0, 000976563

P(X = 1) =(

101

)( 1

2 )1( 12 )9 = 10 · 1

2 ·1

512 = 5512 = 0, 009765625

P(X = 2) =(

102

)( 1

2 )2( 12 )8 = 45 · 1

4 ·1

256 = 451024 = 0, 043945313

P(X = 3) =(

103

)( 1

2 )3( 12 )7 = 120 · 1

8 ·1

128 = 15128 = 0, 1171875

P(X = 4) =(

104

)( 1

2 )4( 12 )6 = 210 · 1

16 ·164 = 105

512 = 0, 205078125

P(X = 5) =(

105

)( 1

2 )5( 12 )5 = 252 · 1

32 ·132 = 63

256 = 0, 24609375

P(X = 6) =(

106

)( 1

2 )6( 12 )4 = 210 · 1

64 ·116 = 105

512 = 0, 205078125

P(X = 7) =(

107

)( 1

2 )7( 12 )3 = 120 · 1

128 ·18 = 15

128 = 0, 1171875

P(X = 8) =(

108

)( 1

2 )8( 12 )2 = 45 · 1

256 ·14 = 45

1024 = 0, 043945313

P(X = 9) =(

109

)( 1

2 )9( 12 )1 = 10 · 1

512 ·12 = 5

512 = 0, 009765625

P(X = 10) =(

1010

)( 1

2 )10( 12 )0 = 1

1024 = 0, 000976563

Marek Ptak Statystyka 10 pazdziernika 2016 8 / 93

Page 19: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =

(nk

)pk(1− p)n−k

P(X = 0) =(

100

)( 1

2 )0( 12 )10 = 1

1024 = 0, 000976563

P(X = 1) =(

101

)( 1

2 )1( 12 )9 = 10 · 1

2 ·1

512 = 5512 = 0, 009765625

P(X = 2) =(

102

)( 1

2 )2( 12 )8 = 45 · 1

4 ·1

256 = 451024 = 0, 043945313

P(X = 3) =(

103

)( 1

2 )3( 12 )7 = 120 · 1

8 ·1

128 = 15128 = 0, 1171875

P(X = 4) =(

104

)( 1

2 )4( 12 )6 = 210 · 1

16 ·164 = 105

512 = 0, 205078125

P(X = 5) =(

105

)( 1

2 )5( 12 )5 = 252 · 1

32 ·132 = 63

256 = 0, 24609375

P(X = 6) =(

106

)( 1

2 )6( 12 )4 = 210 · 1

64 ·116 = 105

512 = 0, 205078125

P(X = 7) =(

107

)( 1

2 )7( 12 )3 = 120 · 1

128 ·18 = 15

128 = 0, 1171875

P(X = 8) =(

108

)( 1

2 )8( 12 )2 = 45 · 1

256 ·14 = 45

1024 = 0, 043945313

P(X = 9) =(

109

)( 1

2 )9( 12 )1 = 10 · 1

512 ·12 = 5

512 = 0, 009765625

P(X = 10) =(

1010

)( 1

2 )10( 12 )0 = 1

1024 = 0, 000976563

Marek Ptak Statystyka 10 pazdziernika 2016 8 / 93

Page 20: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 3 : 2, tzn, czy rozkład jest dwumianowy.

P(X = 0) =(

100

)( 3

5 )0( 25 )10 = 0, 000105

P(X = 1) =(

101

)( 3

5 )1( 25 )9 = 0, 001573

P(X = 2) =(

102

)( 3

5 )2( 25 )8 = 0, 010617

P(X = 3) =(

103

)( 3

5 )3( 25 )7 = 0, 042467

P(X = 4) =(

104

)( 3

5 )4( 25 )6 = 0, 111477

P(X = 5) =(

105

)( 3

5 )5( 25 )5 = 0, 200658

P(X = 6) =(

106

)( 3

5 )6( 25 )4 = 0, 250823

P(X = 7) =(

107

)( 3

5 )7( 25 )3 = 0, 214991

P(X = 8) =(

108

)( 3

5 )8( 25 )2 = 0, 120932

P(X = 9) =(

109

)( 3

5 )9( 25 )1 = 0, 040311

P(X = 10) =(

1010

)( 3

5 )10( 25 )0 = 0, 006047

Marek Ptak Statystyka 10 pazdziernika 2016 9 / 93

Page 21: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 3 : 2, tzn, czy rozkład jest dwumianowy.

P(X = 0) =(

100

)( 3

5 )0( 25 )10 = 0, 000105

P(X = 1) =(

101

)( 3

5 )1( 25 )9 = 0, 001573

P(X = 2) =(

102

)( 3

5 )2( 25 )8 = 0, 010617

P(X = 3) =(

103

)( 3

5 )3( 25 )7 = 0, 042467

P(X = 4) =(

104

)( 3

5 )4( 25 )6 = 0, 111477

P(X = 5) =(

105

)( 3

5 )5( 25 )5 = 0, 200658

P(X = 6) =(

106

)( 3

5 )6( 25 )4 = 0, 250823

P(X = 7) =(

107

)( 3

5 )7( 25 )3 = 0, 214991

P(X = 8) =(

108

)( 3

5 )8( 25 )2 = 0, 120932

P(X = 9) =(

109

)( 3

5 )9( 25 )1 = 0, 040311

P(X = 10) =(

1010

)( 3

5 )10( 25 )0 = 0, 006047

Marek Ptak Statystyka 10 pazdziernika 2016 9 / 93

Page 22: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Czesc II

Rachunek prawdopodobienstwa

Marek Ptak Statystyka 10 pazdziernika 2016 10 / 93

Page 23: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Page 24: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Page 25: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Page 26: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Page 27: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Page 28: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Page 29: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

Page 30: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

Page 31: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

Page 32: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

Page 33: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 34: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 35: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 36: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 37: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 38: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 39: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 40: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Page 41: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Page 42: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Page 43: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Page 44: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Page 45: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Page 46: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Page 47: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 48: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 49: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 50: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 51: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 52: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 53: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Page 54: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 55: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 56: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 57: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 58: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 59: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 60: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Page 61: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Page 62: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Page 63: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Page 64: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Page 65: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dystrybuanta zmiennej losowej X

F(x) =

0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 18 / 93

Page 66: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dystrybuanta zmiennej losowej X

F(x) =

0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 18 / 93

Page 67: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Page 68: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Page 69: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Page 70: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Page 71: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Page 72: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93

Page 73: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93

Page 74: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93

Page 75: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Page 76: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Page 77: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Page 78: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Page 79: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Page 80: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Page 81: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Page 82: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Page 83: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Page 84: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Page 85: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93

Page 86: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93

Page 87: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93

Page 88: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład hipergeometryczny

Zmienna typu skokowego o rozkładzie prawdopodobienstwa

P(X = k) =(n

k)(N−Mn−k )

(Nn)

EX = np D2X = np(1− p)(N−n

N−1

)p = M

N

Marek Ptak Statystyka 10 pazdziernika 2016 24 / 93

Page 89: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład hipergeometryczny

Zmienna typu skokowego o rozkładzie prawdopodobienstwa

P(X = k) =(n

k)(N−Mn−k )

(Nn)

EX = np D2X = np(1− p)(N−n

N−1

)p = M

N

Marek Ptak Statystyka 10 pazdziernika 2016 24 / 93

Page 90: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Page 91: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Page 92: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Page 93: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Page 94: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenief : R→ R – gestosc zmiennej losowej, f ciagła w x0. Wtedy

F′X(x) = f (x)

Marek Ptak Statystyka 10 pazdziernika 2016 26 / 93

Page 95: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Przykład

f (t) =

23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.

Dystrybuanta ma postac

F(x) =

0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 27 / 93

Page 96: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Przykład

f (t) =

23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.

Dystrybuanta ma postac

F(x) =

0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 27 / 93

Page 97: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Page 98: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Page 99: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Page 100: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Page 101: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Page 102: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład równomierny

f (x) =

1

b−a dla x ∈ [a, b],

0 dla x /∈ [a, b].F(x) =

0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.

E(X) = a+b2 D2(X) = (b−a)2

12

Marek Ptak Statystyka 10 pazdziernika 2016 29 / 93

Page 103: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład równomierny

f (x) =

1

b−a dla x ∈ [a, b],

0 dla x /∈ [a, b].F(x) =

0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.

E(X) = a+b2 D2(X) = (b−a)2

12

Marek Ptak Statystyka 10 pazdziernika 2016 29 / 93

Page 104: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Page 105: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Page 106: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Page 107: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Page 108: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93

Page 109: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93

Page 110: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93

Page 111: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład normalny N(µ, σ)

f (x) = 1√2π

e−x2

2

f (x) = 1√2πσ

e−(x−µ)2

2σ2 , F(x) = Φ(x) = 1√2π

x∫−∞

e−t22 dt

EX = µ D2X = σ2

Marek Ptak Statystyka 10 pazdziernika 2016 32 / 93

Page 112: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład normalny N(µ, σ)

f (x) = 1√2π

e−x2

2

f (x) = 1√2πσ

e−(x−µ)2

2σ2 , F(x) = Φ(x) = 1√2π

x∫−∞

e−t22 dt

EX = µ D2X = σ2

Marek Ptak Statystyka 10 pazdziernika 2016 32 / 93

Page 113: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX – zmienna o rozkładzie normalnym N(µ, σ) to EX = µ, D2X = σ2. PonadtoZ = X−µ

σ ma rozkład N(0, 1), tzn EZ = 0, D2Z = 1.

Marek Ptak Statystyka 10 pazdziernika 2016 33 / 93

Page 114: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dystrybuanta standaryzowanego rozkładu normalnego, Φ(x) = 1√2π

x∫−∞

e−12 t2 dt, x > 0

x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

Marek Ptak Statystyka 10 pazdziernika 2016 34 / 93

Page 115: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dla rozkładu normalnego zachodzi tzw.

Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ

σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027

Marek Ptak Statystyka 10 pazdziernika 2016 35 / 93

Page 116: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dla rozkładu normalnego zachodzi tzw.

Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ

σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027

Marek Ptak Statystyka 10 pazdziernika 2016 35 / 93

Page 117: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieNiech X1, . . . ,Xn beda zmiennymi losowymi o tym samym rozkładzienormalnym N(µ, σ). Wtedy zmienna Z = 1

n(X1 + · · ·+ Xn) ma rozkładN(µ, σ√

n).

Marek Ptak Statystyka 10 pazdziernika 2016 36 / 93

Page 118: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład logarytmiczno-normalny

Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)

f (y) = 1yσ√

2πe−

(ln y−µ)2

2σ2

Marek Ptak Statystyka 10 pazdziernika 2016 37 / 93

Page 119: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład logarytmiczno-normalny

Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)

f (y) = 1yσ√

2πe−

(ln y−µ)2

2σ2

Marek Ptak Statystyka 10 pazdziernika 2016 37 / 93

Page 120: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład t–Studenta o n− 1 stopniach swobody

Zmienna losowa o gestosci

f (x) =Γ[(n + 1)/2]√

nπ Γ(n/2)

(1 +

x2

n

)−(n+1)/2

, x ∈ R, n ∈ N

gdzie

Γ(r) =

+∞∫0

xr−1 e−x dx, r > 0

Marek Ptak Statystyka 10 pazdziernika 2016 38 / 93

Page 121: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład t–Studenta o n− 1 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 39 / 93

Page 122: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Wartosci krytyczne rozkładu t-Studenta, P(|T| > tα; r) = α

α

r 0,8 0,6 0,4 0,2 0,1 0,05 0,04 0,02 0,01 0,002 0,0011 0,325 0,727 1,376 3,078 6,314 12,706 15,894 31,821 63,656 318,29 636,582 0,289 0,617 1,061 1,886 2,920 4,303 4,849 6,965 9,925 22,328 31,6003 0,277 0,584 0,978 1,638 2,353 3,182 3,482 4,541 5,841 10,214 12,9244 0,271 0,569 0,941 1,533 2,132 2,776 2,999 3,747 4,604 7,173 8,6105 0,267 0,559 0,920 1,476 2,015 2,571 2,757 3,365 4,032 5,894 6,8696 0,265 0,553 0,906 1,440 1,943 2,447 2,612 3,143 3,707 5,208 5,9597 0,263 0,549 0,896 1,415 1,895 2,365 2,517 2,998 3,499 4,785 5,4088 0,262 0,546 0,889 1,397 1,860 2,306 2,449 2,896 3,355 4,501 5,0419 0,261 0,543 0,883 1,383 1,833 2,262 2,398 2,821 3,250 4,297 4,781

10 0,260 0,542 0,879 1,372 1,812 2,228 2,359 2,764 3,169 4,144 4,58711 0,260 0,540 0,876 1,363 1,796 2,201 2,328 2,718 3,106 4,025 4,43712 0,259 0,539 0,873 1,356 1,782 2,179 2,303 2,681 3,055 3,930 4,31813 0,259 0,538 0,870 1,350 1,771 2,160 2,282 2,650 3,012 3,852 4,22114 0,258 0,537 0,868 1,345 1,761 2,145 2,264 2,624 2,977 3,787 4,14015 0,258 0,536 0,866 1,341 1,753 2,131 2,249 2,602 2,947 3,733 4,07316 0,258 0,535 0,865 1,337 1,746 2,120 2,235 2,583 2,921 3,686 4,01517 0,257 0,534 0,863 1,333 1,740 2,110 2,224 2,567 2,898 3,646 3,96518 0,257 0,534 0,862 1,330 1,734 2,101 2,214 2,552 2,878 3,610 3,92219 0,257 0,533 0,861 1,328 1,729 2,093 2,205 2,539 2,861 3,579 3,88320 0,257 0,533 0,860 1,325 1,725 2,086 2,197 2,528 2,845 3,552 3,85021 0,257 0,532 0,859 1,323 1,721 2,080 2,189 2,518 2,831 3,527 3,81922 0,256 0,532 0,858 1,321 1,717 2,074 2,183 2,508 2,819 3,505 3,79223 0,256 0,532 0,858 1,319 1,714 2,069 2,177 2,500 2,807 3,485 3,76824 0,256 0,531 0,857 1,318 1,711 2,064 2,172 2,492 2,797 3,467 3,74525 0,256 0,531 0,856 1,316 1,708 2,060 2,167 2,485 2,787 3,450 3,72526 0,256 0,531 0,856 1,315 1,706 2,056 2,162 2,479 2,779 3,435 3,70727 0,256 0,531 0,855 1,314 1,703 2,052 2,158 2,473 2,771 3,421 3,68928 0,256 0,530 0,855 1,313 1,701 2,048 2,154 2,467 2,763 3,408 3,67429 0,256 0,530 0,854 1,311 1,699 2,045 2,150 2,462 2,756 3,396 3,66030 0,256 0,530 0,854 1,310 1,697 2,042 2,147 2,457 2,750 3,385 3,64635 0,255 0,529 0,852 1,306 1,690 2,030 2,133 2,438 2,724 3,340 3,59140 0,255 0,529 0,851 1,303 1,684 2,021 2,123 2,423 2,704 3,307 3,55145 0,255 0,528 0,850 1,301 1,679 2,014 2,115 2,412 2,690 3,281 3,52050 0,255 0,528 0,849 1,299 1,676 2,009 2,109 2,403 2,678 3,261 3,49660 0,254 0,527 0,848 1,296 1,671 2,000 2,099 2,390 2,660 3,232 3,46070 0,254 0,527 0,847 1,294 1,667 1,994 2,093 2,381 2,648 3,211 3,43580 0,254 0,526 0,846 1,292 1,664 1,990 2,088 2,374 2,639 3,195 3,41690 0,254 0,526 0,846 1,291 1,662 1,987 2,084 2,368 2,632 3,183 3,402100 0,254 0,526 0,845 1,290 1,660 1,984 2,081 2,364 2,626 3,174 3,390120 0,254 0,526 0,845 1,289 1,658 1,980 2,076 2,358 2,617 3,160 3,373∞ 0,253 0,524 0,842 1,282 1,645 1,960 2,054 2,327 2,576 3,091 3,291

Marek Ptak Statystyka 10 pazdziernika 2016 40 / 93

Page 123: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład χ2 o n stopniach swobody

Zmienna o gestosci

f (x) =

1

2n/2Γ(n/2)x

12 k−1 e−

12 x2, gdy x > 0,

0, gdy x 6 0

Marek Ptak Statystyka 10 pazdziernika 2016 41 / 93

Page 124: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Wartosci krytyczne rozkładu χ2, P(χ2 > χ2α; r) = α

α

r 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0,0011 0,000 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 10,8272 0,002 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 13,8153 0,024 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 16,2664 0,091 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 18,4665 0,210 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750 20,5156 0,381 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 22,4577 0,599 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 24,3218 0,857 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 26,1249 1,152 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 27,877

10 1,479 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 29,58811 1,834 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 31,26412 2,214 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 32,90913 2,617 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819 34,52714 3,041 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 36,12415 3,483 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 37,69816 3,942 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 39,25217 4,416 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 40,79118 4,905 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 42,31219 5,407 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 43,81920 5,921 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 45,31421 6,447 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 46,79622 6,983 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 48,26823 7,529 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 49,72824 8,085 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558 51,17925 8,649 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 52,61926 9,222 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 54,05127 9,803 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 55,47528 10,391 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994 56,89229 10,986 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335 58,30130 11,588 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 59,70235 14,688 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 66,61940 17,917 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 73,40345 21,251 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 80,07850 24,674 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 86,66060 31,738 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 99,60870 39,036 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,43 104,21 112,3280 46,520 51,172 53,540 57,153 60,391 64,278 96,578 101,88 106,63 112,33 116,32 124,8490 54,156 59,196 61,754 65,647 69,126 73,291 107,57 113,15 118,14 124,12 128,30 137,21100 61,918 67,328 70,065 74,222 77,929 82,358 118,50 124,34 129,56 135,81 140,17 149,45120 77,756 83,852 86,923 91,573 95,705 100,62 140,23 146,57 152,21 158,95 163,65 173,62140 93,925 100,65 104,03 109,14 113,66 119,03 161,83 168,61 174,65 181,84 186,85 197,45

Marek Ptak Statystyka 10 pazdziernika 2016 42 / 93

Page 125: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Weibulla

Zmienna o gestosci

f (x) =

λp xp−1e−λxp

, gdy x > 0,0, gdy x 6 0

p, λ > 0

EX = λ− 1

p

(1p + 1

)D2X = λ

− 2p

Γ(2

p + 1)− [Γ( 1p)]2,

gdzie Γ(r) =+∞∫0

xr−1e−x dx, r > 0

Marek Ptak Statystyka 10 pazdziernika 2016 43 / 93

Page 126: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Rozkład Weibulla

Zmienna o gestosci

f (x) =

λp xp−1e−λxp

, gdy x > 0,0, gdy x 6 0

p, λ > 0

EX = λ− 1

p

(1p + 1

)D2X = λ

− 2p

Γ(2

p + 1)− [Γ(1p)]2,

gdzie Γ(r) =+∞∫0

xr−1e−x dx, r > 0

Marek Ptak Statystyka 10 pazdziernika 2016 43 / 93

Page 127: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

Marek Ptak Statystyka 10 pazdziernika 2016 44 / 93

Page 128: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa

X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowym σ√n .

WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie

normalnym N(µ, σ), to X = 1n

n∑i=1

Xi ma rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 45 / 93

Page 129: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa

X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowym σ√n .

WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie

normalnym N(µ, σ), to X = 1n

n∑i=1

Xi ma rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 45 / 93

Page 130: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieJezeli X1, . . . ,Xn to niezalezne zmienne losowe o rozkładzie N(µ, σ),

X = 1n

n∑i=1

Xi oraz S2 = 1n

n∑i=1

(Xi − X)2, to zmienna losowa V = X−µS

√n− 1

ma rozkład t–Studenta o (n− 1)–stopniach swobody.

Marek Ptak Statystyka 10 pazdziernika 2016 46 / 93

Page 131: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego

N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty

rozkładu normalnego N(0, 1).

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 47 / 93

Page 132: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego

N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty

rozkładu normalnego N(0, 1).

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 47 / 93

Page 133: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Czesc III

Statystyka

Marek Ptak Statystyka 10 pazdziernika 2016 48 / 93

Page 134: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Populacja to zbiór, który badamy

DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.

Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)

Marek Ptak Statystyka 10 pazdziernika 2016 49 / 93

Page 135: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Populacja to zbiór, który badamy

DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.

Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)

Marek Ptak Statystyka 10 pazdziernika 2016 49 / 93

Page 136: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Page 137: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Page 138: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Page 139: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Page 140: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Page 141: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Mediana (wartosc srodkowa) me x1 6 x2 6 · · · 6 xn

me =

x(n+1)/2, gdy n nieparzyste,12(xn/2 + xn/2+1), gdy n parzyste.

Wartosc modalna (moda, dominanta) m0 próbki x1, . . . , xn

o powtarzajacych sie wartosciach to najczesciej powtarzajaca sie wartosc.

Marek Ptak Statystyka 10 pazdziernika 2016 51 / 93

Page 142: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dla szeregu rozdzielczego

me = xl +b

nm

(n2−

m−1∑i=1

ni

),

gdzie xl – lewy koniec klasy zawierajacej mediane,m – numer klasy zawierajacej mediane,n – licznosc próbki,ni – licznosc i-tej próbki,b – długosc klasy.Moda – srodek najliczniejszej klasy.

Marek Ptak Statystyka 10 pazdziernika 2016 52 / 93

Page 143: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki

S2 = 1n

n∑i=1

(xi − x)2 = 1n

n∑i=1

x2i − x2 S2 = 1

n

n∑i=1

(xi − x)2ni

Odchylenie standardowe S

S∗2 = 1n−1

n∑i=1

(xi − x)2 S∗2 = 1n−1

n∑i=1

ni(xi − x)2

Marek Ptak Statystyka 10 pazdziernika 2016 53 / 93

Page 144: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki

S2 = 1n

n∑i=1

(xi − x)2 = 1n

n∑i=1

x2i − x2 S2 = 1

n

n∑i=1

(xi − x)2ni

Odchylenie standardowe S

S∗2 = 1n−1

n∑i=1

(xi − x)2 S∗2 = 1n−1

n∑i=1

ni(xi − x)2

Marek Ptak Statystyka 10 pazdziernika 2016 53 / 93

Page 145: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki

d1 = 1n

n∑i=1

|xi − x| d1 = 1n

k∑i=1

ni |xi − x|

Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi

od mediany me próbki

d2 = 1n

n∑i=1

|xi − me| d2 = 1n

k∑i=1

ni|xi − me|

Marek Ptak Statystyka 10 pazdziernika 2016 54 / 93

Page 146: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki

d1 = 1n

n∑i=1

|xi − x| d1 = 1n

k∑i=1

ni |xi − x|

Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi

od mediany me próbki

d2 = 1n

n∑i=1

|xi − me| d2 = 1n

k∑i=1

ni|xi − me|

Marek Ptak Statystyka 10 pazdziernika 2016 54 / 93

Page 147: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

n

k∑i=1

nixri

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93

Page 148: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

n

k∑i=1

nixri

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93

Page 149: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

n

k∑i=1

nixri

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93

Page 150: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

Współczynnik skosnosci (asymetrii)

γ1 =M3

S3

Współczynnik koncentracji (skupienia)

K =M4

S4

Marek Ptak Statystyka 10 pazdziernika 2016 56 / 93

Page 151: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Miary rozproszenia (rozrzutu, rozsiania)

Współczynnik skosnosci (asymetrii)

γ1 =M3

S3

Współczynnik koncentracji (skupienia)

K =M4

S4

Marek Ptak Statystyka 10 pazdziernika 2016 56 / 93

Page 152: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.

n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.

Marek Ptak Statystyka 10 pazdziernika 2016 57 / 93

Page 153: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.

n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.

Marek Ptak Statystyka 10 pazdziernika 2016 57 / 93

Page 154: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Szereg rozdzielczy

Nr klasy KlasyGrupowaniewartosci próbki Srodki klas xi

Liczebnosciklas ni

1 2,95-3,45 |||| 3,2 42 3,45-3,95 ||||| 3,7 53 3,95-4,45 ||||| || 4,2 74 4,45-4,95 ||||| |||| 4,7 95 4,95-5,45 ||||| ||||| || 5,2 126 5,45-5,95 ||||| ||| 5,7 87 5,95-6,45 ||||| 6,2 5

Marek Ptak Statystyka 10 pazdziernika 2016 58 / 93

Page 155: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93

Page 156: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93

Page 157: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93

Page 158: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Page 159: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Page 160: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Page 161: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Page 162: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93

Page 163: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93

Page 164: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93

Page 165: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Page 166: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Page 167: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Page 168: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Page 169: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Nieznany parametr Estymator Własnosci

Wartosc oczekiwana E(X) X = 1n

n∑i=1

Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny

mediana z próby zgodny asymptotycznie nieobciazony

Wariancja D2(X) S21 = 1

n

n∑i=1

(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗ = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie

odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-

tywny dla rozkładu normalnegowskaznik struktury Θ = k

n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny

bn =Γ( n

2 )√

2

Γ( n−12 )√

ncn =

n− 1

n=

Γ2( n2 ) · 2

Γ2( n−1n ) · n

Marek Ptak Statystyka 10 pazdziernika 2016 63 / 93

Page 170: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Nieznany parametr Estymator Własnosci

Wartosc oczekiwana E(X) X = 1n

n∑i=1

Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny

mediana z próby zgodny asymptotycznie nieobciazony

Wariancja D2(X) S21 = 1

n

n∑i=1

(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗ = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie

odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-

tywny dla rozkładu normalnegowskaznik struktury Θ = k

n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny

bn =Γ( n

2 )√

2

Γ( n−12 )√

ncn =

n− 1

n=

Γ2( n2 ) · 2

Γ2( n−1n ) · n

Marek Ptak Statystyka 10 pazdziernika 2016 63 / 93

Page 171: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Badana cecha X populacji generalnej ma rozkład N(µ, σ) przy znanym σ.H : µ = µ0H1 : µ 6= µ0 (H1 : µ > µ0, H1 : µ < µ0)

Statystyka testowa U = X−µ0σ√

nma rozkład N(0, 1)

Marek Ptak Statystyka 10 pazdziernika 2016 64 / 93

Page 172: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Marek Ptak Statystyka 10 pazdziernika 2016 65 / 93

Page 173: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

PrzykładPewien automat w fabryce czekolady wytwarza tabliczki czekolady onominalnej wadze 250 g. Wiadomo, ze rozkład wagi produkowanychtabliczek jest normalny N(µ, σ), gdzie odchylenie standardowe wynosiσ = 5. Kontrola techniczna w pewnym dniu pobrała próbke losowa 16tabliczek czekolady i otrzymała nastepujace wyniki (w g):251, 2; 246, 1; 250, 1; 247, 1; 251, 2; 251, 2; 243, 2; 243, 1; 251, 1; 245, 2;251, 2; 245, 3; 242, 1; 250, 2; 246, 1; 252, 0. Czy (na poziomie istotnosciα = 0, 05) mozna stwierdzic, ze automat produkuje tabliczki czekolady owadze mniejszej niz nominalna?

Marek Ptak Statystyka 10 pazdziernika 2016 66 / 93

Page 174: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 247, 9uobl = x−µ0

σ

√n = 247,9−250

5

√16 = −1, 68

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Marek Ptak Statystyka 10 pazdziernika 2016 67 / 93

Page 175: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Poniewaz wartosc ta znalazła sie w obszarze krytycznym, gdyzuobl = −1, 68 < −1, 64 = uα, wiec hipoteze H0 nalezy odrzucic na korzyschipotezy alternatywnej H1. Oznacza to, ze z prawdopodobienstwem błedumniejszym niz 0, 05 mozemy twierdzic, ze srednia waga tabliczek czekoladyjest za niska.

Marek Ptak Statystyka 10 pazdziernika 2016 68 / 93

Page 176: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g,σ = 5, n = 16.Masa poszczególnych tabliczek czekolady (w g):251,2; 246,1; 250,0; 249,3; 247,5; 251,2; 245,1; 247,2; 251,9; 245,7; 250,7;244,4; 242,2; 250,3; 246,2; 252,1.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?

Marek Ptak Statystyka 10 pazdziernika 2016 69 / 93

Page 177: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 2uobl = x−µ0

σ

√n = 248,2−250

5

√16 = −1, 45

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 70 / 93

Page 178: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 2uobl = x−µ0

σ

√n = 248,2−250

5

√16 = −1, 45

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 70 / 93

Page 179: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g, σ = 5, n = 16Masa poszczególnych tabliczek czekolady (w g):249, 2; 248, 2; 243, 1; 249, 9; 248, 8; 249, 1; 249, 7; 245, 1; 248, 9; 247, 2;249, 3; 248, 6; 247, 5; 248, 2; 249, 1; 247, 1;.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?

Marek Ptak Statystyka 10 pazdziernika 2016 71 / 93

Page 180: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 1uobl = x−µ0

σ

√n = 248,1−250

5

√16 = −1, 55

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 55 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 72 / 93

Page 181: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 1uobl = x−µ0

σ

√n = 248,1−250

5

√16 = −1, 55

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 55 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 72 / 93

Page 182: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.

Wtedy zmienna losowa X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowymσ√

n

Wniosek

Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n

n∑i=1

Xi = 1n

n∑i=1

Xi ma

rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 73 / 93

Page 183: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.

Wtedy zmienna losowa X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowymσ√

n

Wniosek

Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n

n∑i=1

Xi = 1n

n∑i=1

Xi ma

rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 73 / 93

Page 184: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie

Jezeli X1, . . . ,Xn jest próba losowa o rozkładzie N(µ, σ), X = 1n

n∑i=1

Xi oraz

S2 = 1n

n∑i=1

(Xi − X)2, to zmienna losowa V = X−µS

√n− 1 ma rozkład

t–Studenta o (n− 1)–stopniach swobody.

Marek Ptak Statystyka 10 pazdziernika 2016 74 / 93

Page 185: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)

X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty

rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty rozkładu normalnego N(0, 1)

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 75 / 93

Page 186: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)

X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty

rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty rozkładu normalnego N(0, 1)

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 75 / 93

Page 187: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Pary zmiennych losowych

X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .

P(X = xi,Y = yi) = p(xi, yi)

X,Y ciagłe ∃ f : R2 → R, f > 0

P((X,Y) ∈ A) =

∫∫A

f (s, t) dsdt

FXY = P(X 6 x,Y 6 y) =

x∫−∞

y∫−∞

f (s, t) dsdt

Marek Ptak Statystyka 10 pazdziernika 2016 76 / 93

Page 188: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Pary zmiennych losowych

X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .

P(X = xi,Y = yi) = p(xi, yi)

X,Y ciagłe ∃ f : R2 → R, f > 0

P((X,Y) ∈ A) =

∫∫A

f (s, t) dsdt

FXY = P(X 6 x,Y 6 y) =

x∫−∞

y∫−∞

f (s, t) dsdt

Marek Ptak Statystyka 10 pazdziernika 2016 76 / 93

Page 189: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93

Page 190: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93

Page 191: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93

Page 192: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa o rozkładzie dyskretnym

σXY =∑

(xi,yi)∈WXY

(xi − E(X))(yi − E(Y)) · p(xi, yi)

Zmienna losowa o rozkładzie ciagłym

σXY =

+∞∫−∞

+∞∫−∞

(x− E(X))(y− E(Y))f (x, y) dxdy

σXX = σ2X

Marek Ptak Statystyka 10 pazdziernika 2016 78 / 93

Page 193: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Zmienna losowa o rozkładzie dyskretnym

σXY =∑

(xi,yi)∈WXY

(xi − E(X))(yi − E(Y)) · p(xi, yi)

Zmienna losowa o rozkładzie ciagłym

σXY =

+∞∫−∞

+∞∫−∞

(x− E(X))(y− E(Y))f (x, y) dxdy

σXX = σ2X

Marek Ptak Statystyka 10 pazdziernika 2016 78 / 93

Page 194: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0

DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y

ρ =cov(X,Y)

σXσY=

σXY

σXσY

Marek Ptak Statystyka 10 pazdziernika 2016 79 / 93

Page 195: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0

DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y

ρ =cov(X,Y)

σXσY=

σXY

σXσY

Marek Ptak Statystyka 10 pazdziernika 2016 79 / 93

Page 196: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

TwierdzenieX,Y – zmienne losowe

1 −1 6 ρ 6 1,2 a, b – stałe, b > 0, Y = a + bX =⇒ ρ = 1,3 a, b – stałe, b < 0, Y = a + bX =⇒ ρ = −1,4 X,Y – niezalezne ρ = 0.

Marek Ptak Statystyka 10 pazdziernika 2016 80 / 93

Page 197: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

(X1,Y1), . . . , (Xn,Yn) – próbaEstymatorem zgodnym współczynnika ρ jest współczynnik korelacji liniowejR z próby

R =

1n

n∑i=1

(Xi − X)(Yi − Y)

SXSY=

n∑i=1

(Xi − X)(Yi − Y)√n∑

i=1(Xi − X)2

√n∑

i=1(Yi − Y)2

R jest zgodny z estymatorem ρ, ale obciazony E(R) 6= ρ

R + R(1−R2)2(n−2) asymptotycznie nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 81 / 93

Page 198: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenie

Jezeli R =

1n

n∑i=1

(Xi−X)(Yi−Y)

SXSYjest współczynnikiem korelacji z próby złozonej z

n niezaleznych obserwacji i wylosowanej z dwuwymiarowej populacjigeneralnej normalnej, w której ρ = 0, wówczas zmienna losowa

V =R√

1− R2

√n− 2

ma rozkład t–Studenta o n− 2 stopniach swobody.

Marek Ptak Statystyka 10 pazdziernika 2016 82 / 93

Page 199: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Wartosc r współczynnika korelacji R obliczamy według wzoru:

r =

n∑i=1

(xi − x)(yi − y)√n∑

i=1(xi − x)2

√n∑

i=1(yi − y)2

=

1n

n∑i=1

xiyi − xy√1n

n∑i=1

x2i − x2

√1n

n∑i=1

y2i − y2

Marek Ptak Statystyka 10 pazdziernika 2016 83 / 93

Page 200: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Dla danych zgrupowanych w tablice korelacyjna wartosc r współczynnika Robliczamy według wzorów:

r =

1n

l∑i=1

m∑k=1

xi yknik − x y√√√√( 1n

l∑i=1

x2i ni· − x2

)(1n

m∑k=1

y2k n·k − y2

)

=

1n

l∑i=1

xi(m∑

k=1yknik)− x y√√√√( 1

n

l∑i=1

x2i ni· − x2

)(1n

m∑k=1

y2k n·k − y2

)

=

1n

m∑k=1

yk(l∑

i=1xinik)− x y√√√√( 1

n

l∑i=1

x2i ni· − x2

)(1n

m∑k=1

y2k n·k − y2

)

Marek Ptak Statystyka 10 pazdziernika 2016 84 / 93

Page 201: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Kowariancja z próby

cov(x, y) = s2XY = 1

n

∑xiyi − x y

cov(x, y) = s2XY = 1

n

l∑i=1

m∑k=1

xi yknik − x y

r =cov(x, y)

sX sY=

sXY

sX sY

Marek Ptak Statystyka 10 pazdziernika 2016 85 / 93

Page 202: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Model I.X,Y – zmienne o rozkładzie normalnymn > 3H0 : ρ = 0 H1 : ρ 6= 0przy załozeniu hipotezy statystyka testowa t = R√

1−R2

√n− 2 ma rozkład

t–studenta o n− 2 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 86 / 93

Page 203: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Metoda najmniejszych kwadratów

Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R

(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze

k∑i=1

|yi − f (xi)|2 = min

Marek Ptak Statystyka 10 pazdziernika 2016 87 / 93

Page 204: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Metoda najmniejszych kwadratów

Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R

(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze

k∑i=1

|yi − f (xi)|2 = min

Marek Ptak Statystyka 10 pazdziernika 2016 87 / 93

Page 205: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

F = y = f (·, a, b) : a, b ∈ R

Rozwazmy funkcje S(a, b) =k∑

i=1(yi − f (xi, a, b))2

∂S∂a = 0, ∂S

∂b = 0 warunek konieczny istnienia ekstremum

∂S∂a =

k∑i=1

2(yi − f (xi, a, b)) · ∂f∂a(xi, a, b)

∂S∂b =

k∑i=1

2(yi − f (xi, a, b)) · ∂f∂b(xi, a, b)

Marek Ptak Statystyka 10 pazdziernika 2016 88 / 93

Page 206: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Regresja liniowa

Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:

S(a, b) =

n∑i=1

(yi − (axi + b))2 = min MNK

∂S∂a = 0 ∂S

∂b = 0

a =

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2=

n s2XY

n s2X

=

n∑i=1

xiyi − x y

n∑i=1

x2i − nx2

b = y− ax

Marek Ptak Statystyka 10 pazdziernika 2016 89 / 93

Page 207: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Regresja liniowa

Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:

S(a, b) =

n∑i=1

(yi − (axi + b))2 = min MNK

∂S∂a = 0 ∂S

∂b = 0

a =

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2=

n s2XY

n s2X

=

n∑i=1

xiyi − x y

n∑i=1

x2i − nx2

b = y− ax

Marek Ptak Statystyka 10 pazdziernika 2016 89 / 93

Page 208: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

A =

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)2=

n∑i=1

XiYi − X Y

n∑i=1

X2i − nX2

B = Y − AX

A, B estymatory zgodne i nieobciazone wielkosci a, b

yi = axi + b + εi

εi – zmienna losowa

Marek Ptak Statystyka 10 pazdziernika 2016 90 / 93

Page 209: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

A =

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)2=

n∑i=1

XiYi − X Y

n∑i=1

X2i − nX2

B = Y − AX

A, B estymatory zgodne i nieobciazone wielkosci a, b

yi = axi + b + εi

εi – zmienna losowa

Marek Ptak Statystyka 10 pazdziernika 2016 90 / 93

Page 210: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√

nSX)

Statystyka t = A−a0SA

, gdzie S2A =

S2Y(1−R2)

S2X(n−2)

=

n∑i=1

(Yi−(AXi+B))2

(n−1)n∑

i=1(Xi−X)2

ma rozkład

t–Studenta o n− 2 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 91 / 93

Page 211: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√

nSX)

Statystyka t = A−a0SA

, gdzie S2A =

S2Y(1−R2)

S2X(n−2)

=

n∑i=1

(Yi−(AXi+B))2

(n−1)n∑

i=1(Xi−X)2

ma rozkład

t–Studenta o n− 2 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 91 / 93

Page 212: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyka B ma rozkład normalny

N

b, σ(

1n + X

n∑i=1

(Xi−X)2

) 12

Statystyka B−b0

SBma rozkład t–Studenta o n− 2 stopniach swobody

S2B =

S2Y(1− R2)

S2X(n− 2)

(S2X + X2

) = S2A

1n

n∑i=1

X2i =

n∑i=1

(Yi − (AXi + B))2

(n− 2)nn∑

i=1(Xi − X)2

Marek Ptak Statystyka 10 pazdziernika 2016 92 / 93

Page 213: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Statystyka B ma rozkład normalny

N

b, σ(

1n + X

n∑i=1

(Xi−X)2

) 12

Statystyka B−b0

SBma rozkład t–Studenta o n− 2 stopniach swobody

S2B =

S2Y(1− R2)

S2X(n− 2)

(S2X + X2

) = S2A

1n

n∑i=1

X2i =

n∑i=1

(Yi − (AXi + B))2

(n− 2)nn∑

i=1(Xi − X)2

Marek Ptak Statystyka 10 pazdziernika 2016 92 / 93

Page 214: Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka zajmuje sie˛ opisem zjawisk masowych przy pomocy metod rachunku prawdopodobienstwa.´

Wartosci obliczane z próby:x, y, s2

X , s2Y , sXY = cov(x, y)

s2A =

s2Y(1−r2)

s2X(n−2)

s2B = s2

A1n

n∑i=1

x2i

r = cov(x,y)sX sY

= sXYsX sY

a = sXYs2

Xb = y− ax

Marek Ptak Statystyka 10 pazdziernika 2016 93 / 93