Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

Post on 20-Aug-2020

2 views 0 download

Transcript of Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

Statystyczna analiza danych

Marek Ptak

10 pazdziernika 2016

Marek Ptak Statystyka 10 pazdziernika 2016 1 / 93

Czesc I

Wstep

Marek Ptak Statystyka 10 pazdziernika 2016 2 / 93

LITERATURAA. Łomnicki, Wprowadzenie do statystyki dla przyrodników

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski,Rachunek prawdopodobienstwa i statystyka matematyczna w zadaniach

J. Koronacki, J. Mieliczuk, Statystyka dla studentów kierunkówtechnicznych i przyrodniczych

G. E. Box, G. M. Jenkins, Analiza szeregów czasowych, PWN, Warszawa1983;

J. Józwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2012.

Marek Ptak Statystyka 10 pazdziernika 2016 3 / 93

Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.

PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?

Marek Ptak Statystyka 10 pazdziernika 2016 4 / 93

Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.

PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?

Marek Ptak Statystyka 10 pazdziernika 2016 4 / 93

PrzykładBadamy, która kapusta: biała czy czerwona zawiera wiecej witaminy C. Wpróbkach po 100 g otrzymano nastepujace wyniki (w mg): biała: 45, 50, 64,38, 66, 43, 49, 58, 31, 49 oraz czerwona: 70, 68, 55, 61, 62, 74, 52, 71, 56,61. Który z gatunków zawiera wiecej witaminy C?

Marek Ptak Statystyka 10 pazdziernika 2016 5 / 93

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93

X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =

(nk

)pk(1− p)n−k

P(X = 0) =(

100

)( 1

2 )0( 12 )10 = 1

1024 = 0, 000976563

P(X = 1) =(

101

)( 1

2 )1( 12 )9 = 10 · 1

2 ·1

512 = 5512 = 0, 009765625

P(X = 2) =(

102

)( 1

2 )2( 12 )8 = 45 · 1

4 ·1

256 = 451024 = 0, 043945313

P(X = 3) =(

103

)( 1

2 )3( 12 )7 = 120 · 1

8 ·1

128 = 15128 = 0, 1171875

P(X = 4) =(

104

)( 1

2 )4( 12 )6 = 210 · 1

16 ·164 = 105

512 = 0, 205078125

P(X = 5) =(

105

)( 1

2 )5( 12 )5 = 252 · 1

32 ·132 = 63

256 = 0, 24609375

P(X = 6) =(

106

)( 1

2 )6( 12 )4 = 210 · 1

64 ·116 = 105

512 = 0, 205078125

P(X = 7) =(

107

)( 1

2 )7( 12 )3 = 120 · 1

128 ·18 = 15

128 = 0, 1171875

P(X = 8) =(

108

)( 1

2 )8( 12 )2 = 45 · 1

256 ·14 = 45

1024 = 0, 043945313

P(X = 9) =(

109

)( 1

2 )9( 12 )1 = 10 · 1

512 ·12 = 5

512 = 0, 009765625

P(X = 10) =(

1010

)( 1

2 )10( 12 )0 = 1

1024 = 0, 000976563

Marek Ptak Statystyka 10 pazdziernika 2016 8 / 93

X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =

(nk

)pk(1− p)n−k

P(X = 0) =(

100

)( 1

2 )0( 12 )10 = 1

1024 = 0, 000976563

P(X = 1) =(

101

)( 1

2 )1( 12 )9 = 10 · 1

2 ·1

512 = 5512 = 0, 009765625

P(X = 2) =(

102

)( 1

2 )2( 12 )8 = 45 · 1

4 ·1

256 = 451024 = 0, 043945313

P(X = 3) =(

103

)( 1

2 )3( 12 )7 = 120 · 1

8 ·1

128 = 15128 = 0, 1171875

P(X = 4) =(

104

)( 1

2 )4( 12 )6 = 210 · 1

16 ·164 = 105

512 = 0, 205078125

P(X = 5) =(

105

)( 1

2 )5( 12 )5 = 252 · 1

32 ·132 = 63

256 = 0, 24609375

P(X = 6) =(

106

)( 1

2 )6( 12 )4 = 210 · 1

64 ·116 = 105

512 = 0, 205078125

P(X = 7) =(

107

)( 1

2 )7( 12 )3 = 120 · 1

128 ·18 = 15

128 = 0, 1171875

P(X = 8) =(

108

)( 1

2 )8( 12 )2 = 45 · 1

256 ·14 = 45

1024 = 0, 043945313

P(X = 9) =(

109

)( 1

2 )9( 12 )1 = 10 · 1

512 ·12 = 5

512 = 0, 009765625

P(X = 10) =(

1010

)( 1

2 )10( 12 )0 = 1

1024 = 0, 000976563

Marek Ptak Statystyka 10 pazdziernika 2016 8 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 3 : 2, tzn, czy rozkład jest dwumianowy.

P(X = 0) =(

100

)( 3

5 )0( 25 )10 = 0, 000105

P(X = 1) =(

101

)( 3

5 )1( 25 )9 = 0, 001573

P(X = 2) =(

102

)( 3

5 )2( 25 )8 = 0, 010617

P(X = 3) =(

103

)( 3

5 )3( 25 )7 = 0, 042467

P(X = 4) =(

104

)( 3

5 )4( 25 )6 = 0, 111477

P(X = 5) =(

105

)( 3

5 )5( 25 )5 = 0, 200658

P(X = 6) =(

106

)( 3

5 )6( 25 )4 = 0, 250823

P(X = 7) =(

107

)( 3

5 )7( 25 )3 = 0, 214991

P(X = 8) =(

108

)( 3

5 )8( 25 )2 = 0, 120932

P(X = 9) =(

109

)( 3

5 )9( 25 )1 = 0, 040311

P(X = 10) =(

1010

)( 3

5 )10( 25 )0 = 0, 006047

Marek Ptak Statystyka 10 pazdziernika 2016 9 / 93

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 3 : 2, tzn, czy rozkład jest dwumianowy.

P(X = 0) =(

100

)( 3

5 )0( 25 )10 = 0, 000105

P(X = 1) =(

101

)( 3

5 )1( 25 )9 = 0, 001573

P(X = 2) =(

102

)( 3

5 )2( 25 )8 = 0, 010617

P(X = 3) =(

103

)( 3

5 )3( 25 )7 = 0, 042467

P(X = 4) =(

104

)( 3

5 )4( 25 )6 = 0, 111477

P(X = 5) =(

105

)( 3

5 )5( 25 )5 = 0, 200658

P(X = 6) =(

106

)( 3

5 )6( 25 )4 = 0, 250823

P(X = 7) =(

107

)( 3

5 )7( 25 )3 = 0, 214991

P(X = 8) =(

108

)( 3

5 )8( 25 )2 = 0, 120932

P(X = 9) =(

109

)( 3

5 )9( 25 )1 = 0, 040311

P(X = 10) =(

1010

)( 3

5 )10( 25 )0 = 0, 006047

Marek Ptak Statystyka 10 pazdziernika 2016 9 / 93

Czesc II

Rachunek prawdopodobienstwa

Marek Ptak Statystyka 10 pazdziernika 2016 10 / 93

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

p(xi)

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(xi)

Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93

Dystrybuanta zmiennej losowej X

F(x) =

0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 18 / 93

Dystrybuanta zmiennej losowej X

F(x) =

0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 18 / 93

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

xipi

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

xi6xp

P(X = xi)

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

(nk

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

p2

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93

Rozkład hipergeometryczny

Zmienna typu skokowego o rozkładzie prawdopodobienstwa

P(X = k) =(n

k)(N−Mn−k )

(Nn)

EX = np D2X = np(1− p)(N−n

N−1

)p = M

N

Marek Ptak Statystyka 10 pazdziernika 2016 24 / 93

Rozkład hipergeometryczny

Zmienna typu skokowego o rozkładzie prawdopodobienstwa

P(X = k) =(n

k)(N−Mn−k )

(Nn)

EX = np D2X = np(1− p)(N−n

N−1

)p = M

N

Marek Ptak Statystyka 10 pazdziernika 2016 24 / 93

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93

Twierdzenief : R→ R – gestosc zmiennej losowej, f ciagła w x0. Wtedy

F′X(x) = f (x)

Marek Ptak Statystyka 10 pazdziernika 2016 26 / 93

Przykład

f (t) =

23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.

Dystrybuanta ma postac

F(x) =

0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 27 / 93

Przykład

f (t) =

23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.

Dystrybuanta ma postac

F(x) =

0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.

Marek Ptak Statystyka 10 pazdziernika 2016 27 / 93

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Zmienna losowa typu ciagłego

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

Współczynnik zmiennosci τX = DXEX

Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93

Rozkład równomierny

f (x) =

1

b−a dla x ∈ [a, b],

0 dla x /∈ [a, b].F(x) =

0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.

E(X) = a+b2 D2(X) = (b−a)2

12

Marek Ptak Statystyka 10 pazdziernika 2016 29 / 93

Rozkład równomierny

f (x) =

1

b−a dla x ∈ [a, b],

0 dla x /∈ [a, b].F(x) =

0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.

E(X) = a+b2 D2(X) = (b−a)2

12

Marek Ptak Statystyka 10 pazdziernika 2016 29 / 93

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Rozkład Cauchy’ego

f (x) = 1π

11+x2

Zmienna typu ciagłego o gestoscif (x) = 1

πλ

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93

Rozkład normalny N(µ, σ)

f (x) = 1√2π

e−x2

2

f (x) = 1√2πσ

e−(x−µ)2

2σ2 , F(x) = Φ(x) = 1√2π

x∫−∞

e−t22 dt

EX = µ D2X = σ2

Marek Ptak Statystyka 10 pazdziernika 2016 32 / 93

Rozkład normalny N(µ, σ)

f (x) = 1√2π

e−x2

2

f (x) = 1√2πσ

e−(x−µ)2

2σ2 , F(x) = Φ(x) = 1√2π

x∫−∞

e−t22 dt

EX = µ D2X = σ2

Marek Ptak Statystyka 10 pazdziernika 2016 32 / 93

TwierdzenieX – zmienna o rozkładzie normalnym N(µ, σ) to EX = µ, D2X = σ2. PonadtoZ = X−µ

σ ma rozkład N(0, 1), tzn EZ = 0, D2Z = 1.

Marek Ptak Statystyka 10 pazdziernika 2016 33 / 93

Dystrybuanta standaryzowanego rozkładu normalnego, Φ(x) = 1√2π

x∫−∞

e−12 t2 dt, x > 0

x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

Marek Ptak Statystyka 10 pazdziernika 2016 34 / 93

Dla rozkładu normalnego zachodzi tzw.

Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ

σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027

Marek Ptak Statystyka 10 pazdziernika 2016 35 / 93

Dla rozkładu normalnego zachodzi tzw.

Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ

σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027

Marek Ptak Statystyka 10 pazdziernika 2016 35 / 93

TwierdzenieNiech X1, . . . ,Xn beda zmiennymi losowymi o tym samym rozkładzienormalnym N(µ, σ). Wtedy zmienna Z = 1

n(X1 + · · ·+ Xn) ma rozkładN(µ, σ√

n).

Marek Ptak Statystyka 10 pazdziernika 2016 36 / 93

Rozkład logarytmiczno-normalny

Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)

f (y) = 1yσ√

2πe−

(ln y−µ)2

2σ2

Marek Ptak Statystyka 10 pazdziernika 2016 37 / 93

Rozkład logarytmiczno-normalny

Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)

f (y) = 1yσ√

2πe−

(ln y−µ)2

2σ2

Marek Ptak Statystyka 10 pazdziernika 2016 37 / 93

Rozkład t–Studenta o n− 1 stopniach swobody

Zmienna losowa o gestosci

f (x) =Γ[(n + 1)/2]√

nπ Γ(n/2)

(1 +

x2

n

)−(n+1)/2

, x ∈ R, n ∈ N

gdzie

Γ(r) =

+∞∫0

xr−1 e−x dx, r > 0

Marek Ptak Statystyka 10 pazdziernika 2016 38 / 93

Rozkład t–Studenta o n− 1 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 39 / 93

Wartosci krytyczne rozkładu t-Studenta, P(|T| > tα; r) = α

α

r 0,8 0,6 0,4 0,2 0,1 0,05 0,04 0,02 0,01 0,002 0,0011 0,325 0,727 1,376 3,078 6,314 12,706 15,894 31,821 63,656 318,29 636,582 0,289 0,617 1,061 1,886 2,920 4,303 4,849 6,965 9,925 22,328 31,6003 0,277 0,584 0,978 1,638 2,353 3,182 3,482 4,541 5,841 10,214 12,9244 0,271 0,569 0,941 1,533 2,132 2,776 2,999 3,747 4,604 7,173 8,6105 0,267 0,559 0,920 1,476 2,015 2,571 2,757 3,365 4,032 5,894 6,8696 0,265 0,553 0,906 1,440 1,943 2,447 2,612 3,143 3,707 5,208 5,9597 0,263 0,549 0,896 1,415 1,895 2,365 2,517 2,998 3,499 4,785 5,4088 0,262 0,546 0,889 1,397 1,860 2,306 2,449 2,896 3,355 4,501 5,0419 0,261 0,543 0,883 1,383 1,833 2,262 2,398 2,821 3,250 4,297 4,781

10 0,260 0,542 0,879 1,372 1,812 2,228 2,359 2,764 3,169 4,144 4,58711 0,260 0,540 0,876 1,363 1,796 2,201 2,328 2,718 3,106 4,025 4,43712 0,259 0,539 0,873 1,356 1,782 2,179 2,303 2,681 3,055 3,930 4,31813 0,259 0,538 0,870 1,350 1,771 2,160 2,282 2,650 3,012 3,852 4,22114 0,258 0,537 0,868 1,345 1,761 2,145 2,264 2,624 2,977 3,787 4,14015 0,258 0,536 0,866 1,341 1,753 2,131 2,249 2,602 2,947 3,733 4,07316 0,258 0,535 0,865 1,337 1,746 2,120 2,235 2,583 2,921 3,686 4,01517 0,257 0,534 0,863 1,333 1,740 2,110 2,224 2,567 2,898 3,646 3,96518 0,257 0,534 0,862 1,330 1,734 2,101 2,214 2,552 2,878 3,610 3,92219 0,257 0,533 0,861 1,328 1,729 2,093 2,205 2,539 2,861 3,579 3,88320 0,257 0,533 0,860 1,325 1,725 2,086 2,197 2,528 2,845 3,552 3,85021 0,257 0,532 0,859 1,323 1,721 2,080 2,189 2,518 2,831 3,527 3,81922 0,256 0,532 0,858 1,321 1,717 2,074 2,183 2,508 2,819 3,505 3,79223 0,256 0,532 0,858 1,319 1,714 2,069 2,177 2,500 2,807 3,485 3,76824 0,256 0,531 0,857 1,318 1,711 2,064 2,172 2,492 2,797 3,467 3,74525 0,256 0,531 0,856 1,316 1,708 2,060 2,167 2,485 2,787 3,450 3,72526 0,256 0,531 0,856 1,315 1,706 2,056 2,162 2,479 2,779 3,435 3,70727 0,256 0,531 0,855 1,314 1,703 2,052 2,158 2,473 2,771 3,421 3,68928 0,256 0,530 0,855 1,313 1,701 2,048 2,154 2,467 2,763 3,408 3,67429 0,256 0,530 0,854 1,311 1,699 2,045 2,150 2,462 2,756 3,396 3,66030 0,256 0,530 0,854 1,310 1,697 2,042 2,147 2,457 2,750 3,385 3,64635 0,255 0,529 0,852 1,306 1,690 2,030 2,133 2,438 2,724 3,340 3,59140 0,255 0,529 0,851 1,303 1,684 2,021 2,123 2,423 2,704 3,307 3,55145 0,255 0,528 0,850 1,301 1,679 2,014 2,115 2,412 2,690 3,281 3,52050 0,255 0,528 0,849 1,299 1,676 2,009 2,109 2,403 2,678 3,261 3,49660 0,254 0,527 0,848 1,296 1,671 2,000 2,099 2,390 2,660 3,232 3,46070 0,254 0,527 0,847 1,294 1,667 1,994 2,093 2,381 2,648 3,211 3,43580 0,254 0,526 0,846 1,292 1,664 1,990 2,088 2,374 2,639 3,195 3,41690 0,254 0,526 0,846 1,291 1,662 1,987 2,084 2,368 2,632 3,183 3,402100 0,254 0,526 0,845 1,290 1,660 1,984 2,081 2,364 2,626 3,174 3,390120 0,254 0,526 0,845 1,289 1,658 1,980 2,076 2,358 2,617 3,160 3,373∞ 0,253 0,524 0,842 1,282 1,645 1,960 2,054 2,327 2,576 3,091 3,291

Marek Ptak Statystyka 10 pazdziernika 2016 40 / 93

Rozkład χ2 o n stopniach swobody

Zmienna o gestosci

f (x) =

1

2n/2Γ(n/2)x

12 k−1 e−

12 x2, gdy x > 0,

0, gdy x 6 0

Marek Ptak Statystyka 10 pazdziernika 2016 41 / 93

Wartosci krytyczne rozkładu χ2, P(χ2 > χ2α; r) = α

α

r 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0,0011 0,000 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 10,8272 0,002 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 13,8153 0,024 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 16,2664 0,091 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 18,4665 0,210 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750 20,5156 0,381 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 22,4577 0,599 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 24,3218 0,857 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 26,1249 1,152 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 27,877

10 1,479 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 29,58811 1,834 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 31,26412 2,214 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 32,90913 2,617 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819 34,52714 3,041 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 36,12415 3,483 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 37,69816 3,942 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 39,25217 4,416 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 40,79118 4,905 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 42,31219 5,407 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 43,81920 5,921 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 45,31421 6,447 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 46,79622 6,983 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 48,26823 7,529 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 49,72824 8,085 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558 51,17925 8,649 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 52,61926 9,222 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 54,05127 9,803 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 55,47528 10,391 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994 56,89229 10,986 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335 58,30130 11,588 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 59,70235 14,688 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 66,61940 17,917 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 73,40345 21,251 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 80,07850 24,674 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 86,66060 31,738 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 99,60870 39,036 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,43 104,21 112,3280 46,520 51,172 53,540 57,153 60,391 64,278 96,578 101,88 106,63 112,33 116,32 124,8490 54,156 59,196 61,754 65,647 69,126 73,291 107,57 113,15 118,14 124,12 128,30 137,21100 61,918 67,328 70,065 74,222 77,929 82,358 118,50 124,34 129,56 135,81 140,17 149,45120 77,756 83,852 86,923 91,573 95,705 100,62 140,23 146,57 152,21 158,95 163,65 173,62140 93,925 100,65 104,03 109,14 113,66 119,03 161,83 168,61 174,65 181,84 186,85 197,45

Marek Ptak Statystyka 10 pazdziernika 2016 42 / 93

Rozkład Weibulla

Zmienna o gestosci

f (x) =

λp xp−1e−λxp

, gdy x > 0,0, gdy x 6 0

p, λ > 0

EX = λ− 1

p

(1p + 1

)D2X = λ

− 2p

Γ(2

p + 1)− [Γ( 1p)]2,

gdzie Γ(r) =+∞∫0

xr−1e−x dx, r > 0

Marek Ptak Statystyka 10 pazdziernika 2016 43 / 93

Rozkład Weibulla

Zmienna o gestosci

f (x) =

λp xp−1e−λxp

, gdy x > 0,0, gdy x 6 0

p, λ > 0

EX = λ− 1

p

(1p + 1

)D2X = λ

− 2p

Γ(2

p + 1)− [Γ(1p)]2,

gdzie Γ(r) =+∞∫0

xr−1e−x dx, r > 0

Marek Ptak Statystyka 10 pazdziernika 2016 43 / 93

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

Marek Ptak Statystyka 10 pazdziernika 2016 44 / 93

TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa

X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowym σ√n .

WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie

normalnym N(µ, σ), to X = 1n

n∑i=1

Xi ma rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 45 / 93

TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa

X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowym σ√n .

WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie

normalnym N(µ, σ), to X = 1n

n∑i=1

Xi ma rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 45 / 93

TwierdzenieJezeli X1, . . . ,Xn to niezalezne zmienne losowe o rozkładzie N(µ, σ),

X = 1n

n∑i=1

Xi oraz S2 = 1n

n∑i=1

(Xi − X)2, to zmienna losowa V = X−µS

√n− 1

ma rozkład t–Studenta o (n− 1)–stopniach swobody.

Marek Ptak Statystyka 10 pazdziernika 2016 46 / 93

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego

N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty

rozkładu normalnego N(0, 1).

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 47 / 93

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego

N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty

rozkładu normalnego N(0, 1).

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 47 / 93

Czesc III

Statystyka

Marek Ptak Statystyka 10 pazdziernika 2016 48 / 93

Populacja to zbiór, który badamy

DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.

Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)

Marek Ptak Statystyka 10 pazdziernika 2016 49 / 93

Populacja to zbiór, który badamy

DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.

Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)

Marek Ptak Statystyka 10 pazdziernika 2016 49 / 93

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

√n

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

xini

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

k

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

(1n

n∑i=1

1xi

)−1

h =

(1n

k∑i=1

nixi

)−1

Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93

Mediana (wartosc srodkowa) me x1 6 x2 6 · · · 6 xn

me =

x(n+1)/2, gdy n nieparzyste,12(xn/2 + xn/2+1), gdy n parzyste.

Wartosc modalna (moda, dominanta) m0 próbki x1, . . . , xn

o powtarzajacych sie wartosciach to najczesciej powtarzajaca sie wartosc.

Marek Ptak Statystyka 10 pazdziernika 2016 51 / 93

Dla szeregu rozdzielczego

me = xl +b

nm

(n2−

m−1∑i=1

ni

),

gdzie xl – lewy koniec klasy zawierajacej mediane,m – numer klasy zawierajacej mediane,n – licznosc próbki,ni – licznosc i-tej próbki,b – długosc klasy.Moda – srodek najliczniejszej klasy.

Marek Ptak Statystyka 10 pazdziernika 2016 52 / 93

Miary rozproszenia (rozrzutu, rozsiania)

Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki

S2 = 1n

n∑i=1

(xi − x)2 = 1n

n∑i=1

x2i − x2 S2 = 1

n

n∑i=1

(xi − x)2ni

Odchylenie standardowe S

S∗2 = 1n−1

n∑i=1

(xi − x)2 S∗2 = 1n−1

n∑i=1

ni(xi − x)2

Marek Ptak Statystyka 10 pazdziernika 2016 53 / 93

Miary rozproszenia (rozrzutu, rozsiania)

Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki

S2 = 1n

n∑i=1

(xi − x)2 = 1n

n∑i=1

x2i − x2 S2 = 1

n

n∑i=1

(xi − x)2ni

Odchylenie standardowe S

S∗2 = 1n−1

n∑i=1

(xi − x)2 S∗2 = 1n−1

n∑i=1

ni(xi − x)2

Marek Ptak Statystyka 10 pazdziernika 2016 53 / 93

Miary rozproszenia (rozrzutu, rozsiania)

Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki

d1 = 1n

n∑i=1

|xi − x| d1 = 1n

k∑i=1

ni |xi − x|

Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi

od mediany me próbki

d2 = 1n

n∑i=1

|xi − me| d2 = 1n

k∑i=1

ni|xi − me|

Marek Ptak Statystyka 10 pazdziernika 2016 54 / 93

Miary rozproszenia (rozrzutu, rozsiania)

Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki

d1 = 1n

n∑i=1

|xi − x| d1 = 1n

k∑i=1

ni |xi − x|

Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi

od mediany me próbki

d2 = 1n

n∑i=1

|xi − me| d2 = 1n

k∑i=1

ni|xi − me|

Marek Ptak Statystyka 10 pazdziernika 2016 54 / 93

Miary rozproszenia (rozrzutu, rozsiania)

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

n

k∑i=1

nixri

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93

Miary rozproszenia (rozrzutu, rozsiania)

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

n

k∑i=1

nixri

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93

Miary rozproszenia (rozrzutu, rozsiania)

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

n

k∑i=1

nixri

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93

Miary rozproszenia (rozrzutu, rozsiania)

Współczynnik skosnosci (asymetrii)

γ1 =M3

S3

Współczynnik koncentracji (skupienia)

K =M4

S4

Marek Ptak Statystyka 10 pazdziernika 2016 56 / 93

Miary rozproszenia (rozrzutu, rozsiania)

Współczynnik skosnosci (asymetrii)

γ1 =M3

S3

Współczynnik koncentracji (skupienia)

K =M4

S4

Marek Ptak Statystyka 10 pazdziernika 2016 56 / 93

PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.

n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.

Marek Ptak Statystyka 10 pazdziernika 2016 57 / 93

PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.

n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.

Marek Ptak Statystyka 10 pazdziernika 2016 57 / 93

Szereg rozdzielczy

Nr klasy KlasyGrupowaniewartosci próbki Srodki klas xi

Liczebnosciklas ni

1 2,95-3,45 |||| 3,2 42 3,45-3,95 ||||| 3,7 53 3,95-4,45 ||||| || 4,2 74 4,45-4,95 ||||| |||| 4,7 95 4,95-5,45 ||||| ||||| || 5,2 126 5,45-5,95 ||||| ||| 5,7 87 5,95-6,45 ||||| 6,2 5

Marek Ptak Statystyka 10 pazdziernika 2016 58 / 93

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

n

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93

Nieznany parametr Estymator Własnosci

Wartosc oczekiwana E(X) X = 1n

n∑i=1

Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny

mediana z próby zgodny asymptotycznie nieobciazony

Wariancja D2(X) S21 = 1

n

n∑i=1

(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗ = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie

odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-

tywny dla rozkładu normalnegowskaznik struktury Θ = k

n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny

bn =Γ( n

2 )√

2

Γ( n−12 )√

ncn =

n− 1

n=

Γ2( n2 ) · 2

Γ2( n−1n ) · n

Marek Ptak Statystyka 10 pazdziernika 2016 63 / 93

Nieznany parametr Estymator Własnosci

Wartosc oczekiwana E(X) X = 1n

n∑i=1

Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny

mediana z próby zgodny asymptotycznie nieobciazony

Wariancja D2(X) S21 = 1

n

n∑i=1

(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗ = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie

odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-

tywny dla rozkładu normalnegowskaznik struktury Θ = k

n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny

bn =Γ( n

2 )√

2

Γ( n−12 )√

ncn =

n− 1

n=

Γ2( n2 ) · 2

Γ2( n−1n ) · n

Marek Ptak Statystyka 10 pazdziernika 2016 63 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Badana cecha X populacji generalnej ma rozkład N(µ, σ) przy znanym σ.H : µ = µ0H1 : µ 6= µ0 (H1 : µ > µ0, H1 : µ < µ0)

Statystyka testowa U = X−µ0σ√

nma rozkład N(0, 1)

Marek Ptak Statystyka 10 pazdziernika 2016 64 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Marek Ptak Statystyka 10 pazdziernika 2016 65 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

PrzykładPewien automat w fabryce czekolady wytwarza tabliczki czekolady onominalnej wadze 250 g. Wiadomo, ze rozkład wagi produkowanychtabliczek jest normalny N(µ, σ), gdzie odchylenie standardowe wynosiσ = 5. Kontrola techniczna w pewnym dniu pobrała próbke losowa 16tabliczek czekolady i otrzymała nastepujace wyniki (w g):251, 2; 246, 1; 250, 1; 247, 1; 251, 2; 251, 2; 243, 2; 243, 1; 251, 1; 245, 2;251, 2; 245, 3; 242, 1; 250, 2; 246, 1; 252, 0. Czy (na poziomie istotnosciα = 0, 05) mozna stwierdzic, ze automat produkuje tabliczki czekolady owadze mniejszej niz nominalna?

Marek Ptak Statystyka 10 pazdziernika 2016 66 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 247, 9uobl = x−µ0

σ

√n = 247,9−250

5

√16 = −1, 68

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Marek Ptak Statystyka 10 pazdziernika 2016 67 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Poniewaz wartosc ta znalazła sie w obszarze krytycznym, gdyzuobl = −1, 68 < −1, 64 = uα, wiec hipoteze H0 nalezy odrzucic na korzyschipotezy alternatywnej H1. Oznacza to, ze z prawdopodobienstwem błedumniejszym niz 0, 05 mozemy twierdzic, ze srednia waga tabliczek czekoladyjest za niska.

Marek Ptak Statystyka 10 pazdziernika 2016 68 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g,σ = 5, n = 16.Masa poszczególnych tabliczek czekolady (w g):251,2; 246,1; 250,0; 249,3; 247,5; 251,2; 245,1; 247,2; 251,9; 245,7; 250,7;244,4; 242,2; 250,3; 246,2; 252,1.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?

Marek Ptak Statystyka 10 pazdziernika 2016 69 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 2uobl = x−µ0

σ

√n = 248,2−250

5

√16 = −1, 45

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 70 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 2uobl = x−µ0

σ

√n = 248,2−250

5

√16 = −1, 45

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 70 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g, σ = 5, n = 16Masa poszczególnych tabliczek czekolady (w g):249, 2; 248, 2; 243, 1; 249, 9; 248, 8; 249, 1; 249, 7; 245, 1; 248, 9; 247, 2;249, 3; 248, 6; 247, 5; 248, 2; 249, 1; 247, 1;.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?

Marek Ptak Statystyka 10 pazdziernika 2016 71 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 1uobl = x−µ0

σ

√n = 248,1−250

5

√16 = −1, 55

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 55 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 72 / 93

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 248, 1uobl = x−µ0

σ

√n = 248,1−250

5

√16 = −1, 55

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 55 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

Marek Ptak Statystyka 10 pazdziernika 2016 72 / 93

TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.

Wtedy zmienna losowa X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowymσ√

n

Wniosek

Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n

n∑i=1

Xi = 1n

n∑i=1

Xi ma

rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 73 / 93

TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.

Wtedy zmienna losowa X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowymσ√

n

Wniosek

Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n

n∑i=1

Xi = 1n

n∑i=1

Xi ma

rozkład N(µ, σ√n).

Marek Ptak Statystyka 10 pazdziernika 2016 73 / 93

Twierdzenie

Jezeli X1, . . . ,Xn jest próba losowa o rozkładzie N(µ, σ), X = 1n

n∑i=1

Xi oraz

S2 = 1n

n∑i=1

(Xi − X)2, to zmienna losowa V = X−µS

√n− 1 ma rozkład

t–Studenta o (n− 1)–stopniach swobody.

Marek Ptak Statystyka 10 pazdziernika 2016 74 / 93

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)

X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty

rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty rozkładu normalnego N(0, 1)

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 75 / 93

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)

X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty

rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty rozkładu normalnego N(0, 1)

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Marek Ptak Statystyka 10 pazdziernika 2016 75 / 93

Pary zmiennych losowych

X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .

P(X = xi,Y = yi) = p(xi, yi)

X,Y ciagłe ∃ f : R2 → R, f > 0

P((X,Y) ∈ A) =

∫∫A

f (s, t) dsdt

FXY = P(X 6 x,Y 6 y) =

x∫−∞

y∫−∞

f (s, t) dsdt

Marek Ptak Statystyka 10 pazdziernika 2016 76 / 93

Pary zmiennych losowych

X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .

P(X = xi,Y = yi) = p(xi, yi)

X,Y ciagłe ∃ f : R2 → R, f > 0

P((X,Y) ∈ A) =

∫∫A

f (s, t) dsdt

FXY = P(X 6 x,Y 6 y) =

x∫−∞

y∫−∞

f (s, t) dsdt

Marek Ptak Statystyka 10 pazdziernika 2016 76 / 93

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93

Zmienna losowa o rozkładzie dyskretnym

σXY =∑

(xi,yi)∈WXY

(xi − E(X))(yi − E(Y)) · p(xi, yi)

Zmienna losowa o rozkładzie ciagłym

σXY =

+∞∫−∞

+∞∫−∞

(x− E(X))(y− E(Y))f (x, y) dxdy

σXX = σ2X

Marek Ptak Statystyka 10 pazdziernika 2016 78 / 93

Zmienna losowa o rozkładzie dyskretnym

σXY =∑

(xi,yi)∈WXY

(xi − E(X))(yi − E(Y)) · p(xi, yi)

Zmienna losowa o rozkładzie ciagłym

σXY =

+∞∫−∞

+∞∫−∞

(x− E(X))(y− E(Y))f (x, y) dxdy

σXX = σ2X

Marek Ptak Statystyka 10 pazdziernika 2016 78 / 93

TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0

DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y

ρ =cov(X,Y)

σXσY=

σXY

σXσY

Marek Ptak Statystyka 10 pazdziernika 2016 79 / 93

TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0

DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y

ρ =cov(X,Y)

σXσY=

σXY

σXσY

Marek Ptak Statystyka 10 pazdziernika 2016 79 / 93

TwierdzenieX,Y – zmienne losowe

1 −1 6 ρ 6 1,2 a, b – stałe, b > 0, Y = a + bX =⇒ ρ = 1,3 a, b – stałe, b < 0, Y = a + bX =⇒ ρ = −1,4 X,Y – niezalezne ρ = 0.

Marek Ptak Statystyka 10 pazdziernika 2016 80 / 93

(X1,Y1), . . . , (Xn,Yn) – próbaEstymatorem zgodnym współczynnika ρ jest współczynnik korelacji liniowejR z próby

R =

1n

n∑i=1

(Xi − X)(Yi − Y)

SXSY=

n∑i=1

(Xi − X)(Yi − Y)√n∑

i=1(Xi − X)2

√n∑

i=1(Yi − Y)2

R jest zgodny z estymatorem ρ, ale obciazony E(R) 6= ρ

R + R(1−R2)2(n−2) asymptotycznie nieobciazony

Marek Ptak Statystyka 10 pazdziernika 2016 81 / 93

Twierdzenie

Jezeli R =

1n

n∑i=1

(Xi−X)(Yi−Y)

SXSYjest współczynnikiem korelacji z próby złozonej z

n niezaleznych obserwacji i wylosowanej z dwuwymiarowej populacjigeneralnej normalnej, w której ρ = 0, wówczas zmienna losowa

V =R√

1− R2

√n− 2

ma rozkład t–Studenta o n− 2 stopniach swobody.

Marek Ptak Statystyka 10 pazdziernika 2016 82 / 93

Wartosc r współczynnika korelacji R obliczamy według wzoru:

r =

n∑i=1

(xi − x)(yi − y)√n∑

i=1(xi − x)2

√n∑

i=1(yi − y)2

=

1n

n∑i=1

xiyi − xy√1n

n∑i=1

x2i − x2

√1n

n∑i=1

y2i − y2

Marek Ptak Statystyka 10 pazdziernika 2016 83 / 93

Dla danych zgrupowanych w tablice korelacyjna wartosc r współczynnika Robliczamy według wzorów:

r =

1n

l∑i=1

m∑k=1

xi yknik − x y√√√√( 1n

l∑i=1

x2i ni· − x2

)(1n

m∑k=1

y2k n·k − y2

)

=

1n

l∑i=1

xi(m∑

k=1yknik)− x y√√√√( 1

n

l∑i=1

x2i ni· − x2

)(1n

m∑k=1

y2k n·k − y2

)

=

1n

m∑k=1

yk(l∑

i=1xinik)− x y√√√√( 1

n

l∑i=1

x2i ni· − x2

)(1n

m∑k=1

y2k n·k − y2

)

Marek Ptak Statystyka 10 pazdziernika 2016 84 / 93

Kowariancja z próby

cov(x, y) = s2XY = 1

n

∑xiyi − x y

cov(x, y) = s2XY = 1

n

l∑i=1

m∑k=1

xi yknik − x y

r =cov(x, y)

sX sY=

sXY

sX sY

Marek Ptak Statystyka 10 pazdziernika 2016 85 / 93

Model I.X,Y – zmienne o rozkładzie normalnymn > 3H0 : ρ = 0 H1 : ρ 6= 0przy załozeniu hipotezy statystyka testowa t = R√

1−R2

√n− 2 ma rozkład

t–studenta o n− 2 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 86 / 93

Metoda najmniejszych kwadratów

Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R

(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze

k∑i=1

|yi − f (xi)|2 = min

Marek Ptak Statystyka 10 pazdziernika 2016 87 / 93

Metoda najmniejszych kwadratów

Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R

(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze

k∑i=1

|yi − f (xi)|2 = min

Marek Ptak Statystyka 10 pazdziernika 2016 87 / 93

F = y = f (·, a, b) : a, b ∈ R

Rozwazmy funkcje S(a, b) =k∑

i=1(yi − f (xi, a, b))2

∂S∂a = 0, ∂S

∂b = 0 warunek konieczny istnienia ekstremum

∂S∂a =

k∑i=1

2(yi − f (xi, a, b)) · ∂f∂a(xi, a, b)

∂S∂b =

k∑i=1

2(yi − f (xi, a, b)) · ∂f∂b(xi, a, b)

Marek Ptak Statystyka 10 pazdziernika 2016 88 / 93

Regresja liniowa

Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:

S(a, b) =

n∑i=1

(yi − (axi + b))2 = min MNK

∂S∂a = 0 ∂S

∂b = 0

a =

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2=

n s2XY

n s2X

=

n∑i=1

xiyi − x y

n∑i=1

x2i − nx2

b = y− ax

Marek Ptak Statystyka 10 pazdziernika 2016 89 / 93

Regresja liniowa

Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:

S(a, b) =

n∑i=1

(yi − (axi + b))2 = min MNK

∂S∂a = 0 ∂S

∂b = 0

a =

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2=

n s2XY

n s2X

=

n∑i=1

xiyi − x y

n∑i=1

x2i − nx2

b = y− ax

Marek Ptak Statystyka 10 pazdziernika 2016 89 / 93

A =

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)2=

n∑i=1

XiYi − X Y

n∑i=1

X2i − nX2

B = Y − AX

A, B estymatory zgodne i nieobciazone wielkosci a, b

yi = axi + b + εi

εi – zmienna losowa

Marek Ptak Statystyka 10 pazdziernika 2016 90 / 93

A =

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)2=

n∑i=1

XiYi − X Y

n∑i=1

X2i − nX2

B = Y − AX

A, B estymatory zgodne i nieobciazone wielkosci a, b

yi = axi + b + εi

εi – zmienna losowa

Marek Ptak Statystyka 10 pazdziernika 2016 90 / 93

Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√

nSX)

Statystyka t = A−a0SA

, gdzie S2A =

S2Y(1−R2)

S2X(n−2)

=

n∑i=1

(Yi−(AXi+B))2

(n−1)n∑

i=1(Xi−X)2

ma rozkład

t–Studenta o n− 2 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 91 / 93

Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√

nSX)

Statystyka t = A−a0SA

, gdzie S2A =

S2Y(1−R2)

S2X(n−2)

=

n∑i=1

(Yi−(AXi+B))2

(n−1)n∑

i=1(Xi−X)2

ma rozkład

t–Studenta o n− 2 stopniach swobody

Marek Ptak Statystyka 10 pazdziernika 2016 91 / 93

Statystyka B ma rozkład normalny

N

b, σ(

1n + X

n∑i=1

(Xi−X)2

) 12

Statystyka B−b0

SBma rozkład t–Studenta o n− 2 stopniach swobody

S2B =

S2Y(1− R2)

S2X(n− 2)

(S2X + X2

) = S2A

1n

n∑i=1

X2i =

n∑i=1

(Yi − (AXi + B))2

(n− 2)nn∑

i=1(Xi − X)2

Marek Ptak Statystyka 10 pazdziernika 2016 92 / 93

Statystyka B ma rozkład normalny

N

b, σ(

1n + X

n∑i=1

(Xi−X)2

) 12

Statystyka B−b0

SBma rozkład t–Studenta o n− 2 stopniach swobody

S2B =

S2Y(1− R2)

S2X(n− 2)

(S2X + X2

) = S2A

1n

n∑i=1

X2i =

n∑i=1

(Yi − (AXi + B))2

(n− 2)nn∑

i=1(Xi − X)2

Marek Ptak Statystyka 10 pazdziernika 2016 92 / 93

Wartosci obliczane z próby:x, y, s2

X , s2Y , sXY = cov(x, y)

s2A =

s2Y(1−r2)

s2X(n−2)

s2B = s2

A1n

n∑i=1

x2i

r = cov(x,y)sX sY

= sXYsX sY

a = sXYs2

Xb = y− ax

Marek Ptak Statystyka 10 pazdziernika 2016 93 / 93