Post on 20-Aug-2020
Statystyczna analiza danych
Marek Ptak
10 pazdziernika 2016
Marek Ptak Statystyka 10 pazdziernika 2016 1 / 93
Czesc I
Wstep
Marek Ptak Statystyka 10 pazdziernika 2016 2 / 93
LITERATURAA. Łomnicki, Wprowadzenie do statystyki dla przyrodników
W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski,Rachunek prawdopodobienstwa i statystyka matematyczna w zadaniach
J. Koronacki, J. Mieliczuk, Statystyka dla studentów kierunkówtechnicznych i przyrodniczych
G. E. Box, G. M. Jenkins, Analiza szeregów czasowych, PWN, Warszawa1983;
J. Józwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2012.
Marek Ptak Statystyka 10 pazdziernika 2016 3 / 93
Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.
PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?
Marek Ptak Statystyka 10 pazdziernika 2016 4 / 93
Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.
PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?
Marek Ptak Statystyka 10 pazdziernika 2016 4 / 93
PrzykładBadamy, która kapusta: biała czy czerwona zawiera wiecej witaminy C. Wpróbkach po 100 g otrzymano nastepujace wyniki (w mg): biała: 45, 50, 64,38, 66, 43, 49, 58, 31, 49 oraz czerwona: 70, 68, 55, 61, 62, 74, 52, 71, 56,61. Który z gatunków zawiera wiecej witaminy C?
Marek Ptak Statystyka 10 pazdziernika 2016 5 / 93
PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:
Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5
11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0
21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6
Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?
Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93
PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:
Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5
11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0
21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6
Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?
Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93
PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:
Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5
11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0
21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6
Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?
Marek Ptak Statystyka 10 pazdziernika 2016 6 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.
Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.
Marek Ptak Statystyka 10 pazdziernika 2016 7 / 93
X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =
(nk
)pk(1− p)n−k
P(X = 0) =(
100
)( 1
2 )0( 12 )10 = 1
1024 = 0, 000976563
P(X = 1) =(
101
)( 1
2 )1( 12 )9 = 10 · 1
2 ·1
512 = 5512 = 0, 009765625
P(X = 2) =(
102
)( 1
2 )2( 12 )8 = 45 · 1
4 ·1
256 = 451024 = 0, 043945313
P(X = 3) =(
103
)( 1
2 )3( 12 )7 = 120 · 1
8 ·1
128 = 15128 = 0, 1171875
P(X = 4) =(
104
)( 1
2 )4( 12 )6 = 210 · 1
16 ·164 = 105
512 = 0, 205078125
P(X = 5) =(
105
)( 1
2 )5( 12 )5 = 252 · 1
32 ·132 = 63
256 = 0, 24609375
P(X = 6) =(
106
)( 1
2 )6( 12 )4 = 210 · 1
64 ·116 = 105
512 = 0, 205078125
P(X = 7) =(
107
)( 1
2 )7( 12 )3 = 120 · 1
128 ·18 = 15
128 = 0, 1171875
P(X = 8) =(
108
)( 1
2 )8( 12 )2 = 45 · 1
256 ·14 = 45
1024 = 0, 043945313
P(X = 9) =(
109
)( 1
2 )9( 12 )1 = 10 · 1
512 ·12 = 5
512 = 0, 009765625
P(X = 10) =(
1010
)( 1
2 )10( 12 )0 = 1
1024 = 0, 000976563
Marek Ptak Statystyka 10 pazdziernika 2016 8 / 93
X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =
(nk
)pk(1− p)n−k
P(X = 0) =(
100
)( 1
2 )0( 12 )10 = 1
1024 = 0, 000976563
P(X = 1) =(
101
)( 1
2 )1( 12 )9 = 10 · 1
2 ·1
512 = 5512 = 0, 009765625
P(X = 2) =(
102
)( 1
2 )2( 12 )8 = 45 · 1
4 ·1
256 = 451024 = 0, 043945313
P(X = 3) =(
103
)( 1
2 )3( 12 )7 = 120 · 1
8 ·1
128 = 15128 = 0, 1171875
P(X = 4) =(
104
)( 1
2 )4( 12 )6 = 210 · 1
16 ·164 = 105
512 = 0, 205078125
P(X = 5) =(
105
)( 1
2 )5( 12 )5 = 252 · 1
32 ·132 = 63
256 = 0, 24609375
P(X = 6) =(
106
)( 1
2 )6( 12 )4 = 210 · 1
64 ·116 = 105
512 = 0, 205078125
P(X = 7) =(
107
)( 1
2 )7( 12 )3 = 120 · 1
128 ·18 = 15
128 = 0, 1171875
P(X = 8) =(
108
)( 1
2 )8( 12 )2 = 45 · 1
256 ·14 = 45
1024 = 0, 043945313
P(X = 9) =(
109
)( 1
2 )9( 12 )1 = 10 · 1
512 ·12 = 5
512 = 0, 009765625
P(X = 10) =(
1010
)( 1
2 )10( 12 )0 = 1
1024 = 0, 000976563
Marek Ptak Statystyka 10 pazdziernika 2016 8 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 3 : 2, tzn, czy rozkład jest dwumianowy.
P(X = 0) =(
100
)( 3
5 )0( 25 )10 = 0, 000105
P(X = 1) =(
101
)( 3
5 )1( 25 )9 = 0, 001573
P(X = 2) =(
102
)( 3
5 )2( 25 )8 = 0, 010617
P(X = 3) =(
103
)( 3
5 )3( 25 )7 = 0, 042467
P(X = 4) =(
104
)( 3
5 )4( 25 )6 = 0, 111477
P(X = 5) =(
105
)( 3
5 )5( 25 )5 = 0, 200658
P(X = 6) =(
106
)( 3
5 )6( 25 )4 = 0, 250823
P(X = 7) =(
107
)( 3
5 )7( 25 )3 = 0, 214991
P(X = 8) =(
108
)( 3
5 )8( 25 )2 = 0, 120932
P(X = 9) =(
109
)( 3
5 )9( 25 )1 = 0, 040311
P(X = 10) =(
1010
)( 3
5 )10( 25 )0 = 0, 006047
Marek Ptak Statystyka 10 pazdziernika 2016 9 / 93
PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 3 : 2, tzn, czy rozkład jest dwumianowy.
P(X = 0) =(
100
)( 3
5 )0( 25 )10 = 0, 000105
P(X = 1) =(
101
)( 3
5 )1( 25 )9 = 0, 001573
P(X = 2) =(
102
)( 3
5 )2( 25 )8 = 0, 010617
P(X = 3) =(
103
)( 3
5 )3( 25 )7 = 0, 042467
P(X = 4) =(
104
)( 3
5 )4( 25 )6 = 0, 111477
P(X = 5) =(
105
)( 3
5 )5( 25 )5 = 0, 200658
P(X = 6) =(
106
)( 3
5 )6( 25 )4 = 0, 250823
P(X = 7) =(
107
)( 3
5 )7( 25 )3 = 0, 214991
P(X = 8) =(
108
)( 3
5 )8( 25 )2 = 0, 120932
P(X = 9) =(
109
)( 3
5 )9( 25 )1 = 0, 040311
P(X = 10) =(
1010
)( 3
5 )10( 25 )0 = 0, 006047
Marek Ptak Statystyka 10 pazdziernika 2016 9 / 93
Czesc II
Rachunek prawdopodobienstwa
Marek Ptak Statystyka 10 pazdziernika 2016 10 / 93
Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.
Przykłady:czas, po którym komórka sie podzieli
w wyniku rozmnozenia powstanie osobnik meski czy zenski
liczba osobników
Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe
Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3
Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93
Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.
Przykłady:czas, po którym komórka sie podzieli
w wyniku rozmnozenia powstanie osobnik meski czy zenski
liczba osobników
Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe
Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3
Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93
Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.
Przykłady:czas, po którym komórka sie podzieli
w wyniku rozmnozenia powstanie osobnik meski czy zenski
liczba osobników
Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe
Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3
Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93
Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.
Przykłady:czas, po którym komórka sie podzieli
w wyniku rozmnozenia powstanie osobnik meski czy zenski
liczba osobników
Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe
Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3
Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93
Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.
Przykłady:czas, po którym komórka sie podzieli
w wyniku rozmnozenia powstanie osobnik meski czy zenski
liczba osobników
Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe
Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3
Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93
Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.
Przykłady:czas, po którym komórka sie podzieli
w wyniku rozmnozenia powstanie osobnik meski czy zenski
liczba osobników
Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe
Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3
Marek Ptak Statystyka 10 pazdziernika 2016 11 / 93
DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki
1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅
(Ω,B,P) – przestrzen probabilistyczna
Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93
DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki
1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅
(Ω,B,P) – przestrzen probabilistyczna
Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93
DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki
1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅
(Ω,B,P) – przestrzen probabilistyczna
Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93
DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki
1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅
(Ω,B,P) – przestrzen probabilistyczna
Marek Ptak Statystyka 10 pazdziernika 2016 12 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy
P(∅) = 0,
A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)
A ∈ B, P(A) 6 1
A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)
A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,
P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑
i=1P(Ai)
A ∈ B, P(A) + P(A′) = 1
A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Marek Ptak Statystyka 10 pazdziernika 2016 13 / 93
Zmienne losowe
(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,
P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)
Przykłady:
Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie
Gra w totolotka
Wielkosc komórki
Osobnik meski i zenski
Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93
Zmienne losowe
(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,
P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)
Przykłady:
Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie
Gra w totolotka
Wielkosc komórki
Osobnik meski i zenski
Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93
Zmienne losowe
(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,
P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)
Przykłady:
Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie
Gra w totolotka
Wielkosc komórki
Osobnik meski i zenski
Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93
Zmienne losowe
(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,
P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)
Przykłady:
Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie
Gra w totolotka
Wielkosc komórki
Osobnik meski i zenski
Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93
Zmienne losowe
(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,
P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)
Przykłady:
Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie
Gra w totolotka
Wielkosc komórki
Osobnik meski i zenski
Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93
Zmienne losowe
(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,
P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)
Przykłady:
Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie
Gra w totolotka
Wielkosc komórki
Osobnik meski i zenski
Marek Ptak Statystyka 10 pazdziernika 2016 14 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)
TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy
1 0 6 FX(x) 6 1.
2 FX – słabo rosnaca(
x1 6 x2 =⇒ FX(x1) 6 FX(x2))
3 FX – lewostronnie ciagła,4 lim
x→−∞FX(x) = 0, lim
x→+∞FX(x) = 1
5 P(a 6 X < b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 15 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Zmienna losowa typu dyskretnego
Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi
p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =
∑xi<x
p(xi)
P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =
∑a6xi<b
p(xi)
Marek Ptak Statystyka 10 pazdziernika 2016 16 / 93
Przykład:
Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4
X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16
Rozkład zmiennej losowej X
xi 0 1 2p(xi) 0, 36 0, 48 0, 16
Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93
Przykład:
Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4
X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16
Rozkład zmiennej losowej X
xi 0 1 2p(xi) 0, 36 0, 48 0, 16
Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93
Przykład:
Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4
X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16
Rozkład zmiennej losowej X
xi 0 1 2p(xi) 0, 36 0, 48 0, 16
Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93
Przykład:
Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4
X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16
Rozkład zmiennej losowej X
xi 0 1 2p(xi) 0, 36 0, 48 0, 16
Marek Ptak Statystyka 10 pazdziernika 2016 17 / 93
Dystrybuanta zmiennej losowej X
F(x) =
0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.
Marek Ptak Statystyka 10 pazdziernika 2016 18 / 93
Dystrybuanta zmiennej losowej X
F(x) =
0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.
Marek Ptak Statystyka 10 pazdziernika 2016 18 / 93
Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =
∑xi∈Ω
xipi
Wariancja zmiennej losowej X
VarX, D2X, σ2, σ2X , µ2, DX =
√VarX
VarX = E(X − EX)2
kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp
P(X = xi) 6 p 6∑
xi6xp
P(X = xi)
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93
Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =
∑xi∈Ω
xipi
Wariancja zmiennej losowej X
VarX, D2X, σ2, σ2X , µ2, DX =
√VarX
VarX = E(X − EX)2
kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp
P(X = xi) 6 p 6∑
xi6xp
P(X = xi)
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93
Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =
∑xi∈Ω
xipi
Wariancja zmiennej losowej X
VarX, D2X, σ2, σ2X , µ2, DX =
√VarX
VarX = E(X − EX)2
kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp
P(X = xi) 6 p 6∑
xi6xp
P(X = xi)
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93
Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =
∑xi∈Ω
xipi
Wariancja zmiennej losowej X
VarX, D2X, σ2, σ2X , µ2, DX =
√VarX
VarX = E(X − EX)2
kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp
P(X = xi) 6 p 6∑
xi6xp
P(X = xi)
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93
Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =
∑xi∈Ω
xipi
Wariancja zmiennej losowej X
VarX, D2X, σ2, σ2X , µ2, DX =
√VarX
VarX = E(X − EX)2
kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp
P(X = xi) 6 p 6∑
xi6xp
P(X = xi)
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 19 / 93
Rozkład dwupunktowy
Zmienna typu skokowego o prawdopodobienstwie:
xi 0 1p(xi) 1− p p
E(X) = p, D2(X) = p(1− p)
Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.
Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93
Rozkład dwupunktowy
Zmienna typu skokowego o prawdopodobienstwie:
xi 0 1p(xi) 1− p p
E(X) = p, D2(X) = p(1− p)
Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.
Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93
Rozkład dwupunktowy
Zmienna typu skokowego o prawdopodobienstwie:
xi 0 1p(xi) 1− p p
E(X) = p, D2(X) = p(1− p)
Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.
Marek Ptak Statystyka 10 pazdziernika 2016 20 / 93
Rozkład dwumianowy
Liczba „sukcesów” w n doswiadczeniachP(X = k) =
(nk
)pk(1− p)n−k
Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn
E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)
Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93
Rozkład dwumianowy
Liczba „sukcesów” w n doswiadczeniachP(X = k) =
(nk
)pk(1− p)n−k
Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn
E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)
Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93
Rozkład dwumianowy
Liczba „sukcesów” w n doswiadczeniachP(X = k) =
(nk
)pk(1− p)n−k
Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn
E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)
Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93
Rozkład dwumianowy
Liczba „sukcesów” w n doswiadczeniachP(X = k) =
(nk
)pk(1− p)n−k
Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn
E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)
Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93
Rozkład dwumianowy
Liczba „sukcesów” w n doswiadczeniachP(X = k) =
(nk
)pk(1− p)n−k
Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn
E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)
Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93
Rozkład dwumianowy
Liczba „sukcesów” w n doswiadczeniachP(X = k) =
(nk
)pk(1− p)n−k
Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn
E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)
Marek Ptak Statystyka 10 pazdziernika 2016 21 / 93
Rozkład geometryczny
Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało
P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)
E(X) = 1p D2(X) = 1−p
p2
Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym
Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93
Rozkład geometryczny
Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało
P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)
E(X) = 1p D2(X) = 1−p
p2
Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym
Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93
Rozkład geometryczny
Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało
P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)
E(X) = 1p D2(X) = 1−p
p2
Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym
Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93
Rozkład geometryczny
Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało
P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)
E(X) = 1p D2(X) = 1−p
p2
Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym
Marek Ptak Statystyka 10 pazdziernika 2016 22 / 93
Rozkład Poissona
P(X = k) = e−λ λk
k! k = 0, 1, 2, . . .
EX = λ D2X = λ µ3 = λ
Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska
Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93
Rozkład Poissona
P(X = k) = e−λ λk
k! k = 0, 1, 2, . . .
EX = λ D2X = λ µ3 = λ
Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska
Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93
Rozkład Poissona
P(X = k) = e−λ λk
k! k = 0, 1, 2, . . .
EX = λ D2X = λ µ3 = λ
Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska
Marek Ptak Statystyka 10 pazdziernika 2016 23 / 93
Rozkład hipergeometryczny
Zmienna typu skokowego o rozkładzie prawdopodobienstwa
P(X = k) =(n
k)(N−Mn−k )
(Nn)
EX = np D2X = np(1− p)(N−n
N−1
)p = M
N
Marek Ptak Statystyka 10 pazdziernika 2016 24 / 93
Rozkład hipergeometryczny
Zmienna typu skokowego o rozkładzie prawdopodobienstwa
P(X = k) =(n
k)(N−Mn−k )
(Nn)
EX = np D2X = np(1− p)(N−n
N−1
)p = M
N
Marek Ptak Statystyka 10 pazdziernika 2016 24 / 93
Zmienna losowa typu ciagłego
Istnieje f : R→ R ciagła (całkowalna), f > 0,
∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫
af (t) dt
f – gestosc rozkładu FX(x) =x∫−∞
f (t) dt
TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞
f (t) dt = 1 P(X = a) = 0
P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93
Zmienna losowa typu ciagłego
Istnieje f : R→ R ciagła (całkowalna), f > 0,
∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫
af (t) dt
f – gestosc rozkładu FX(x) =x∫−∞
f (t) dt
TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞
f (t) dt = 1 P(X = a) = 0
P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93
Zmienna losowa typu ciagłego
Istnieje f : R→ R ciagła (całkowalna), f > 0,
∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫
af (t) dt
f – gestosc rozkładu FX(x) =x∫−∞
f (t) dt
TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞
f (t) dt = 1 P(X = a) = 0
P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93
Zmienna losowa typu ciagłego
Istnieje f : R→ R ciagła (całkowalna), f > 0,
∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫
af (t) dt
f – gestosc rozkładu FX(x) =x∫−∞
f (t) dt
TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞
f (t) dt = 1 P(X = a) = 0
P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)
Marek Ptak Statystyka 10 pazdziernika 2016 25 / 93
Twierdzenief : R→ R – gestosc zmiennej losowej, f ciagła w x0. Wtedy
F′X(x) = f (x)
Marek Ptak Statystyka 10 pazdziernika 2016 26 / 93
Przykład
f (t) =
23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.
Dystrybuanta ma postac
F(x) =
0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.
Marek Ptak Statystyka 10 pazdziernika 2016 27 / 93
Przykład
f (t) =
23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.
Dystrybuanta ma postac
F(x) =
0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.
Marek Ptak Statystyka 10 pazdziernika 2016 27 / 93
Zmienna losowa typu ciagłego
EX =+∞∫−∞
x f (x) dx
D2X = VarX = E(X − E(X))2
Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p
xp∫−∞
f (x) dx = p F(xp) = p
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93
Zmienna losowa typu ciagłego
EX =+∞∫−∞
x f (x) dx
D2X = VarX = E(X − E(X))2
Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p
xp∫−∞
f (x) dx = p F(xp) = p
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93
Zmienna losowa typu ciagłego
EX =+∞∫−∞
x f (x) dx
D2X = VarX = E(X − E(X))2
Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p
xp∫−∞
f (x) dx = p F(xp) = p
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93
Zmienna losowa typu ciagłego
EX =+∞∫−∞
x f (x) dx
D2X = VarX = E(X − E(X))2
Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p
xp∫−∞
f (x) dx = p F(xp) = p
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93
Zmienna losowa typu ciagłego
EX =+∞∫−∞
x f (x) dx
D2X = VarX = E(X − E(X))2
Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p
xp∫−∞
f (x) dx = p F(xp) = p
Współczynnik zmiennosci τX = DXEX
Marek Ptak Statystyka 10 pazdziernika 2016 28 / 93
Rozkład równomierny
f (x) =
1
b−a dla x ∈ [a, b],
0 dla x /∈ [a, b].F(x) =
0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.
E(X) = a+b2 D2(X) = (b−a)2
12
Marek Ptak Statystyka 10 pazdziernika 2016 29 / 93
Rozkład równomierny
f (x) =
1
b−a dla x ∈ [a, b],
0 dla x /∈ [a, b].F(x) =
0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.
E(X) = a+b2 D2(X) = (b−a)2
12
Marek Ptak Statystyka 10 pazdziernika 2016 29 / 93
Rozkład Cauchy’ego
f (x) = 1π
11+x2
Zmienna typu ciagłego o gestoscif (x) = 1
πλ
λ2+(x−µ)2 λ > 0
EX,D2X nie istnieja
Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93
Rozkład Cauchy’ego
f (x) = 1π
11+x2
Zmienna typu ciagłego o gestoscif (x) = 1
πλ
λ2+(x−µ)2 λ > 0
EX,D2X nie istnieja
Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93
Rozkład Cauchy’ego
f (x) = 1π
11+x2
Zmienna typu ciagłego o gestoscif (x) = 1
πλ
λ2+(x−µ)2 λ > 0
EX,D2X nie istnieja
Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93
Rozkład Cauchy’ego
f (x) = 1π
11+x2
Zmienna typu ciagłego o gestoscif (x) = 1
πλ
λ2+(x−µ)2 λ > 0
EX,D2X nie istnieja
Marek Ptak Statystyka 10 pazdziernika 2016 30 / 93
Rozkład wykładniczy
f (x) =
λe−λx dla x > 0,0 dla x < 0.
F(x) =
1− e−λx dla x > 0,0 dla x < 0.
Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona
Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93
Rozkład wykładniczy
f (x) =
λe−λx dla x > 0,0 dla x < 0.
F(x) =
1− e−λx dla x > 0,0 dla x < 0.
Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona
Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93
Rozkład wykładniczy
f (x) =
λe−λx dla x > 0,0 dla x < 0.
F(x) =
1− e−λx dla x > 0,0 dla x < 0.
Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona
Marek Ptak Statystyka 10 pazdziernika 2016 31 / 93
Rozkład normalny N(µ, σ)
f (x) = 1√2π
e−x2
2
f (x) = 1√2πσ
e−(x−µ)2
2σ2 , F(x) = Φ(x) = 1√2π
x∫−∞
e−t22 dt
EX = µ D2X = σ2
Marek Ptak Statystyka 10 pazdziernika 2016 32 / 93
Rozkład normalny N(µ, σ)
f (x) = 1√2π
e−x2
2
f (x) = 1√2πσ
e−(x−µ)2
2σ2 , F(x) = Φ(x) = 1√2π
x∫−∞
e−t22 dt
EX = µ D2X = σ2
Marek Ptak Statystyka 10 pazdziernika 2016 32 / 93
TwierdzenieX – zmienna o rozkładzie normalnym N(µ, σ) to EX = µ, D2X = σ2. PonadtoZ = X−µ
σ ma rozkład N(0, 1), tzn EZ = 0, D2Z = 1.
Marek Ptak Statystyka 10 pazdziernika 2016 33 / 93
Dystrybuanta standaryzowanego rozkładu normalnego, Φ(x) = 1√2π
x∫−∞
e−12 t2 dt, x > 0
x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
Marek Ptak Statystyka 10 pazdziernika 2016 34 / 93
Dla rozkładu normalnego zachodzi tzw.
Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ
σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027
Marek Ptak Statystyka 10 pazdziernika 2016 35 / 93
Dla rozkładu normalnego zachodzi tzw.
Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ
σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027
Marek Ptak Statystyka 10 pazdziernika 2016 35 / 93
TwierdzenieNiech X1, . . . ,Xn beda zmiennymi losowymi o tym samym rozkładzienormalnym N(µ, σ). Wtedy zmienna Z = 1
n(X1 + · · ·+ Xn) ma rozkładN(µ, σ√
n).
Marek Ptak Statystyka 10 pazdziernika 2016 36 / 93
Rozkład logarytmiczno-normalny
Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)
f (y) = 1yσ√
2πe−
(ln y−µ)2
2σ2
Marek Ptak Statystyka 10 pazdziernika 2016 37 / 93
Rozkład logarytmiczno-normalny
Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)
f (y) = 1yσ√
2πe−
(ln y−µ)2
2σ2
Marek Ptak Statystyka 10 pazdziernika 2016 37 / 93
Rozkład t–Studenta o n− 1 stopniach swobody
Zmienna losowa o gestosci
f (x) =Γ[(n + 1)/2]√
nπ Γ(n/2)
(1 +
x2
n
)−(n+1)/2
, x ∈ R, n ∈ N
gdzie
Γ(r) =
+∞∫0
xr−1 e−x dx, r > 0
Marek Ptak Statystyka 10 pazdziernika 2016 38 / 93
Rozkład t–Studenta o n− 1 stopniach swobody
Marek Ptak Statystyka 10 pazdziernika 2016 39 / 93
Wartosci krytyczne rozkładu t-Studenta, P(|T| > tα; r) = α
α
r 0,8 0,6 0,4 0,2 0,1 0,05 0,04 0,02 0,01 0,002 0,0011 0,325 0,727 1,376 3,078 6,314 12,706 15,894 31,821 63,656 318,29 636,582 0,289 0,617 1,061 1,886 2,920 4,303 4,849 6,965 9,925 22,328 31,6003 0,277 0,584 0,978 1,638 2,353 3,182 3,482 4,541 5,841 10,214 12,9244 0,271 0,569 0,941 1,533 2,132 2,776 2,999 3,747 4,604 7,173 8,6105 0,267 0,559 0,920 1,476 2,015 2,571 2,757 3,365 4,032 5,894 6,8696 0,265 0,553 0,906 1,440 1,943 2,447 2,612 3,143 3,707 5,208 5,9597 0,263 0,549 0,896 1,415 1,895 2,365 2,517 2,998 3,499 4,785 5,4088 0,262 0,546 0,889 1,397 1,860 2,306 2,449 2,896 3,355 4,501 5,0419 0,261 0,543 0,883 1,383 1,833 2,262 2,398 2,821 3,250 4,297 4,781
10 0,260 0,542 0,879 1,372 1,812 2,228 2,359 2,764 3,169 4,144 4,58711 0,260 0,540 0,876 1,363 1,796 2,201 2,328 2,718 3,106 4,025 4,43712 0,259 0,539 0,873 1,356 1,782 2,179 2,303 2,681 3,055 3,930 4,31813 0,259 0,538 0,870 1,350 1,771 2,160 2,282 2,650 3,012 3,852 4,22114 0,258 0,537 0,868 1,345 1,761 2,145 2,264 2,624 2,977 3,787 4,14015 0,258 0,536 0,866 1,341 1,753 2,131 2,249 2,602 2,947 3,733 4,07316 0,258 0,535 0,865 1,337 1,746 2,120 2,235 2,583 2,921 3,686 4,01517 0,257 0,534 0,863 1,333 1,740 2,110 2,224 2,567 2,898 3,646 3,96518 0,257 0,534 0,862 1,330 1,734 2,101 2,214 2,552 2,878 3,610 3,92219 0,257 0,533 0,861 1,328 1,729 2,093 2,205 2,539 2,861 3,579 3,88320 0,257 0,533 0,860 1,325 1,725 2,086 2,197 2,528 2,845 3,552 3,85021 0,257 0,532 0,859 1,323 1,721 2,080 2,189 2,518 2,831 3,527 3,81922 0,256 0,532 0,858 1,321 1,717 2,074 2,183 2,508 2,819 3,505 3,79223 0,256 0,532 0,858 1,319 1,714 2,069 2,177 2,500 2,807 3,485 3,76824 0,256 0,531 0,857 1,318 1,711 2,064 2,172 2,492 2,797 3,467 3,74525 0,256 0,531 0,856 1,316 1,708 2,060 2,167 2,485 2,787 3,450 3,72526 0,256 0,531 0,856 1,315 1,706 2,056 2,162 2,479 2,779 3,435 3,70727 0,256 0,531 0,855 1,314 1,703 2,052 2,158 2,473 2,771 3,421 3,68928 0,256 0,530 0,855 1,313 1,701 2,048 2,154 2,467 2,763 3,408 3,67429 0,256 0,530 0,854 1,311 1,699 2,045 2,150 2,462 2,756 3,396 3,66030 0,256 0,530 0,854 1,310 1,697 2,042 2,147 2,457 2,750 3,385 3,64635 0,255 0,529 0,852 1,306 1,690 2,030 2,133 2,438 2,724 3,340 3,59140 0,255 0,529 0,851 1,303 1,684 2,021 2,123 2,423 2,704 3,307 3,55145 0,255 0,528 0,850 1,301 1,679 2,014 2,115 2,412 2,690 3,281 3,52050 0,255 0,528 0,849 1,299 1,676 2,009 2,109 2,403 2,678 3,261 3,49660 0,254 0,527 0,848 1,296 1,671 2,000 2,099 2,390 2,660 3,232 3,46070 0,254 0,527 0,847 1,294 1,667 1,994 2,093 2,381 2,648 3,211 3,43580 0,254 0,526 0,846 1,292 1,664 1,990 2,088 2,374 2,639 3,195 3,41690 0,254 0,526 0,846 1,291 1,662 1,987 2,084 2,368 2,632 3,183 3,402100 0,254 0,526 0,845 1,290 1,660 1,984 2,081 2,364 2,626 3,174 3,390120 0,254 0,526 0,845 1,289 1,658 1,980 2,076 2,358 2,617 3,160 3,373∞ 0,253 0,524 0,842 1,282 1,645 1,960 2,054 2,327 2,576 3,091 3,291
Marek Ptak Statystyka 10 pazdziernika 2016 40 / 93
Rozkład χ2 o n stopniach swobody
Zmienna o gestosci
f (x) =
1
2n/2Γ(n/2)x
12 k−1 e−
12 x2, gdy x > 0,
0, gdy x 6 0
Marek Ptak Statystyka 10 pazdziernika 2016 41 / 93
Wartosci krytyczne rozkładu χ2, P(χ2 > χ2α; r) = α
α
r 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0,0011 0,000 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 10,8272 0,002 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 13,8153 0,024 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 16,2664 0,091 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 18,4665 0,210 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750 20,5156 0,381 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 22,4577 0,599 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 24,3218 0,857 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 26,1249 1,152 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 27,877
10 1,479 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 29,58811 1,834 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 31,26412 2,214 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 32,90913 2,617 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819 34,52714 3,041 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 36,12415 3,483 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 37,69816 3,942 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 39,25217 4,416 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 40,79118 4,905 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 42,31219 5,407 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 43,81920 5,921 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 45,31421 6,447 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 46,79622 6,983 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 48,26823 7,529 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 49,72824 8,085 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558 51,17925 8,649 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 52,61926 9,222 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 54,05127 9,803 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 55,47528 10,391 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994 56,89229 10,986 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335 58,30130 11,588 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 59,70235 14,688 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 66,61940 17,917 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 73,40345 21,251 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 80,07850 24,674 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 86,66060 31,738 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 99,60870 39,036 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,43 104,21 112,3280 46,520 51,172 53,540 57,153 60,391 64,278 96,578 101,88 106,63 112,33 116,32 124,8490 54,156 59,196 61,754 65,647 69,126 73,291 107,57 113,15 118,14 124,12 128,30 137,21100 61,918 67,328 70,065 74,222 77,929 82,358 118,50 124,34 129,56 135,81 140,17 149,45120 77,756 83,852 86,923 91,573 95,705 100,62 140,23 146,57 152,21 158,95 163,65 173,62140 93,925 100,65 104,03 109,14 113,66 119,03 161,83 168,61 174,65 181,84 186,85 197,45
Marek Ptak Statystyka 10 pazdziernika 2016 42 / 93
Rozkład Weibulla
Zmienna o gestosci
f (x) =
λp xp−1e−λxp
, gdy x > 0,0, gdy x 6 0
p, λ > 0
EX = λ− 1
p
(1p + 1
)D2X = λ
− 2p
Γ(2
p + 1)− [Γ( 1p)]2,
gdzie Γ(r) =+∞∫0
xr−1e−x dx, r > 0
Marek Ptak Statystyka 10 pazdziernika 2016 43 / 93
Rozkład Weibulla
Zmienna o gestosci
f (x) =
λp xp−1e−λxp
, gdy x > 0,0, gdy x 6 0
p, λ > 0
EX = λ− 1
p
(1p + 1
)D2X = λ
− 2p
Γ(2
p + 1)− [Γ(1p)]2,
gdzie Γ(r) =+∞∫0
xr−1e−x dx, r > 0
Marek Ptak Statystyka 10 pazdziernika 2016 43 / 93
Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy
limn→∞
P(|1n∑
Xi − a| < ε) = 1
Marek Ptak Statystyka 10 pazdziernika 2016 44 / 93
TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa
X = 1n
n∑i=1
Xi o sredniej µ i odchyleniu standardowym σ√n .
WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie
normalnym N(µ, σ), to X = 1n
n∑i=1
Xi ma rozkład N(µ, σ√n).
Marek Ptak Statystyka 10 pazdziernika 2016 45 / 93
TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa
X = 1n
n∑i=1
Xi o sredniej µ i odchyleniu standardowym σ√n .
WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie
normalnym N(µ, σ), to X = 1n
n∑i=1
Xi ma rozkład N(µ, σ√n).
Marek Ptak Statystyka 10 pazdziernika 2016 45 / 93
TwierdzenieJezeli X1, . . . ,Xn to niezalezne zmienne losowe o rozkładzie N(µ, σ),
X = 1n
n∑i=1
Xi oraz S2 = 1n
n∑i=1
(Xi − X)2, to zmienna losowa V = X−µS
√n− 1
ma rozkład t–Studenta o (n− 1)–stopniach swobody.
Marek Ptak Statystyka 10 pazdziernika 2016 46 / 93
Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1
n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego
N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ
σ√n
zmierza do dystrybuanty
rozkładu normalnego N(0, 1).
Wniosek
P(a 6 X−µ
σ√n
6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)
Z ma rozkład N(0, 1). stosujemy n > 25
Marek Ptak Statystyka 10 pazdziernika 2016 47 / 93
Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1
n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego
N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ
σ√n
zmierza do dystrybuanty
rozkładu normalnego N(0, 1).
Wniosek
P(a 6 X−µ
σ√n
6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)
Z ma rozkład N(0, 1). stosujemy n > 25
Marek Ptak Statystyka 10 pazdziernika 2016 47 / 93
Czesc III
Statystyka
Marek Ptak Statystyka 10 pazdziernika 2016 48 / 93
Populacja to zbiór, który badamy
DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.
Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)
Marek Ptak Statystyka 10 pazdziernika 2016 49 / 93
Populacja to zbiór, który badamy
DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.
Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)
Marek Ptak Statystyka 10 pazdziernika 2016 49 / 93
Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =
√n
Długosc klasy b = Rk
Srednia arytmetyczna x = 1n
n∑i=1
xi x = 1n
k∑i=1
xini
Srednia geometryczna g = n√
x1 . . . xn g = n√
xn11 . . . xnk
k
log g = 1n
n∑i=1
log xi
Srednia harmoniczna h =
(1n
n∑i=1
1xi
)−1
h =
(1n
k∑i=1
nixi
)−1
Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93
Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =
√n
Długosc klasy b = Rk
Srednia arytmetyczna x = 1n
n∑i=1
xi x = 1n
k∑i=1
xini
Srednia geometryczna g = n√
x1 . . . xn g = n√
xn11 . . . xnk
k
log g = 1n
n∑i=1
log xi
Srednia harmoniczna h =
(1n
n∑i=1
1xi
)−1
h =
(1n
k∑i=1
nixi
)−1
Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93
Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =
√n
Długosc klasy b = Rk
Srednia arytmetyczna x = 1n
n∑i=1
xi x = 1n
k∑i=1
xini
Srednia geometryczna g = n√
x1 . . . xn g = n√
xn11 . . . xnk
k
log g = 1n
n∑i=1
log xi
Srednia harmoniczna h =
(1n
n∑i=1
1xi
)−1
h =
(1n
k∑i=1
nixi
)−1
Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93
Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =
√n
Długosc klasy b = Rk
Srednia arytmetyczna x = 1n
n∑i=1
xi x = 1n
k∑i=1
xini
Srednia geometryczna g = n√
x1 . . . xn g = n√
xn11 . . . xnk
k
log g = 1n
n∑i=1
log xi
Srednia harmoniczna h =
(1n
n∑i=1
1xi
)−1
h =
(1n
k∑i=1
nixi
)−1
Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93
Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =
√n
Długosc klasy b = Rk
Srednia arytmetyczna x = 1n
n∑i=1
xi x = 1n
k∑i=1
xini
Srednia geometryczna g = n√
x1 . . . xn g = n√
xn11 . . . xnk
k
log g = 1n
n∑i=1
log xi
Srednia harmoniczna h =
(1n
n∑i=1
1xi
)−1
h =
(1n
k∑i=1
nixi
)−1
Marek Ptak Statystyka 10 pazdziernika 2016 50 / 93
Mediana (wartosc srodkowa) me x1 6 x2 6 · · · 6 xn
me =
x(n+1)/2, gdy n nieparzyste,12(xn/2 + xn/2+1), gdy n parzyste.
Wartosc modalna (moda, dominanta) m0 próbki x1, . . . , xn
o powtarzajacych sie wartosciach to najczesciej powtarzajaca sie wartosc.
Marek Ptak Statystyka 10 pazdziernika 2016 51 / 93
Dla szeregu rozdzielczego
me = xl +b
nm
(n2−
m−1∑i=1
ni
),
gdzie xl – lewy koniec klasy zawierajacej mediane,m – numer klasy zawierajacej mediane,n – licznosc próbki,ni – licznosc i-tej próbki,b – długosc klasy.Moda – srodek najliczniejszej klasy.
Marek Ptak Statystyka 10 pazdziernika 2016 52 / 93
Miary rozproszenia (rozrzutu, rozsiania)
Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki
S2 = 1n
n∑i=1
(xi − x)2 = 1n
n∑i=1
x2i − x2 S2 = 1
n
n∑i=1
(xi − x)2ni
Odchylenie standardowe S
S∗2 = 1n−1
n∑i=1
(xi − x)2 S∗2 = 1n−1
n∑i=1
ni(xi − x)2
Marek Ptak Statystyka 10 pazdziernika 2016 53 / 93
Miary rozproszenia (rozrzutu, rozsiania)
Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki
S2 = 1n
n∑i=1
(xi − x)2 = 1n
n∑i=1
x2i − x2 S2 = 1
n
n∑i=1
(xi − x)2ni
Odchylenie standardowe S
S∗2 = 1n−1
n∑i=1
(xi − x)2 S∗2 = 1n−1
n∑i=1
ni(xi − x)2
Marek Ptak Statystyka 10 pazdziernika 2016 53 / 93
Miary rozproszenia (rozrzutu, rozsiania)
Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki
d1 = 1n
n∑i=1
|xi − x| d1 = 1n
k∑i=1
ni |xi − x|
Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi
od mediany me próbki
d2 = 1n
n∑i=1
|xi − me| d2 = 1n
k∑i=1
ni|xi − me|
Marek Ptak Statystyka 10 pazdziernika 2016 54 / 93
Miary rozproszenia (rozrzutu, rozsiania)
Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki
d1 = 1n
n∑i=1
|xi − x| d1 = 1n
k∑i=1
ni |xi − x|
Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi
od mediany me próbki
d2 = 1n
n∑i=1
|xi − me| d2 = 1n
k∑i=1
ni|xi − me|
Marek Ptak Statystyka 10 pazdziernika 2016 54 / 93
Miary rozproszenia (rozrzutu, rozsiania)
v – współczynnik zmiennosci v = Sx · 100%
Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi
mr = 1n
n∑i=1
xri mr = 1
n
k∑i=1
nixri
Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki
Mr = 1n
n∑i=1
(xi − x)r Mr = 1n
k∑i=1
ni(xi − x)r
Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93
Miary rozproszenia (rozrzutu, rozsiania)
v – współczynnik zmiennosci v = Sx · 100%
Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi
mr = 1n
n∑i=1
xri mr = 1
n
k∑i=1
nixri
Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki
Mr = 1n
n∑i=1
(xi − x)r Mr = 1n
k∑i=1
ni(xi − x)r
Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93
Miary rozproszenia (rozrzutu, rozsiania)
v – współczynnik zmiennosci v = Sx · 100%
Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi
mr = 1n
n∑i=1
xri mr = 1
n
k∑i=1
nixri
Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki
Mr = 1n
n∑i=1
(xi − x)r Mr = 1n
k∑i=1
ni(xi − x)r
Marek Ptak Statystyka 10 pazdziernika 2016 55 / 93
Miary rozproszenia (rozrzutu, rozsiania)
Współczynnik skosnosci (asymetrii)
γ1 =M3
S3
Współczynnik koncentracji (skupienia)
K =M4
S4
Marek Ptak Statystyka 10 pazdziernika 2016 56 / 93
Miary rozproszenia (rozrzutu, rozsiania)
Współczynnik skosnosci (asymetrii)
γ1 =M3
S3
Współczynnik koncentracji (skupienia)
K =M4
S4
Marek Ptak Statystyka 10 pazdziernika 2016 56 / 93
PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.
n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.
Marek Ptak Statystyka 10 pazdziernika 2016 57 / 93
PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.
n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.
Marek Ptak Statystyka 10 pazdziernika 2016 57 / 93
Szereg rozdzielczy
Nr klasy KlasyGrupowaniewartosci próbki Srodki klas xi
Liczebnosciklas ni
1 2,95-3,45 |||| 3,2 42 3,45-3,95 ||||| 3,7 53 3,95-4,45 ||||| || 4,2 74 4,45-4,95 ||||| |||| 4,7 95 4,95-5,45 ||||| ||||| || 5,2 126 5,45-5,95 ||||| ||| 5,7 87 5,95-6,45 ||||| 6,2 5
Marek Ptak Statystyka 10 pazdziernika 2016 58 / 93
Statystyki
DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)
np. X = 1n(X1 + · · ·+ Xn)
Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.
Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93
Statystyki
DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)
np. X = 1n(X1 + · · ·+ Xn)
Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.
Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93
Statystyki
DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)
np. X = 1n(X1 + · · ·+ Xn)
Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.
Marek Ptak Statystyka 10 pazdziernika 2016 59 / 93
Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?
Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ
Estymator nazywamy zgodnym, jezeli
limn→∞
P(|Θn −Θ| < ε) = 1
UwagaΘn zgodny =⇒ n
n−1Θn zgodny (αnΘn, αn → 1)
Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93
Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?
Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ
Estymator nazywamy zgodnym, jezeli
limn→∞
P(|Θn −Θ| < ε) = 1
UwagaΘn zgodny =⇒ n
n−1Θn zgodny (αnΘn, αn → 1)
Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93
Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?
Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ
Estymator nazywamy zgodnym, jezeli
limn→∞
P(|Θn −Θ| < ε) = 1
UwagaΘn zgodny =⇒ n
n−1Θn zgodny (αnΘn, αn → 1)
Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93
Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?
Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ
Estymator nazywamy zgodnym, jezeli
limn→∞
P(|Θn −Θ| < ε) = 1
UwagaΘn zgodny =⇒ n
n−1Θn zgodny (αnΘn, αn → 1)
Marek Ptak Statystyka 10 pazdziernika 2016 60 / 93
Estymator nazywamy nieobciazonym
EΘn(X1, . . . ,Xn) = Θ
Estymator asymptotycznie nieobciazony
limn→∞
EΘn(X1, . . . ,Xn) = Θ
Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.
Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93
Estymator nazywamy nieobciazonym
EΘn(X1, . . . ,Xn) = Θ
Estymator asymptotycznie nieobciazony
limn→∞
EΘn(X1, . . . ,Xn) = Θ
Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.
Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93
Estymator nazywamy nieobciazonym
EΘn(X1, . . . ,Xn) = Θ
Estymator asymptotycznie nieobciazony
limn→∞
EΘn(X1, . . . ,Xn) = Θ
Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.
Marek Ptak Statystyka 10 pazdziernika 2016 61 / 93
Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.
Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy
limn→∞
P(|1n∑
Xi − a| < ε) = 1
X nieobciazony, bo E(1n
∑Xi) = 1
n
∑E(Xi) = 1
n nµ = µ
S2 = 1n
n∑i=1
(Xi − X)2 zgodny asymptotycznie nieobciazony
S∗2 = 1n−1
n∑i=1
(Xi − X)2 zgodny nieobciazony
Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93
Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.
Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy
limn→∞
P(|1n∑
Xi − a| < ε) = 1
X nieobciazony, bo E(1n
∑Xi) = 1
n
∑E(Xi) = 1
n nµ = µ
S2 = 1n
n∑i=1
(Xi − X)2 zgodny asymptotycznie nieobciazony
S∗2 = 1n−1
n∑i=1
(Xi − X)2 zgodny nieobciazony
Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93
Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.
Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy
limn→∞
P(|1n∑
Xi − a| < ε) = 1
X nieobciazony, bo E(1n
∑Xi) = 1
n
∑E(Xi) = 1
n nµ = µ
S2 = 1n
n∑i=1
(Xi − X)2 zgodny asymptotycznie nieobciazony
S∗2 = 1n−1
n∑i=1
(Xi − X)2 zgodny nieobciazony
Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93
Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.
Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy
limn→∞
P(|1n∑
Xi − a| < ε) = 1
X nieobciazony, bo E(1n
∑Xi) = 1
n
∑E(Xi) = 1
n nµ = µ
S2 = 1n
n∑i=1
(Xi − X)2 zgodny asymptotycznie nieobciazony
S∗2 = 1n−1
n∑i=1
(Xi − X)2 zgodny nieobciazony
Marek Ptak Statystyka 10 pazdziernika 2016 62 / 93
Nieznany parametr Estymator Własnosci
Wartosc oczekiwana E(X) X = 1n
n∑i=1
Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny
mediana z próby zgodny asymptotycznie nieobciazony
Wariancja D2(X) S21 = 1
n
n∑i=1
(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny
S2 = 1n
n∑i=1
(Xi − X)2 zgodny asymptotycznie nieobciazony
S∗ = 1n−1
n∑i=1
(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie
odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-
tywny dla rozkładu normalnegowskaznik struktury Θ = k
n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny
bn =Γ( n
2 )√
2
Γ( n−12 )√
ncn =
n− 1
n=
Γ2( n2 ) · 2
Γ2( n−1n ) · n
Marek Ptak Statystyka 10 pazdziernika 2016 63 / 93
Nieznany parametr Estymator Własnosci
Wartosc oczekiwana E(X) X = 1n
n∑i=1
Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny
mediana z próby zgodny asymptotycznie nieobciazony
Wariancja D2(X) S21 = 1
n
n∑i=1
(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny
S2 = 1n
n∑i=1
(Xi − X)2 zgodny asymptotycznie nieobciazony
S∗ = 1n−1
n∑i=1
(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie
odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-
tywny dla rozkładu normalnegowskaznik struktury Θ = k
n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny
bn =Γ( n
2 )√
2
Γ( n−12 )√
ncn =
n− 1
n=
Γ2( n2 ) · 2
Γ2( n−1n ) · n
Marek Ptak Statystyka 10 pazdziernika 2016 63 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Badana cecha X populacji generalnej ma rozkład N(µ, σ) przy znanym σ.H : µ = µ0H1 : µ 6= µ0 (H1 : µ > µ0, H1 : µ < µ0)
Statystyka testowa U = X−µ0σ√
nma rozkład N(0, 1)
Marek Ptak Statystyka 10 pazdziernika 2016 64 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Marek Ptak Statystyka 10 pazdziernika 2016 65 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
PrzykładPewien automat w fabryce czekolady wytwarza tabliczki czekolady onominalnej wadze 250 g. Wiadomo, ze rozkład wagi produkowanychtabliczek jest normalny N(µ, σ), gdzie odchylenie standardowe wynosiσ = 5. Kontrola techniczna w pewnym dniu pobrała próbke losowa 16tabliczek czekolady i otrzymała nastepujace wyniki (w g):251, 2; 246, 1; 250, 1; 247, 1; 251, 2; 251, 2; 243, 2; 243, 1; 251, 1; 245, 2;251, 2; 245, 3; 242, 1; 250, 2; 246, 1; 252, 0. Czy (na poziomie istotnosciα = 0, 05) mozna stwierdzic, ze automat produkuje tabliczki czekolady owadze mniejszej niz nominalna?
Marek Ptak Statystyka 10 pazdziernika 2016 66 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g
x = 247, 9uobl = x−µ0
σ
√n = 247,9−250
5
√16 = −1, 68
Wartosc uα, dla której P(U 6 uα) wynosi −1, 64
Marek Ptak Statystyka 10 pazdziernika 2016 67 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Poniewaz wartosc ta znalazła sie w obszarze krytycznym, gdyzuobl = −1, 68 < −1, 64 = uα, wiec hipoteze H0 nalezy odrzucic na korzyschipotezy alternatywnej H1. Oznacza to, ze z prawdopodobienstwem błedumniejszym niz 0, 05 mozemy twierdzic, ze srednia waga tabliczek czekoladyjest za niska.
Marek Ptak Statystyka 10 pazdziernika 2016 68 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g,σ = 5, n = 16.Masa poszczególnych tabliczek czekolady (w g):251,2; 246,1; 250,0; 249,3; 247,5; 251,2; 245,1; 247,2; 251,9; 245,7; 250,7;244,4; 242,2; 250,3; 246,2; 252,1.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?
Marek Ptak Statystyka 10 pazdziernika 2016 69 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g
x = 248, 2uobl = x−µ0
σ
√n = 248,2−250
5
√16 = −1, 45
Wartosc uα, dla której P(U 6 uα) wynosi −1, 64
Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.
Marek Ptak Statystyka 10 pazdziernika 2016 70 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g
x = 248, 2uobl = x−µ0
σ
√n = 248,2−250
5
√16 = −1, 45
Wartosc uα, dla której P(U 6 uα) wynosi −1, 64
Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.
Marek Ptak Statystyka 10 pazdziernika 2016 70 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g, σ = 5, n = 16Masa poszczególnych tabliczek czekolady (w g):249, 2; 248, 2; 243, 1; 249, 9; 248, 8; 249, 1; 249, 7; 245, 1; 248, 9; 247, 2;249, 3; 248, 6; 247, 5; 248, 2; 249, 1; 247, 1;.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?
Marek Ptak Statystyka 10 pazdziernika 2016 71 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g
x = 248, 1uobl = x−µ0
σ
√n = 248,1−250
5
√16 = −1, 55
Wartosc uα, dla której P(U 6 uα) wynosi −1, 64
Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 55 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.
Marek Ptak Statystyka 10 pazdziernika 2016 72 / 93
Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.
Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g
x = 248, 1uobl = x−µ0
σ
√n = 248,1−250
5
√16 = −1, 55
Wartosc uα, dla której P(U 6 uα) wynosi −1, 64
Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 55 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.
Marek Ptak Statystyka 10 pazdziernika 2016 72 / 93
TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.
Wtedy zmienna losowa X = 1n
n∑i=1
Xi o sredniej µ i odchyleniu standardowymσ√
n
Wniosek
Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n
n∑i=1
Xi = 1n
n∑i=1
Xi ma
rozkład N(µ, σ√n).
Marek Ptak Statystyka 10 pazdziernika 2016 73 / 93
TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.
Wtedy zmienna losowa X = 1n
n∑i=1
Xi o sredniej µ i odchyleniu standardowymσ√
n
Wniosek
Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n
n∑i=1
Xi = 1n
n∑i=1
Xi ma
rozkład N(µ, σ√n).
Marek Ptak Statystyka 10 pazdziernika 2016 73 / 93
Twierdzenie
Jezeli X1, . . . ,Xn jest próba losowa o rozkładzie N(µ, σ), X = 1n
n∑i=1
Xi oraz
S2 = 1n
n∑i=1
(Xi − X)2, to zmienna losowa V = X−µS
√n− 1 ma rozkład
t–Studenta o (n− 1)–stopniach swobody.
Marek Ptak Statystyka 10 pazdziernika 2016 74 / 93
Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)
X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1
n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty
rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ
σ√n
zmierza do dystrybuanty rozkładu normalnego N(0, 1)
Wniosek
P(a 6 X−µ
σ√n
6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)
Z ma rozkład N(0, 1). stosujemy n > 25
Marek Ptak Statystyka 10 pazdziernika 2016 75 / 93
Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)
X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1
n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty
rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ
σ√n
zmierza do dystrybuanty rozkładu normalnego N(0, 1)
Wniosek
P(a 6 X−µ
σ√n
6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)
Z ma rozkład N(0, 1). stosujemy n > 25
Marek Ptak Statystyka 10 pazdziernika 2016 75 / 93
Pary zmiennych losowych
X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .
P(X = xi,Y = yi) = p(xi, yi)
X,Y ciagłe ∃ f : R2 → R, f > 0
P((X,Y) ∈ A) =
∫∫A
f (s, t) dsdt
FXY = P(X 6 x,Y 6 y) =
x∫−∞
y∫−∞
f (s, t) dsdt
Marek Ptak Statystyka 10 pazdziernika 2016 76 / 93
Pary zmiennych losowych
X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .
P(X = xi,Y = yi) = p(xi, yi)
X,Y ciagłe ∃ f : R2 → R, f > 0
P((X,Y) ∈ A) =
∫∫A
f (s, t) dsdt
FXY = P(X 6 x,Y 6 y) =
x∫−∞
y∫−∞
f (s, t) dsdt
Marek Ptak Statystyka 10 pazdziernika 2016 76 / 93
DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)
X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))
σXY = E((X − E(X)))(Y − E(Y)))
Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93
DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)
X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))
σXY = E((X − E(X)))(Y − E(Y)))
Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93
DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)
X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))
σXY = E((X − E(X)))(Y − E(Y)))
Marek Ptak Statystyka 10 pazdziernika 2016 77 / 93
Zmienna losowa o rozkładzie dyskretnym
σXY =∑
(xi,yi)∈WXY
(xi − E(X))(yi − E(Y)) · p(xi, yi)
Zmienna losowa o rozkładzie ciagłym
σXY =
+∞∫−∞
+∞∫−∞
(x− E(X))(y− E(Y))f (x, y) dxdy
σXX = σ2X
Marek Ptak Statystyka 10 pazdziernika 2016 78 / 93
Zmienna losowa o rozkładzie dyskretnym
σXY =∑
(xi,yi)∈WXY
(xi − E(X))(yi − E(Y)) · p(xi, yi)
Zmienna losowa o rozkładzie ciagłym
σXY =
+∞∫−∞
+∞∫−∞
(x− E(X))(y− E(Y))f (x, y) dxdy
σXX = σ2X
Marek Ptak Statystyka 10 pazdziernika 2016 78 / 93
TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0
DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y
ρ =cov(X,Y)
σXσY=
σXY
σXσY
Marek Ptak Statystyka 10 pazdziernika 2016 79 / 93
TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0
DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y
ρ =cov(X,Y)
σXσY=
σXY
σXσY
Marek Ptak Statystyka 10 pazdziernika 2016 79 / 93
TwierdzenieX,Y – zmienne losowe
1 −1 6 ρ 6 1,2 a, b – stałe, b > 0, Y = a + bX =⇒ ρ = 1,3 a, b – stałe, b < 0, Y = a + bX =⇒ ρ = −1,4 X,Y – niezalezne ρ = 0.
Marek Ptak Statystyka 10 pazdziernika 2016 80 / 93
(X1,Y1), . . . , (Xn,Yn) – próbaEstymatorem zgodnym współczynnika ρ jest współczynnik korelacji liniowejR z próby
R =
1n
n∑i=1
(Xi − X)(Yi − Y)
SXSY=
n∑i=1
(Xi − X)(Yi − Y)√n∑
i=1(Xi − X)2
√n∑
i=1(Yi − Y)2
R jest zgodny z estymatorem ρ, ale obciazony E(R) 6= ρ
R + R(1−R2)2(n−2) asymptotycznie nieobciazony
Marek Ptak Statystyka 10 pazdziernika 2016 81 / 93
Twierdzenie
Jezeli R =
1n
n∑i=1
(Xi−X)(Yi−Y)
SXSYjest współczynnikiem korelacji z próby złozonej z
n niezaleznych obserwacji i wylosowanej z dwuwymiarowej populacjigeneralnej normalnej, w której ρ = 0, wówczas zmienna losowa
V =R√
1− R2
√n− 2
ma rozkład t–Studenta o n− 2 stopniach swobody.
Marek Ptak Statystyka 10 pazdziernika 2016 82 / 93
Wartosc r współczynnika korelacji R obliczamy według wzoru:
r =
n∑i=1
(xi − x)(yi − y)√n∑
i=1(xi − x)2
√n∑
i=1(yi − y)2
=
1n
n∑i=1
xiyi − xy√1n
n∑i=1
x2i − x2
√1n
n∑i=1
y2i − y2
Marek Ptak Statystyka 10 pazdziernika 2016 83 / 93
Dla danych zgrupowanych w tablice korelacyjna wartosc r współczynnika Robliczamy według wzorów:
r =
1n
l∑i=1
m∑k=1
xi yknik − x y√√√√( 1n
l∑i=1
x2i ni· − x2
)(1n
m∑k=1
y2k n·k − y2
)
=
1n
l∑i=1
xi(m∑
k=1yknik)− x y√√√√( 1
n
l∑i=1
x2i ni· − x2
)(1n
m∑k=1
y2k n·k − y2
)
=
1n
m∑k=1
yk(l∑
i=1xinik)− x y√√√√( 1
n
l∑i=1
x2i ni· − x2
)(1n
m∑k=1
y2k n·k − y2
)
Marek Ptak Statystyka 10 pazdziernika 2016 84 / 93
Kowariancja z próby
cov(x, y) = s2XY = 1
n
∑xiyi − x y
cov(x, y) = s2XY = 1
n
l∑i=1
m∑k=1
xi yknik − x y
r =cov(x, y)
sX sY=
sXY
sX sY
Marek Ptak Statystyka 10 pazdziernika 2016 85 / 93
Model I.X,Y – zmienne o rozkładzie normalnymn > 3H0 : ρ = 0 H1 : ρ 6= 0przy załozeniu hipotezy statystyka testowa t = R√
1−R2
√n− 2 ma rozkład
t–studenta o n− 2 stopniach swobody
Marek Ptak Statystyka 10 pazdziernika 2016 86 / 93
Metoda najmniejszych kwadratów
Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R
(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze
k∑i=1
|yi − f (xi)|2 = min
Marek Ptak Statystyka 10 pazdziernika 2016 87 / 93
Metoda najmniejszych kwadratów
Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R
(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze
k∑i=1
|yi − f (xi)|2 = min
Marek Ptak Statystyka 10 pazdziernika 2016 87 / 93
F = y = f (·, a, b) : a, b ∈ R
Rozwazmy funkcje S(a, b) =k∑
i=1(yi − f (xi, a, b))2
∂S∂a = 0, ∂S
∂b = 0 warunek konieczny istnienia ekstremum
∂S∂a =
k∑i=1
2(yi − f (xi, a, b)) · ∂f∂a(xi, a, b)
∂S∂b =
k∑i=1
2(yi − f (xi, a, b)) · ∂f∂b(xi, a, b)
Marek Ptak Statystyka 10 pazdziernika 2016 88 / 93
Regresja liniowa
Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:
S(a, b) =
n∑i=1
(yi − (axi + b))2 = min MNK
∂S∂a = 0 ∂S
∂b = 0
a =
n∑i=1
(xi − x)(yi − y)
n∑i=1
(xi − x)2=
n s2XY
n s2X
=
n∑i=1
xiyi − x y
n∑i=1
x2i − nx2
b = y− ax
Marek Ptak Statystyka 10 pazdziernika 2016 89 / 93
Regresja liniowa
Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:
S(a, b) =
n∑i=1
(yi − (axi + b))2 = min MNK
∂S∂a = 0 ∂S
∂b = 0
a =
n∑i=1
(xi − x)(yi − y)
n∑i=1
(xi − x)2=
n s2XY
n s2X
=
n∑i=1
xiyi − x y
n∑i=1
x2i − nx2
b = y− ax
Marek Ptak Statystyka 10 pazdziernika 2016 89 / 93
A =
n∑i=1
(Xi − X)(Yi − Y)
n∑i=1
(Xi − X)2=
n∑i=1
XiYi − X Y
n∑i=1
X2i − nX2
B = Y − AX
A, B estymatory zgodne i nieobciazone wielkosci a, b
yi = axi + b + εi
εi – zmienna losowa
Marek Ptak Statystyka 10 pazdziernika 2016 90 / 93
A =
n∑i=1
(Xi − X)(Yi − Y)
n∑i=1
(Xi − X)2=
n∑i=1
XiYi − X Y
n∑i=1
X2i − nX2
B = Y − AX
A, B estymatory zgodne i nieobciazone wielkosci a, b
yi = axi + b + εi
εi – zmienna losowa
Marek Ptak Statystyka 10 pazdziernika 2016 90 / 93
Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√
nSX)
Statystyka t = A−a0SA
, gdzie S2A =
S2Y(1−R2)
S2X(n−2)
=
n∑i=1
(Yi−(AXi+B))2
(n−1)n∑
i=1(Xi−X)2
ma rozkład
t–Studenta o n− 2 stopniach swobody
Marek Ptak Statystyka 10 pazdziernika 2016 91 / 93
Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√
nSX)
Statystyka t = A−a0SA
, gdzie S2A =
S2Y(1−R2)
S2X(n−2)
=
n∑i=1
(Yi−(AXi+B))2
(n−1)n∑
i=1(Xi−X)2
ma rozkład
t–Studenta o n− 2 stopniach swobody
Marek Ptak Statystyka 10 pazdziernika 2016 91 / 93
Statystyka B ma rozkład normalny
N
b, σ(
1n + X
n∑i=1
(Xi−X)2
) 12
Statystyka B−b0
SBma rozkład t–Studenta o n− 2 stopniach swobody
S2B =
S2Y(1− R2)
S2X(n− 2)
(S2X + X2
) = S2A
1n
n∑i=1
X2i =
n∑i=1
(Yi − (AXi + B))2
(n− 2)nn∑
i=1(Xi − X)2
Marek Ptak Statystyka 10 pazdziernika 2016 92 / 93
Statystyka B ma rozkład normalny
N
b, σ(
1n + X
n∑i=1
(Xi−X)2
) 12
Statystyka B−b0
SBma rozkład t–Studenta o n− 2 stopniach swobody
S2B =
S2Y(1− R2)
S2X(n− 2)
(S2X + X2
) = S2A
1n
n∑i=1
X2i =
n∑i=1
(Yi − (AXi + B))2
(n− 2)nn∑
i=1(Xi − X)2
Marek Ptak Statystyka 10 pazdziernika 2016 92 / 93
Wartosci obliczane z próby:x, y, s2
X , s2Y , sXY = cov(x, y)
s2A =
s2Y(1−r2)
s2X(n−2)
s2B = s2
A1n
n∑i=1
x2i
r = cov(x,y)sX sY
= sXYsX sY
a = sXYs2
Xb = y− ax
Marek Ptak Statystyka 10 pazdziernika 2016 93 / 93