Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

Statystyczna analiza danych

Marek Ptak

10 pazdziernika 2016

Marek Ptak Statystyka 10 pazdziernika 2016 1 / 93

Czesc I

LITERATURAA. Łomnicki, Wprowadzenie do statystyki dla przyrodników

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski,Rachunek prawdopodobienstwa i statystyka matematyczna w zadaniach

J. Koronacki, J. Mieliczuk, Statystyka dla studentów kierunkówtechnicznych i przyrodniczych

G. E. Box, G. M. Jenkins, Analiza szeregów czasowych, PWN, Warszawa1983;

J. Józwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2012.

Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.

PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?

Statystyka zajmuje sie opisem zjawisk masowych przy pomocy metodrachunku prawdopodobienstwa.

PrzykładKrzyzujemy nasiona okragłe i zółte z pomarszczonymi i zielonymi. Otrzymanonastepujace wyniki: pomarszczone zielone 32, pomarszczone i zółte 101,okragłe zielone 108, okragłe zółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9?

PrzykładBadamy, która kapusta: biała czy czerwona zawiera wiecej witaminy C. Wpróbkach po 100 g otrzymano nastepujace wyniki (w mg): biała: 45, 50, 64,38, 66, 43, 49, 58, 31, 49 oraz czerwona: 70, 68, 55, 61, 62, 74, 52, 71, 56,61. Który z gatunków zawiera wiecej witaminy C?

PrzykładBadamy zmiennosc tymotki. Wykonano pomiary długosci najwyzszego lisciaoraz kłosa kwiatostanu w próbie losowejo licznosci 30 kwitnacych pedów i otrzymano nastepujace wyniki:

Nr pedu 1 2 3 4 5 6 7 8 9 10Lisc (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, 5

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

Czy istnieje zaleznosc miedzy długoscia najwyzszego lisciaa długoscia kłosa kwiatostanu?

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

11 12 13 14 15 16 17 18 19 2028, 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 010, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, 0

21 22 23 24 25 26 27 28 29 3024, 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 010, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6

PrzykładBadamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunkuwynosza 1 : 1, tzn, czy rozkład jest dwumianowy.

Testowanie hipotez:1 Przyjecie załozen.2 Otrzymanie rozkładu z próby.3 Wyznaczenie poziomu istotnosci i obszaru krytycznego.4 Przeprowadzenie badan i wyliczenie statystyki testowej.5 Podjecie decyzji.

X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =

)pk(1− p)n−k

P(X = 0) =(

2 )0( 12 )10 = 1

1024 = 0, 000976563

P(X = 1) =(

2 )1( 12 )9 = 10 · 1

512 = 5512 = 0, 009765625

P(X = 2) =(

2 )2( 12 )8 = 45 · 1

256 = 451024 = 0, 043945313

P(X = 3) =(

2 )3( 12 )7 = 120 · 1

128 = 15128 = 0, 1171875

P(X = 4) =(

2 )4( 12 )6 = 210 · 1

16 ·164 = 105

512 = 0, 205078125

P(X = 5) =(

2 )5( 12 )5 = 252 · 1

32 ·132 = 63

256 = 0, 24609375

P(X = 6) =(

2 )6( 12 )4 = 210 · 1

64 ·116 = 105

512 = 0, 205078125

P(X = 7) =(

2 )7( 12 )3 = 120 · 1

128 ·18 = 15

128 = 0, 1171875

P(X = 8) =(

2 )8( 12 )2 = 45 · 1

256 ·14 = 45

1024 = 0, 043945313

P(X = 9) =(

2 )9( 12 )1 = 10 · 1

512 ·12 = 5

512 = 0, 009765625

P(X = 10) =(

2 )10( 12 )0 = 1

1024 = 0, 000976563

X – zmienna losowa okreslajaca liczbe samców w wybranych 10 sztukachP(X = k) =

)pk(1− p)n−k

P(X = 0) =(

2 )0( 12 )10 = 1

1024 = 0, 000976563

P(X = 1) =(

2 )1( 12 )9 = 10 · 1

512 = 5512 = 0, 009765625

P(X = 2) =(

2 )2( 12 )8 = 45 · 1

256 = 451024 = 0, 043945313

P(X = 3) =(

2 )3( 12 )7 = 120 · 1

128 = 15128 = 0, 1171875

P(X = 4) =(

2 )4( 12 )6 = 210 · 1

16 ·164 = 105

512 = 0, 205078125

P(X = 5) =(

2 )5( 12 )5 = 252 · 1

32 ·132 = 63

256 = 0, 24609375

P(X = 6) =(

2 )6( 12 )4 = 210 · 1

64 ·116 = 105

512 = 0, 205078125

P(X = 7) =(

2 )7( 12 )3 = 120 · 1

128 ·18 = 15

128 = 0, 1171875

P(X = 8) =(

2 )8( 12 )2 = 45 · 1

256 ·14 = 45

1024 = 0, 043945313

P(X = 9) =(

2 )9( 12 )1 = 10 · 1

512 ·12 = 5

512 = 0, 009765625

P(X = 10) =(

2 )10( 12 )0 = 1

1024 = 0, 000976563

P(X = 0) =(

5 )0( 25 )10 = 0, 000105

P(X = 1) =(

5 )1( 25 )9 = 0, 001573

P(X = 2) =(

5 )2( 25 )8 = 0, 010617

P(X = 3) =(

5 )3( 25 )7 = 0, 042467

P(X = 4) =(

5 )4( 25 )6 = 0, 111477

P(X = 5) =(

5 )5( 25 )5 = 0, 200658

P(X = 6) =(

5 )6( 25 )4 = 0, 250823

P(X = 7) =(

5 )7( 25 )3 = 0, 214991

P(X = 8) =(

5 )8( 25 )2 = 0, 120932

P(X = 9) =(

5 )9( 25 )1 = 0, 040311

P(X = 10) =(

5 )10( 25 )0 = 0, 006047

P(X = 0) =(

5 )0( 25 )10 = 0, 000105

P(X = 1) =(

5 )1( 25 )9 = 0, 001573

P(X = 2) =(

5 )2( 25 )8 = 0, 010617

P(X = 3) =(

5 )3( 25 )7 = 0, 042467

P(X = 4) =(

5 )4( 25 )6 = 0, 111477

P(X = 5) =(

5 )5( 25 )5 = 0, 200658

P(X = 6) =(

5 )6( 25 )4 = 0, 250823

P(X = 7) =(

5 )7( 25 )3 = 0, 214991

P(X = 8) =(

5 )8( 25 )2 = 0, 120932

P(X = 9) =(

5 )9( 25 )1 = 0, 040311

P(X = 10) =(

5 )10( 25 )0 = 0, 006047

Czesc II

Rachunek prawdopodobienstwa

Doswiadczenie losowe to realizacja (rzeczywista badz myslowa)z góry okreslonym zbiorem wyników.

Przykłady:czas, po którym komórka sie podzieli

w wyniku rozmnozenia powstanie osobnik meski czy zenski

liczba osobników

Ω – przestrzen zdarzen elementarnychNp. Ω = [0,+∞), Ω = M,K, Ω = 1, 2, . . . P(Ω) – ogół podzbiorów Ω,A ⊂ Ω – zdarzenie losowe

Przykłady zdarzenA = czas, po którym komórka sie podzieli wynosi 2 minA = liczba osobników wieksza od 3

liczba osobników

DefinicjaB ⊂ P(Ω) – σ-ciałoPrawdopodobienstwem nazywamy funkcje P : B → [0, 1] spełniajaca warunki

1 P(Ω) = 12 P(A ∪ B) = P(A) + P(B), dla A,B ∈ B, A ∩ B = ∅

(Ω,B,P) – przestrzen probabilistyczna

TwierdzenieNiech funkcja P : B → [0, 1] bedzie prawdopodobienstwem. Wtedy

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

P(∅) = 0,

A,B ∈ B, A ⊂ B =⇒ P(A) 6 P(B)

A ∈ B, P(A) 6 1

A,B ∈ B, A ⊂ B =⇒ P(B \ A) = P(B)− P(A)

A1, . . . ,An ∈ B, Ai ∩ Aj = ∅, i 6= j,

P(A1 ∪ · · · ∪ An) = P(A1) + · · ·+ P(An) =n∑

i=1P(Ai)

A ∈ B, P(A) + P(A′) = 1

A,B ∈ B, P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Zmienne losowe

(Ω,B,P) – przestrzen probabilistyczna,X : Ω→ R – zmienna losowa, D ⊂ R,

P(X ∈ D) = P(ω : X(ω) ∈ D)P(a 6 X < b) = P(X ∈ [a, b)) = P(ω : a 6 X(ω) < b)

Przykłady:

Egzamin: 20 pytan, student zna odpowiedzi na 15, losuje 5 pytan, liczbana które odpowie

Gra w totolotka

Wielkosc komórki

Osobnik meski i zenski

Zmienne losowe

Przykłady:

Gra w totolotka

Wielkosc komórki

Zmienne losowe

Przykłady:

Gra w totolotka

Wielkosc komórki

Zmienne losowe

Przykłady:

Gra w totolotka

Wielkosc komórki

Zmienne losowe

Przykłady:

Gra w totolotka

Wielkosc komórki

Zmienne losowe

Przykłady:

Gra w totolotka

Wielkosc komórki

Definicja(Ω,B,P), X : Ω→ RDystrybuanta zmiennej losowej FX : R→ R,FX(x) = P(X < x)

TwierdzenieFX : R→ R – dystrybuanta zmiennej losowej. Wtedy

1 0 6 FX(x) 6 1.

2 FX – słabo rosnaca(

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

3 FX – lewostronnie ciagła,4 lim

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

1 0 6 FX(x) 6 1.

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

1 0 6 FX(x) 6 1.

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

1 0 6 FX(x) 6 1.

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

1 0 6 FX(x) 6 1.

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

1 0 6 FX(x) 6 1.

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

1 0 6 FX(x) 6 1.

x1 6 x2 =⇒ FX(x1) 6 FX(x2))

x→−∞FX(x) = 0, lim

x→+∞FX(x) = 1

5 P(a 6 X < b) = FX(b)− FX(a)

Zmienna losowa typu dyskretnego

Skonczona lub przeliczalna liczba wartosciWX = x1, x2, . . . xn, xn+1, . . . P(X = xi) = p(xi) = pi

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

P(X = xi) = p(xi) rozkład zmiennej losowejP(a 6 X < b) =

∑a6xi<b

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

∑a6xi<b

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

∑a6xi<b

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

∑a6xi<b

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

∑a6xi<b

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

∑a6xi<b

p(x1) + · · ·+ p(xn) + · · · = 1FX(x) =

∑xi<x

∑a6xi<b

Przykład:

Dwie komórki dziela sie kazda z prawdopodobienstwem 0, 4

X – zmienna losowa okreslajaca liczbe podzielonych komórekP(X = 0) = 0, 6 · 0, 6 = 0, 36P(X = 1) = 0, 6 · 0, 4 + 0, 4 · 0, 6 = 0, 48P(X = 2) = 0, 4 · 0, 4 = 0, 16

Rozkład zmiennej losowej X

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Przykład:

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Przykład:

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Przykład:

xi 0 1 2p(xi) 0, 36 0, 48 0, 16

Dystrybuanta zmiennej losowej X

F(x) =

0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.

Dystrybuanta zmiennej losowej X

F(x) =

0 dla x 6 0,0, 36 dla 0 < x 6 1,0, 84 dla 1 < x 6 2,1 dla 2 < x.

Zmienna typu dyskretnegowartosc oczekiwana zmiennej losowej X EX =

∑xi∈Ω

Wariancja zmiennej losowej X

VarX, D2X, σ2, σ2X , µ2, DX =

√VarX

VarX = E(X − EX)2

kwantylem rzedu p jest liczba xp taka, ze P(X < xp)∑xi<xp

P(X = xi) 6 p 6∑

P(X = xi)

Współczynnik zmiennosci τX = DXEX

∑xi∈Ω

√VarX

VarX = E(X − EX)2

P(X = xi) 6 p 6∑

P(X = xi)

∑xi∈Ω

√VarX

VarX = E(X − EX)2

P(X = xi) 6 p 6∑

P(X = xi)

∑xi∈Ω

√VarX

VarX = E(X − EX)2

P(X = xi) 6 p 6∑

P(X = xi)

∑xi∈Ω

√VarX

VarX = E(X − EX)2

P(X = xi) 6 p 6∑

P(X = xi)

Rozkład dwupunktowy

Zmienna typu skokowego o prawdopodobienstwie:

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Np. Prawdopodobienstwo, ze nastapiła mutacja lub nie, białe lub czarne.

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

xi 0 1p(xi) 1− p p

E(X) = p, D2(X) = p(1− p)

Rozkład dwumianowy

Liczba „sukcesów” w n doswiadczeniachP(X = k) =

)pk(1− p)n−k

Xi wynik w i−tej próbie X1, . . . ,Xn – niezalezne zmienne losoweX = X1 + · · ·+ Xn

E(X) = E(X1 + · · ·+ Xn) = E(X1) + · · ·+ E(Xn) = p + · · ·+ p = npD2(X) = D2(X1) + · · ·+ D2(Xn) = p(1− p) + · · ·+ p(1− p) = np(1− p)

Rozkład dwumianowy

)pk(1− p)n−k

Rozkład dwumianowy

)pk(1− p)n−k

Rozkład dwumianowy

)pk(1− p)n−k

Rozkład dwumianowy

)pk(1− p)n−k

Rozkład dwumianowy

)pk(1− p)n−k

Rozkład geometryczny

Mamy dane pewne zdarzenie losowe zachodzacez prawdopodobienstwem p. Przeprowadzamy je wiele razy. Zmienna losowao rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzeniesie zrealizowało

P(X = k) = (1− p)k−1p (bo k − 1 zd. przeciwne i raz zd. dane)

E(X) = 1p D2(X) = 1−p

Np. X − 1 obsługa masowa, jak długo trzeba czekac, aby byc obsłuzonym

E(X) = 1p D2(X) = 1−p

Rozkład Poissona

P(X = k) = e−λ λk

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona opisuje liczbe pewnych zdarzen w pewnym okreslonymprzedziale czasowym.Np. ile komórek podzieliło sie w ciagu jakiegos odcinka czasu, np. w ciagu 1minuty, 1 godz.λ oznacza intensywnosc danego zjawiska

Rozkład Poissona

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład Poissona

k! k = 0, 1, 2, . . .

EX = λ D2X = λ µ3 = λ

Rozkład hipergeometryczny

Zmienna typu skokowego o rozkładzie prawdopodobienstwa

P(X = k) =(n

k)(N−Mn−k )

EX = np D2X = np(1− p)(N−n

)p = M

Rozkład hipergeometryczny

Zmienna typu skokowego o rozkładzie prawdopodobienstwa

P(X = k) =(n

k)(N−Mn−k )

EX = np D2X = np(1− p)(N−n

)p = M

Zmienna losowa typu ciagłego

Istnieje f : R→ R ciagła (całkowalna), f > 0,

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f – gestosc rozkładu FX(x) =x∫−∞

f (t) dt

TwierdzenieX : Ω→ R– zmienna losowa typu ciagłego+∞∫−∞

f (t) dt = 1 P(X = a) = 0

P(a < X < b) = P(a 6 X < b) = P(a < X 6 b) =P(a 6 X 6 b) = FX(b)− FX(a)

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f (t) dt

f (t) dt = 1 P(X = a) = 0

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f (t) dt

f (t) dt = 1 P(X = a) = 0

∀−∞6a<b6+∞ P(a 6 X 6 b) =b∫

af (t) dt

f (t) dt

f (t) dt = 1 P(X = a) = 0

Twierdzenief : R→ R – gestosc zmiennej losowej, f ciagła w x0. Wtedy

F′X(x) = f (x)

Przykład

f (t) =

23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.

Dystrybuanta ma postac

F(x) =

0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.

Przykład

f (t) =

23 + t2 dla 0 < t < 1,0 dla t 6 0 lub t > 1.

Dystrybuanta ma postac

F(x) =

0 dla x 6 0,13(2x + x3) dla 0 < x 6 11 dla 1 < x.

EX =+∞∫−∞

x f (x) dx

D2X = VarX = E(X − E(X))2

Kwantylem rzedu p jest liczba xp taka, ze P(X < xp) = p

xp∫−∞

f (x) dx = p F(xp) = p

EX =+∞∫−∞

x f (x) dx

xp∫−∞

EX =+∞∫−∞

x f (x) dx

xp∫−∞

EX =+∞∫−∞

x f (x) dx

xp∫−∞

EX =+∞∫−∞

x f (x) dx

xp∫−∞

Rozkład równomierny

f (x) =

b−a dla x ∈ [a, b],

0 dla x /∈ [a, b].F(x) =

0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.

E(X) = a+b2 D2(X) = (b−a)2

Rozkład równomierny

f (x) =

b−a dla x ∈ [a, b],

0 dla x /∈ [a, b].F(x) =

0 dla x < a,x−ab−a dla a 6 x 6 b,1 dla x > b.

E(X) = a+b2 D2(X) = (b−a)2

Rozkład Cauchy’ego

f (x) = 1π

Zmienna typu ciagłego o gestoscif (x) = 1

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

f (x) = 1π

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

f (x) = 1π

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

f (x) = 1π

λ2+(x−µ)2 λ > 0

EX,D2X nie istnieja

Rozkład wykładniczy

f (x) =

λe−λx dla x > 0,0 dla x < 0.

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystapieniapierwszego zdarzenia w rozkładzie Poissona

f (x) =

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

f (x) =

F(x) =

1− e−λx dla x > 0,0 dla x < 0.

Rozkład normalny N(µ, σ)

f (x) = 1√2π

e−x2

f (x) = 1√2πσ

e−(x−µ)2

2σ2 , F(x) = Φ(x) = 1√2π

x∫−∞

e−t22 dt

EX = µ D2X = σ2

Rozkład normalny N(µ, σ)

f (x) = 1√2π

e−x2

f (x) = 1√2πσ

e−(x−µ)2

2σ2 , F(x) = Φ(x) = 1√2π

x∫−∞

e−t22 dt

EX = µ D2X = σ2

TwierdzenieX – zmienna o rozkładzie normalnym N(µ, σ) to EX = µ, D2X = σ2. PonadtoZ = X−µ

σ ma rozkład N(0, 1), tzn EZ = 0, D2Z = 1.

Dystrybuanta standaryzowanego rozkładu normalnego, Φ(x) = 1√2π

x∫−∞

e−12 t2 dt, x > 0

x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

Dla rozkładu normalnego zachodzi tzw.

Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ

σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027

Dla rozkładu normalnego zachodzi tzw.

Reguła 3σP(|X − µ| > 3σ) = 1− P(|X − µ| < 3σ) = 1− P(−3σ < X − µ < 3σ) =1− P(−3 < X−µ

σ < 3) = 1− P(−3 < Z < 3) = 1− (Φ(3)− Φ(−3)) =1− (0, 99865− 0, 00135) = 0, 0027

TwierdzenieNiech X1, . . . ,Xn beda zmiennymi losowymi o tym samym rozkładzienormalnym N(µ, σ). Wtedy zmienna Z = 1

n(X1 + · · ·+ Xn) ma rozkładN(µ, σ√

Rozkład logarytmiczno-normalny

Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)

f (y) = 1yσ√

2πe−

(ln y−µ)2

Rozkład logarytmiczno-normalny

Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowaX = ln Y ma rozkład normalny N(µ, σ)

f (y) = 1yσ√

2πe−

(ln y−µ)2

Rozkład t–Studenta o n− 1 stopniach swobody

Zmienna losowa o gestosci

f (x) =Γ[(n + 1)/2]√

nπ Γ(n/2)

)−(n+1)/2

, x ∈ R, n ∈ N

Γ(r) =

+∞∫0

xr−1 e−x dx, r > 0

Rozkład t–Studenta o n− 1 stopniach swobody

Wartosci krytyczne rozkładu t-Studenta, P(|T| > tα; r) = α

r 0,8 0,6 0,4 0,2 0,1 0,05 0,04 0,02 0,01 0,002 0,0011 0,325 0,727 1,376 3,078 6,314 12,706 15,894 31,821 63,656 318,29 636,582 0,289 0,617 1,061 1,886 2,920 4,303 4,849 6,965 9,925 22,328 31,6003 0,277 0,584 0,978 1,638 2,353 3,182 3,482 4,541 5,841 10,214 12,9244 0,271 0,569 0,941 1,533 2,132 2,776 2,999 3,747 4,604 7,173 8,6105 0,267 0,559 0,920 1,476 2,015 2,571 2,757 3,365 4,032 5,894 6,8696 0,265 0,553 0,906 1,440 1,943 2,447 2,612 3,143 3,707 5,208 5,9597 0,263 0,549 0,896 1,415 1,895 2,365 2,517 2,998 3,499 4,785 5,4088 0,262 0,546 0,889 1,397 1,860 2,306 2,449 2,896 3,355 4,501 5,0419 0,261 0,543 0,883 1,383 1,833 2,262 2,398 2,821 3,250 4,297 4,781

10 0,260 0,542 0,879 1,372 1,812 2,228 2,359 2,764 3,169 4,144 4,58711 0,260 0,540 0,876 1,363 1,796 2,201 2,328 2,718 3,106 4,025 4,43712 0,259 0,539 0,873 1,356 1,782 2,179 2,303 2,681 3,055 3,930 4,31813 0,259 0,538 0,870 1,350 1,771 2,160 2,282 2,650 3,012 3,852 4,22114 0,258 0,537 0,868 1,345 1,761 2,145 2,264 2,624 2,977 3,787 4,14015 0,258 0,536 0,866 1,341 1,753 2,131 2,249 2,602 2,947 3,733 4,07316 0,258 0,535 0,865 1,337 1,746 2,120 2,235 2,583 2,921 3,686 4,01517 0,257 0,534 0,863 1,333 1,740 2,110 2,224 2,567 2,898 3,646 3,96518 0,257 0,534 0,862 1,330 1,734 2,101 2,214 2,552 2,878 3,610 3,92219 0,257 0,533 0,861 1,328 1,729 2,093 2,205 2,539 2,861 3,579 3,88320 0,257 0,533 0,860 1,325 1,725 2,086 2,197 2,528 2,845 3,552 3,85021 0,257 0,532 0,859 1,323 1,721 2,080 2,189 2,518 2,831 3,527 3,81922 0,256 0,532 0,858 1,321 1,717 2,074 2,183 2,508 2,819 3,505 3,79223 0,256 0,532 0,858 1,319 1,714 2,069 2,177 2,500 2,807 3,485 3,76824 0,256 0,531 0,857 1,318 1,711 2,064 2,172 2,492 2,797 3,467 3,74525 0,256 0,531 0,856 1,316 1,708 2,060 2,167 2,485 2,787 3,450 3,72526 0,256 0,531 0,856 1,315 1,706 2,056 2,162 2,479 2,779 3,435 3,70727 0,256 0,531 0,855 1,314 1,703 2,052 2,158 2,473 2,771 3,421 3,68928 0,256 0,530 0,855 1,313 1,701 2,048 2,154 2,467 2,763 3,408 3,67429 0,256 0,530 0,854 1,311 1,699 2,045 2,150 2,462 2,756 3,396 3,66030 0,256 0,530 0,854 1,310 1,697 2,042 2,147 2,457 2,750 3,385 3,64635 0,255 0,529 0,852 1,306 1,690 2,030 2,133 2,438 2,724 3,340 3,59140 0,255 0,529 0,851 1,303 1,684 2,021 2,123 2,423 2,704 3,307 3,55145 0,255 0,528 0,850 1,301 1,679 2,014 2,115 2,412 2,690 3,281 3,52050 0,255 0,528 0,849 1,299 1,676 2,009 2,109 2,403 2,678 3,261 3,49660 0,254 0,527 0,848 1,296 1,671 2,000 2,099 2,390 2,660 3,232 3,46070 0,254 0,527 0,847 1,294 1,667 1,994 2,093 2,381 2,648 3,211 3,43580 0,254 0,526 0,846 1,292 1,664 1,990 2,088 2,374 2,639 3,195 3,41690 0,254 0,526 0,846 1,291 1,662 1,987 2,084 2,368 2,632 3,183 3,402100 0,254 0,526 0,845 1,290 1,660 1,984 2,081 2,364 2,626 3,174 3,390120 0,254 0,526 0,845 1,289 1,658 1,980 2,076 2,358 2,617 3,160 3,373∞ 0,253 0,524 0,842 1,282 1,645 1,960 2,054 2,327 2,576 3,091 3,291

Rozkład χ2 o n stopniach swobody

Zmienna o gestosci

f (x) =

2n/2Γ(n/2)x

12 k−1 e−

12 x2, gdy x > 0,

0, gdy x 6 0

Wartosci krytyczne rozkładu χ2, P(χ2 > χ2α; r) = α

r 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0,0011 0,000 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 10,8272 0,002 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 13,8153 0,024 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 16,2664 0,091 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 18,4665 0,210 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750 20,5156 0,381 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 22,4577 0,599 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 24,3218 0,857 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 26,1249 1,152 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 27,877

10 1,479 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 29,58811 1,834 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 31,26412 2,214 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 32,90913 2,617 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819 34,52714 3,041 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 36,12415 3,483 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 37,69816 3,942 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 39,25217 4,416 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 40,79118 4,905 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 42,31219 5,407 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 43,81920 5,921 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 45,31421 6,447 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 46,79622 6,983 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 48,26823 7,529 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 49,72824 8,085 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558 51,17925 8,649 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 52,61926 9,222 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 54,05127 9,803 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 55,47528 10,391 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994 56,89229 10,986 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335 58,30130 11,588 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 59,70235 14,688 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 66,61940 17,917 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 73,40345 21,251 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 80,07850 24,674 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 86,66060 31,738 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 99,60870 39,036 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,43 104,21 112,3280 46,520 51,172 53,540 57,153 60,391 64,278 96,578 101,88 106,63 112,33 116,32 124,8490 54,156 59,196 61,754 65,647 69,126 73,291 107,57 113,15 118,14 124,12 128,30 137,21100 61,918 67,328 70,065 74,222 77,929 82,358 118,50 124,34 129,56 135,81 140,17 149,45120 77,756 83,852 86,923 91,573 95,705 100,62 140,23 146,57 152,21 158,95 163,65 173,62140 93,925 100,65 104,03 109,14 113,66 119,03 161,83 168,61 174,65 181,84 186,85 197,45

Rozkład Weibulla

Zmienna o gestosci

f (x) =

λp xp−1e−λxp

, gdy x > 0,0, gdy x 6 0

p, λ > 0

EX = λ− 1

(1p + 1

)D2X = λ

− 2p

p + 1)− [Γ( 1p)]2,

gdzie Γ(r) =+∞∫0

xr−1e−x dx, r > 0

Rozkład Weibulla

Zmienna o gestosci

f (x) =

λp xp−1e−λxp

, gdy x > 0,0, gdy x 6 0

p, λ > 0

EX = λ− 1

(1p + 1

)D2X = λ

− 2p

p + 1)− [Γ(1p)]2,

gdzie Γ(r) =+∞∫0

xr−1e−x dx, r > 0

Twierdzenie CzebyszewaX1,X2, . . . ,Xn – zmienne losowe parami niezalezneE(Xk) = a, D2(Xk) < cWtedy

limn→∞

P(|1n∑

Xi − a| < ε) = 1

TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa

X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowym σ√n .

WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie

normalnym N(µ, σ), to X = 1n

n∑i=1

Xi ma rozkład N(µ, σ√n).

TwierdzenieX1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ <∞ i odchyleniu standardowym σ <∞. Wtedy zmienna losowa

X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowym σ√n .

WniosekJezeli X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzie

normalnym N(µ, σ), to X = 1n

n∑i=1

Xi ma rozkład N(µ, σ√n).

TwierdzenieJezeli X1, . . . ,Xn to niezalezne zmienne losowe o rozkładzie N(µ, σ),

X = 1n

n∑i=1

Xi oraz S2 = 1n

n∑i=1

(Xi − X)2, to zmienna losowa V = X−µS

√n− 1

ma rozkład t–Studenta o (n− 1)–stopniach swobody.

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego

N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty

rozkładu normalnego N(0, 1).

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Z ma rozkład N(0, 1). stosujemy n > 25

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)X1, . . . ,Xn – niezalezne zmienne losowe o tym samym rozkładzieo sredniej µ i wariancji σ2. Wtedy dystrybuanta zmiennej losowejXn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty rozkładu normalnego

N(µ, σ√n), tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty

rozkładu normalnego N(0, 1).

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Czesc III

Statystyka

Populacja to zbiór, który badamy

DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.

Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)

Populacja to zbiór, który badamy

DefinicjaProsta próba losowa o licznosci n nazywamy ciag niezaleznych zmiennychlosowych X1, . . . ,Xn okreslonych na Ω takich, ze kazda ma taki sam rozkład.

Realizacja zmiennej losowej to konkretny ciag wartosci zmiennych losowych(takie samo prawdopodobienstwo wyboru). Realizacja próby w postaciwartosci np. wielkosc komórki, liczba podziałów w jednostce czasu,temperatura, czasu do pierwszego podziału komórki(próba mała n 6 30, duza n > 30)

Niech x1, . . . , xn bedzie realizacja próby.Realizacja próby małej – porzadkujemy.Realizacja próby duzej – tworzymy szereg rozdzielczyR – rozstep, R = xmax − xminDzielimy na klasy, liczba klas k 6 5 ln n, k =

Długosc klasy b = Rk

Srednia arytmetyczna x = 1n

n∑i=1

xi x = 1n

k∑i=1

Srednia geometryczna g = n√

x1 . . . xn g = n√

xn11 . . . xnk

log g = 1n

n∑i=1

log xi

Srednia harmoniczna h =

n∑i=1

k∑i=1

n∑i=1

xi x = 1n

k∑i=1

x1 . . . xn g = n√

xn11 . . . xnk

log g = 1n

n∑i=1

log xi

n∑i=1

k∑i=1

n∑i=1

xi x = 1n

k∑i=1

x1 . . . xn g = n√

xn11 . . . xnk

log g = 1n

n∑i=1

log xi

n∑i=1

k∑i=1

n∑i=1

xi x = 1n

k∑i=1

x1 . . . xn g = n√

xn11 . . . xnk

log g = 1n

n∑i=1

log xi

n∑i=1

k∑i=1

n∑i=1

xi x = 1n

k∑i=1

x1 . . . xn g = n√

xn11 . . . xnk

log g = 1n

n∑i=1

log xi

n∑i=1

k∑i=1

Mediana (wartosc srodkowa) me x1 6 x2 6 · · · 6 xn

x(n+1)/2, gdy n nieparzyste,12(xn/2 + xn/2+1), gdy n parzyste.

Wartosc modalna (moda, dominanta) m0 próbki x1, . . . , xn

o powtarzajacych sie wartosciach to najczesciej powtarzajaca sie wartosc.

Dla szeregu rozdzielczego

me = xl +b

(n2−

m−1∑i=1

gdzie xl – lewy koniec klasy zawierajacej mediane,m – numer klasy zawierajacej mediane,n – licznosc próbki,ni – licznosc i-tej próbki,b – długosc klasy.Moda – srodek najliczniejszej klasy.

Miary rozproszenia (rozrzutu, rozsiania)

Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki

S2 = 1n

n∑i=1

(xi − x)2 = 1n

n∑i=1

x2i − x2 S2 = 1

n∑i=1

(xi − x)2ni

Odchylenie standardowe S

S∗2 = 1n−1

n∑i=1

(xi − x)2 S∗2 = 1n−1

n∑i=1

ni(xi − x)2

Wariancja S2 próbki x1, . . . , xn to srednia arytmetyczna kwadratów odchylenposzczególnych wartosci xi od sredniej arytmetycznej X próbki

S2 = 1n

n∑i=1

(xi − x)2 = 1n

n∑i=1

x2i − x2 S2 = 1

n∑i=1

(xi − x)2ni

Odchylenie standardowe S

S∗2 = 1n−1

n∑i=1

(xi − x)2 S∗2 = 1n−1

n∑i=1

ni(xi − x)2

Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki

d1 = 1n

n∑i=1

|xi − x| d1 = 1n

k∑i=1

ni |xi − x|

Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi

od mediany me próbki

d2 = 1n

n∑i=1

|xi − me| d2 = 1n

k∑i=1

ni|xi − me|

Odchylenie przecietne d1 od wartosci sredniej x to srednia arytmetycznawartosci bezwzglednych odchylen poszczególnych wartosci xi od sredniejarytmetycznej x próbki

d1 = 1n

n∑i=1

|xi − x| d1 = 1n

k∑i=1

ni |xi − x|

Odchylenie przecietne d2 od mediany me próbki x1, . . . , xn to sredniaarytmetyczna wartosci bezwzglednych odchylen poszczególnych wartosci xi

od mediany me próbki

d2 = 1n

n∑i=1

|xi − me| d2 = 1n

k∑i=1

ni|xi − me|

v – współczynnik zmiennosci v = Sx · 100%

Moment zwykły mr rzedu r próbki x1, . . . , xn to srednia arytmetyczna r-tychpoteg wartosci xi

mr = 1n

n∑i=1

xri mr = 1

k∑i=1

Moment centralny Mr rzedu r próbki x1, . . . , xn to srednia arytmetycznar-tych poteg wartosci xi od sredniej arytmetycznej x próbki

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

mr = 1n

n∑i=1

xri mr = 1

k∑i=1

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

mr = 1n

n∑i=1

xri mr = 1

k∑i=1

Mr = 1n

n∑i=1

(xi − x)r Mr = 1n

k∑i=1

ni(xi − x)r

Współczynnik skosnosci (asymetrii)

γ1 =M3

Współczynnik koncentracji (skupienia)

Współczynnik skosnosci (asymetrii)

γ1 =M3

Współczynnik koncentracji (skupienia)

PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.

n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.

PrzykładZmierzono srednice 50 komórek pewnej bakterii i otrzymano nastepujacewyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2;4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6;6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4;5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzic dla danej próbki szereg rozdzielczy.

n = 50, k = 7, xmin = 3, 0, xmax = 6, 4. Stad R = 3, 4, R/k = 0, 49.

Szereg rozdzielczy

Nr klasy KlasyGrupowaniewartosci próbki Srodki klas xi

Liczebnosciklas ni

1 2,95-3,45 |||| 3,2 42 3,45-3,95 ||||| 3,7 53 3,95-4,45 ||||| || 4,2 74 4,45-4,95 ||||| |||| 4,7 95 4,95-5,45 ||||| ||||| || 5,2 126 5,45-5,95 ||||| ||| 5,7 87 5,95-6,45 ||||| 6,2 5

Statystyki

DefinicjaStatystyka to kazda funkcja okreslona na próbie Θn(X1, . . . ,Xn)

np. X = 1n(X1 + · · ·+ Xn)

Statystyke Θn(X1, . . . ,Xn), która przyjmujemy jako ocene nieznanegoparametru Θ nazywamy estymatorem parametru Θ.

Statystyki

np. X = 1n(X1 + · · ·+ Xn)

Statystyki

np. X = 1n(X1 + · · ·+ Xn)

Jakie własnosci powinien miec estymator, abysmy mogli gozaakceptowac?

Niech Θn = Θn(X1, . . . ,Xn) estymator parametru Θ

Estymator nazywamy zgodnym, jezeli

limn→∞

P(|Θn −Θ| < ε) = 1

UwagaΘn zgodny =⇒ n

n−1Θn zgodny (αnΘn, αn → 1)

limn→∞

P(|Θn −Θ| < ε) = 1

limn→∞

P(|Θn −Θ| < ε) = 1

limn→∞

P(|Θn −Θ| < ε) = 1

Estymator nazywamy nieobciazonym

EΘn(X1, . . . ,Xn) = Θ

Estymator asymptotycznie nieobciazony

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Moze istniec duzo estymatorów nieobciazonych.Estymator efektywny to ten sposród estymatorów nieobciazonych, któryma najmniejsza wariancje.

EΘn(X1, . . . ,Xn) = Θ

limn→∞

EΘn(X1, . . . ,Xn) = Θ

limn→∞

EΘn(X1, . . . ,Xn) = Θ

Tw. Czebyszewa mówi, ze X jest estymatorem zgodnym.

limn→∞

P(|1n∑

Xi − a| < ε) = 1

X nieobciazony, bo E(1n

∑Xi) = 1

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

(Xi − X)2 zgodny asymptotycznie nieobciazony

S∗2 = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony

limn→∞

P(|1n∑

Xi − a| < ε) = 1

∑Xi) = 1

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

S∗2 = 1n−1

n∑i=1

limn→∞

P(|1n∑

Xi − a| < ε) = 1

∑Xi) = 1

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

S∗2 = 1n−1

n∑i=1

limn→∞

P(|1n∑

Xi − a| < ε) = 1

∑Xi) = 1

∑E(Xi) = 1

n nµ = µ

S2 = 1n

n∑i=1

S∗2 = 1n−1

n∑i=1

Nieznany parametr Estymator Własnosci

Wartosc oczekiwana E(X) X = 1n

n∑i=1

Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny

mediana z próby zgodny asymptotycznie nieobciazony

Wariancja D2(X) S21 = 1

n∑i=1

(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny

S2 = 1n

n∑i=1

S∗ = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie

odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-

tywny dla rozkładu normalnegowskaznik struktury Θ = k

n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny

bn =Γ( n

2 )√

Γ( n−12 )√

n− 1

Γ2( n2 ) · 2

Γ2( n−1n ) · n

Nieznany parametr Estymator Własnosci

Wartosc oczekiwana E(X) X = 1n

n∑i=1

Xi zgodny nieobciazony rozkład dowolny, dlarozkładu normalnego, równiez efektywny

mediana z próby zgodny asymptotycznie nieobciazony

Wariancja D2(X) S21 = 1

n∑i=1

(Xi − E(X))2 zgodny nieobciazony, dla normalnego rów-niez efektywny

S2 = 1n

n∑i=1

S∗ = 1n−1

n∑i=1

(Xi − X)2 zgodny nieobciazony asymptotycznie efek-tywnie

odchylenie standardowe σ S1, S, S∗ zgodnybnS, cnS∗ zgodny nieobciazony, asymptotycznie efek-

tywny dla rozkładu normalnegowskaznik struktury Θ = k

n dla rozkładu Bernouliego zgodny, nieobcia-zony, efektywny

bn =Γ( n

2 )√

Γ( n−12 )√

n− 1

Γ2( n2 ) · 2

Γ2( n−1n ) · n

Parametryczne testy istotnosciTesty dotyczace wartosci przecietnej.

Badana cecha X populacji generalnej ma rozkład N(µ, σ) przy znanym σ.H : µ = µ0H1 : µ 6= µ0 (H1 : µ > µ0, H1 : µ < µ0)

Statystyka testowa U = X−µ0σ√

nma rozkład N(0, 1)

PrzykładPewien automat w fabryce czekolady wytwarza tabliczki czekolady onominalnej wadze 250 g. Wiadomo, ze rozkład wagi produkowanychtabliczek jest normalny N(µ, σ), gdzie odchylenie standardowe wynosiσ = 5. Kontrola techniczna w pewnym dniu pobrała próbke losowa 16tabliczek czekolady i otrzymała nastepujace wyniki (w g):251, 2; 246, 1; 250, 1; 247, 1; 251, 2; 251, 2; 243, 2; 243, 1; 251, 1; 245, 2;251, 2; 245, 3; 242, 1; 250, 2; 246, 1; 252, 0. Czy (na poziomie istotnosciα = 0, 05) mozna stwierdzic, ze automat produkuje tabliczki czekolady owadze mniejszej niz nominalna?

Hipoteza H0 : µ = 250gwobec hipotezy alternatywnej H1 : µ < 250g

x = 247, 9uobl = x−µ0

√n = 247,9−250

√16 = −1, 68

Wartosc uα, dla której P(U 6 uα) wynosi −1, 64

Poniewaz wartosc ta znalazła sie w obszarze krytycznym, gdyzuobl = −1, 68 < −1, 64 = uα, wiec hipoteze H0 nalezy odrzucic na korzyschipotezy alternatywnej H1. Oznacza to, ze z prawdopodobienstwem błedumniejszym niz 0, 05 mozemy twierdzic, ze srednia waga tabliczek czekoladyjest za niska.

PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g,σ = 5, n = 16.Masa poszczególnych tabliczek czekolady (w g):251,2; 246,1; 250,0; 249,3; 247,5; 251,2; 245,1; 247,2; 251,9; 245,7; 250,7;244,4; 242,2; 250,3; 246,2; 252,1.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?

x = 248, 2uobl = x−µ0

√n = 248,2−250

√16 = −1, 45

Poniewaz wartosc ta nie znalazła sie w obszarze krytycznym, gdyzuobl = −1, 45 > −1, 64 = uα, wiec nie ma podstaw do odrzucenia hipotezyH0.

x = 248, 2uobl = x−µ0

√n = 248,2−250

√16 = −1, 45

PrzykładInne dane.Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ).µ = 250 g, σ = 5, n = 16Masa poszczególnych tabliczek czekolady (w g):249, 2; 248, 2; 243, 1; 249, 9; 248, 8; 249, 1; 249, 7; 245, 1; 248, 9; 247, 2;249, 3; 248, 6; 247, 5; 248, 2; 249, 1; 247, 1;.Czy (na poziomie istotnosci α = 0, 05) mozna stwierdzic, ze automatprodukuje tabliczki czekolady o wadze mniejszej niz nominalna?

x = 248, 1uobl = x−µ0

√n = 248,1−250

√16 = −1, 55

x = 248, 1uobl = x−µ0

√n = 248,1−250

√16 = −1, 55

TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.

Wtedy zmienna losowa X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowymσ√

Wniosek

Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n

n∑i=1

Xi = 1n

n∑i=1

rozkład N(µ, σ√n).

TwierdzenieX1, . . . ,Xn to prosta próba losowa o sredniej µ i odchyleniu standardowym σ.

Wtedy zmienna losowa X = 1n

n∑i=1

Xi o sredniej µ i odchyleniu standardowymσ√

Wniosek

Jezeli próba ma rozkład normalny N(µ, σ), to X = 1n

n∑i=1

Xi = 1n

n∑i=1

rozkład N(µ, σ√n).

Twierdzenie

Jezeli X1, . . . ,Xn jest próba losowa o rozkładzie N(µ, σ), X = 1n

n∑i=1

Xi oraz

S2 = 1n

n∑i=1

(Xi − X)2, to zmienna losowa V = X−µS

√n− 1 ma rozkład

t–Studenta o (n− 1)–stopniach swobody.

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)

X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty

rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty rozkładu normalnego N(0, 1)

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy’ego)

X1, . . . ,Xn – próba losowa o sredniej µ i wariancji σ2 Wtedy dystrybuantazmiennej losowej Xn = 1

n(X1 + · · ·+ Xn) jest zbiezna do dystrybuanty

rozkładu normalnego N(µ, σ√n) tzn. dystrybuanta zmiennej losowej X−µ

σ√n

zmierza do dystrybuanty rozkładu normalnego N(0, 1)

Wniosek

P(a 6 X−µ

σ√n

6 b)→ P(a 6 Z 6 b) = Φ(b)− Φ(a)

Pary zmiennych losowych

X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .

P(X = xi,Y = yi) = p(xi, yi)

X,Y ciagłe ∃ f : R2 → R, f > 0

P((X,Y) ∈ A) =

∫∫A

f (s, t) dsdt

FXY = P(X 6 x,Y 6 y) =

x∫−∞

y∫−∞

f (s, t) dsdt

Pary zmiennych losowych

X,Y – zmienne losowe o rozkładzie łacznym,tzn. X,Y dyskretne WX,Y = (x1, y1), (x2, y2), . . .

P(X = xi,Y = yi) = p(xi, yi)

X,Y ciagłe ∃ f : R2 → R, f > 0

P((X,Y) ∈ A) =

∫∫A

f (s, t) dsdt

FXY = P(X 6 x,Y 6 y) =

x∫−∞

y∫−∞

f (s, t) dsdt

DefinicjaX,Y : Ω→ R – zmienne losoweX,Y – niezalezne⇐⇒ ∀x,y∈R P(X < x,Y < y) = P(X < x) P(Y < y)

X,Y – zmienne losowe o łacznym rozkładzieKowariancja zmiennych losowych X,Y (σXY , cov(X,Y))

σXY = E((X − E(X)))(Y − E(Y)))

Zmienna losowa o rozkładzie dyskretnym

σXY =∑

(xi,yi)∈WXY

(xi − E(X))(yi − E(Y)) · p(xi, yi)

Zmienna losowa o rozkładzie ciagłym

σXY =

+∞∫−∞

(x− E(X))(y− E(Y))f (x, y) dxdy

σXX = σ2X

Zmienna losowa o rozkładzie dyskretnym

σXY =∑

(xi,yi)∈WXY

(xi − E(X))(yi − E(Y)) · p(xi, yi)

Zmienna losowa o rozkładzie ciagłym

σXY =

+∞∫−∞

(x− E(X))(y− E(Y))f (x, y) dxdy

σXX = σ2X

TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0

DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y

ρ =cov(X,Y)

σXσY=

σXσY

TwierdzenieX,Y – zmienne niezalezne =⇒ cov(X,Y) = 0

DefinicjaWspółczynnik korelacji liniowej zmiennych losowych X,Y

ρ =cov(X,Y)

σXσY=

σXσY

TwierdzenieX,Y – zmienne losowe

1 −1 6 ρ 6 1,2 a, b – stałe, b > 0, Y = a + bX =⇒ ρ = 1,3 a, b – stałe, b < 0, Y = a + bX =⇒ ρ = −1,4 X,Y – niezalezne ρ = 0.

(X1,Y1), . . . , (Xn,Yn) – próbaEstymatorem zgodnym współczynnika ρ jest współczynnik korelacji liniowejR z próby

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)(Yi − Y)√n∑

i=1(Xi − X)2

√n∑

i=1(Yi − Y)2

R jest zgodny z estymatorem ρ, ale obciazony E(R) 6= ρ

R + R(1−R2)2(n−2) asymptotycznie nieobciazony

Twierdzenie

Jezeli R =

n∑i=1

(Xi−X)(Yi−Y)

SXSYjest współczynnikiem korelacji z próby złozonej z

n niezaleznych obserwacji i wylosowanej z dwuwymiarowej populacjigeneralnej normalnej, w której ρ = 0, wówczas zmienna losowa

V =R√

1− R2

√n− 2

ma rozkład t–Studenta o n− 2 stopniach swobody.

Wartosc r współczynnika korelacji R obliczamy według wzoru:

n∑i=1

(xi − x)(yi − y)√n∑

i=1(xi − x)2

√n∑

i=1(yi − y)2

n∑i=1

xiyi − xy√1n

n∑i=1

x2i − x2

n∑i=1

y2i − y2

Dla danych zgrupowanych w tablice korelacyjna wartosc r współczynnika Robliczamy według wzorów:

l∑i=1

m∑k=1

xi yknik − x y√√√√( 1n

l∑i=1

x2i ni· − x2

m∑k=1

y2k n·k − y2

l∑i=1

xi(m∑

k=1yknik)− x y√√√√( 1

l∑i=1

x2i ni· − x2

m∑k=1

y2k n·k − y2

m∑k=1

yk(l∑

i=1xinik)− x y√√√√( 1

l∑i=1

x2i ni· − x2

m∑k=1

y2k n·k − y2

Kowariancja z próby

cov(x, y) = s2XY = 1

∑xiyi − x y

cov(x, y) = s2XY = 1

l∑i=1

m∑k=1

xi yknik − x y

r =cov(x, y)

sX sY=

Model I.X,Y – zmienne o rozkładzie normalnymn > 3H0 : ρ = 0 H1 : ρ 6= 0przy załozeniu hipotezy statystyka testowa t = R√

1−R2

√n− 2 ma rozkład

t–studenta o n− 2 stopniach swobody

Metoda najmniejszych kwadratów

Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R

(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze

k∑i=1

|yi − f (xi)|2 = min

Metoda najmniejszych kwadratów

Niech F bedzie pewna rodzina funkcjinp. F = y = ax + b : a, b ∈ RF = y = ax2 + bx + c : a, b, c ∈ RF = y = a0 + a1x + . . .+ anxn : a0, . . . , an ∈ RF = y = axb : a, b ∈ RF = y = eax+b : a, b ∈ R

(x1, y1), . . . , (xk, yk) zbiór punktówszukamy funkcji f ∈ F takiej, ze

k∑i=1

|yi − f (xi)|2 = min

F = y = f (·, a, b) : a, b ∈ R

Rozwazmy funkcje S(a, b) =k∑

i=1(yi − f (xi, a, b))2

∂S∂a = 0, ∂S

∂b = 0 warunek konieczny istnienia ekstremum

∂S∂a =

k∑i=1

2(yi − f (xi, a, b)) · ∂f∂a(xi, a, b)

∂S∂b =

k∑i=1

2(yi − f (xi, a, b)) · ∂f∂b(xi, a, b)

Regresja liniowa

Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:

S(a, b) =

n∑i=1

(yi − (axi + b))2 = min MNK

∂S∂a = 0 ∂S

∂b = 0

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2=

n s2XY

n∑i=1

xiyi − x y

n∑i=1

x2i − nx2

b = y− ax

Regresja liniowa

Mamy dane realizacje próby (X1,Y1), (X2,Y2), . . . , (Xn,Yn). Szukamy liniiy = ax + b, która bedzie najblizej tych punktów w nastepujacym sensie:

S(a, b) =

n∑i=1

(yi − (axi + b))2 = min MNK

∂S∂a = 0 ∂S

∂b = 0

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2=

n s2XY

n∑i=1

xiyi − x y

n∑i=1

x2i − nx2

b = y− ax

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)2=

n∑i=1

XiYi − X Y

n∑i=1

X2i − nX2

B = Y − AX

A, B estymatory zgodne i nieobciazone wielkosci a, b

yi = axi + b + εi

εi – zmienna losowa

n∑i=1

(Xi − X)(Yi − Y)

n∑i=1

(Xi − X)2=

n∑i=1

XiYi − X Y

n∑i=1

X2i − nX2

B = Y − AX

A, B estymatory zgodne i nieobciazone wielkosci a, b

yi = axi + b + εi

εi – zmienna losowa

Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√

Statystyka t = A−a0SA

, gdzie S2A =

S2Y(1−R2)

S2X(n−2)

n∑i=1

(Yi−(AXi+B))2

(n−1)n∑

i=1(Xi−X)2

ma rozkład

t–Studenta o n− 2 stopniach swobody

Twierdzenieεi – zmienna losowa o rozkładzie N(a, σ). Wtedy statystyka A ma rozkładnormalny N(a, σ√

Statystyka t = A−a0SA

, gdzie S2A =

S2Y(1−R2)

S2X(n−2)

n∑i=1

(Yi−(AXi+B))2

(n−1)n∑

i=1(Xi−X)2

ma rozkład

t–Studenta o n− 2 stopniach swobody

Statystyka B ma rozkład normalny

b, σ(

1n + X

n∑i=1

(Xi−X)2

Statystyka B−b0

SBma rozkład t–Studenta o n− 2 stopniach swobody

S2Y(1− R2)

S2X(n− 2)

(S2X + X2

) = S2A

n∑i=1

(Yi − (AXi + B))2

(n− 2)nn∑

i=1(Xi − X)2

Statystyka B ma rozkład normalny

b, σ(

1n + X

n∑i=1

(Xi−X)2

Statystyka B−b0

SBma rozkład t–Studenta o n− 2 stopniach swobody

S2Y(1− R2)

S2X(n− 2)

(S2X + X2

) = S2A

n∑i=1

(Yi − (AXi + B))2

(n− 2)nn∑

i=1(Xi − X)2

Wartosci obliczane z próby:x, y, s2

X , s2Y , sXY = cov(x, y)

s2Y(1−r2)

s2X(n−2)

s2B = s2

n∑i=1

r = cov(x,y)sX sY

= sXYsX sY

a = sXYs2

Xb = y− ax

Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

Documents

Transcript of Statystyczna analiza danychkzm.ur.krakow.pl/dydaktyka/materialy/stat_analiza_d.pdf · Statystyka...

Konwencja partyjna – festiwal, msza, widowisko. Rola i funkcje masowych wydarzeń politycznych w Polsce

Czy czeka nas proces masowych przekształceń szpitali?

Kampanie Spol w Polskich Mediach Masowych

RACHUNEK PRAWDOPODOBIENSTWA I STATYSTYKA ...sjaworski.wzim.sggw.pl/wyklady/pdf/rach-stat.pdfRACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA Stanisław Jaworski Katedra Ekonometrii

Instrukcja obsługi - upload.cyfrowe.plupload.cyfrowe.pl/cyfrowe/instrukcje/aparaty/canon/instrukcja... · wraz z nim Broszura z opisem systemu gwarancyjnego firmy Canon. Informacje

Opisowa analiza struktury zjawisk masowych - Sigma Kwadratsigma.wszia.edu.pl/wp-content/uploads/w3-opisowa-analiza-struktury... · Opisowa analiza struktury zjawisk masowych Demografia

MOBILNE APLIKACJE DLA IMPREZ MASOWYCH - mobapki.plmobapki.pl/Mobilene_aplikacje_imprezy_masowe.pdf · rewolucja mobilna zmienia zachowania uczestników eventów. Wskaźniki korzystania

Konwencja partyjna – festiwal, msza, widowisko. Rola i funkcje masowych wydarzeń politycznych w Polsce

ANALIZA WIDM MASOWYCH - Uniwersytet Wrocławski

BRONISŁAW SITEK BEZPIECZEŃSTWO IMPREZ MASOWYCH W ...

Prezentacja "Wpływ mediów masowych na odbiorców"

Statystyka matematyczna - wmii.uwm.edu.plwmii.uwm.edu.pl/~akis/statystyka/statystyka_01.pdf · Statystyka zajmuje si¦ opisywaniem i analiz¡ zjawisk masowych otaczaj¡cej czªowieka

Bezpieczeństwo Imprez Masowych · ewakuacyjnych i drógdojazdowych dla pojazdówsłużbratowniczych i Policji, oznaczenie punktówpomocy medycznej, punktówczerpalnych wody do picia

TERMODYNAMIKA ciowym opisem efektów … · 1 TERMODYNAMIKA Termodynamika chemiczna ilo ściowym opisem efektów energetycznych towarzysz ących przemianom oraz przewidywaniem mo

Wpływ mediów masowych na odbiorców

Autoreferat z elementami życiorysu i opisem działalności ...

Bezpieczeństwo Imprez Masowych - zmiany 2008-2010

SPECYFIKACJA WYMAGAŃSpecyfikacja projektu oprogramowania Jest abstrakcyjnym opisem projektu oprogramowania, który jest podstawa bardziej szczegółowego projektu i implementacji.

Zadania Policji w Zabezpieczaniu Imprez Masowych

Adam Lapski - Chorzowianin.plchorzowianin.pl/uploads/userfiles/spacery_ulicami_chorzowa.pdf · Adam Lapski Spacery ulicami Chorzowa (Monografia ulic miasta z opisem zabytków i miejsc