STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład...

34
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Test t 6. Test 2 7. Test F 8. Testy nieparametryczne 9. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 10. Korelacja 11. Regresja liniowa 12. Regresja nieliniowa 13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14. Analiza wariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja

Transcript of STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład...

Page 1: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKA MATEMATYCZNA

1. Wykład wstępny

2. Zmienne losowe

3. Populacje i próby danych

4. Testowanie hipotez i estymacja parametrów

5. Test t

6. Test 2

7. Test F

8. Testy nieparametryczne

9. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja

10. Korelacja

11. Regresja liniowa

12. Regresja nieliniowa

13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej

14. Analiza wariancji

15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja

Page 2: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

WSTĘP

1. Zmienna losowa

2. Funkcja gęstości prawdopodobieństwa

3. Dystrybuanta

4. Statystyki opisowe

5. Przykładowe rozkłady

Copyright ©2020, Joanna Szyda

Page 3: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ZMIENNA LOSOWA

Page 4: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ZMIENNA LOSOWA random variable

ZMIENNA funkcja, przyjmuje różne wartości

LOSOWA wartości są określone przez przypadek

ZMIENNA LOSOWA X

PRZYJĘTA WARTOŚĆ (REALIZACJA) x

ZMIENNA LOSOWA DYSKRETNA wartości przeliczalne

pomiar w skali nominalnej (brak uporządkowania) np.?

pomiar w skali porządkowej (uporządkowanej) np.?

ZMIENNA LOSOWA CIĄGŁA dowolne wartościCopyright ©2020, Joanna Szyda

Page 5: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ZMIENNA LOSOWA random variable

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

• liczba szczeniąt w miocie

X

• X=x czyli X=7

• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }

• wysokość konia w kłębie

W

• W=w czyli W=167

• W [ 150, 190 ]Copyright ©2020, Joanna Szyda

Page 6: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA

Page 7: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

• funkcja prawdopodobieństwa

• jakie jest prawdopodobieństwo uzyskania danej wartości

• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }

• P(X=xi)

• np. urodzenie 5 szczeniąt:

P(X=5)

• funkcja gęstości prawdopodobieństwa

• jakie jest prawdopodobieństwo uzyskania wartości z danego przedziału

• W [ 150, 190 ]

• f(w)

• np. wys. w kłębie [160,165]

12.0

165

160

dwwf

Copyright ©2020, Joanna Szyda

Page 8: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

0.00

0.05

0.10

0.15

0.20

0.25

1 2 3 4 5 6 7 8 9

P(X

=x)

liczba szczeniąt x

19

1

i

ixXP

wysokość w kłębie w

f (w

)

1

dwwf

FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function

Copyright ©2020, Joanna Szyda

Page 9: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

z

f (w

,z)

w

x

y

P(x

,y)

prawdopodobieństwołączne, warunkowe

FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function

Copyright ©2020, Joanna Szyda

Page 10: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

DYSTRYBUANTA

Page 11: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

DYSTRYBUANTA cumulative distribution function

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

• dystrybuanta

• jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej x

• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }

• F(x) = P(Xx)

• np. urodzenie maksymalnie 5 szczeniąt

F(5)=P(X5)=0.40

• dystrybuanta

• jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej w

• W [ 150, 190 ]

• np. maksymalna wys. w kłębie 170

dwwfwF

w

69.0170

170

dwwfF

Copyright ©2020, Joanna Szyda

Page 12: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

DYSTRYBUANTA cumulative distribution function

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

0.00

0.50

1.00

1.50

1 2 3 4 5 6 7 8 9

P(X

x)

maks. liczba szczeniąt x

19

1

i

ixXP

wysokość w kłębie w

F (w

)

1wF

Copyright ©2020, Joanna Szyda

Page 13: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

• pr. urodzenia 1 szczeniaka:F(1)=P(X1)=0.03

• pr. urodzenia maks. 9 szczeniaków:F(9)=P(X9)=1

• pr. urodzenia maks. 3 szczeniaków:F(3)=P(X3)=0.03+0.04+0.06

• pr. urodzenia 4 lub 5 szczeniaków:F(5)-F(3)

DYSTRYBUANTA cumulative distribution function

ZMIENNA LOSOWA DYSKRETNA

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1 2 3 4 5 6 7 8 9

P(X

x)

maks. liczba szczeniąt x

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1 2 3 4 5 6 7 8 9

P(X

x)

maks. liczba szczeniąt x

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1 2 3 4 5 6 7 8 9

P(X

x)

maks. liczba szczeniąt x

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1 2 3 4 5 6 7 8 9

P(X

x)

maks. liczba szczeniąt x

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1 2 3 4 5 6 7 8 9

P(X

x)

maks. liczba szczeniąt x

Copyright ©2020, Joanna Szyda

Page 14: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

• pr. wystąpienia osobnika o wys. w kłębie maks. 150 cm:F(150)=P(W150)=0.11

• pr. wystąpienia osobnika o wys. w kłębie maks. 190 cm:F(190)=P(W190)=1.00

• pr. wystąpienia osobnika o wys. w kłębie 160-170 cm:F(170)-F(160)=0.32

• pr. wystąpienia osobnika o wys. w kłębie pow. 165 cm:1-F(165)=0.62

DYSTRYBUANTA cumulative distribution function

ZMIENNA LOSOWA CIĄGŁA

wysokość w kłębie w

F (w

)Copyright ©2020, Joanna Szyda

Page 15: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKI OPISOWE

Page 16: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

WARTOŚĆ OCZEKIWANA I WARIANCJA

wartość oczekiwana wariancja

• przebieg funkcji

• kształt rozkładu (gęstości)

prawdopodobieństwa

medianamodalna

Copyright ©2020, Joanna Szyda

Page 17: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

WARTOŚĆ OCZEKIWANA expected value

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

• E(X)=5.72 szczeniąt liczba urodzonych szczeniąt jest bliska 5

• E(X)= 0.03·1 + 0.04·2 + 0.06·3 +0.10·4 + 0.17·5 + 0.22·6 + 0.23·7 + 0.10·8 + 0.05·9

• E(W)=167 cm - większość koni ma wys. w kłębie 167 cm

Wartość oczekiwana (średnia)

• E(X)

• liczba, wokół której skupiają się poszczególne wartości X

• wartość średnia

9

1i

ii xpXE dwwwfWE

Copyright ©2020, Joanna Szyda

Page 18: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

WARIANCJA variance

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

Wariancja

V(X), Var(X),

liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej

odchylenie standardowe,

2

X

XdsXV X ..,,

2XEXEXV 2WEWEWV

Copyright ©2020, Joanna Szyda

Page 19: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

Standaryzacja zmiennej X

ZMIENNA STANDARYZOWANA

XV

XEXZ

• Z i X maja taki sam rozkład

• E(Z) = 0

• Var(Z) = 1

Copyright ©2020, Joanna Szyda

Page 20: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

Momenty rozkładu

MOMENTY

• n-ty moment

• n-ty moment centralny

• 1szy moment

• 2gi moment centralny

• 3ci moment centralny

• 4ty moment centralny

• wartość oczekiwana

• wariancja

• skośność

• kurtoza

Copyright ©2020, Joanna Szyda

Page 21: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

MEDIANA median

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA• P(X m) ½ i P(X m) ½ • F(w)=½

0.00

0.10

0.20

0.30

1 2 3 4 5 6 7 8 9

P(X

=x)

liczba szczeniąt x wysokość w kłębie wf (w

)

Mediana liczba, która dzieli funkcję gęstości na połowymniej zależna od odstających obserwacji niż śr.

x~

Copyright ©2020, Joanna Szyda

Page 22: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

MODALNA mode

• wartość x o najwyższym prawdopodobieństwie

0.00

0.05

0.10

0.15

0.20

0.25

1 2 3 4 5 6 7 8 9

P(X

=x)

liczba szczeniąt x

• wartość w dla której f(w) jest najwyższe

wysokość w kłębie w

f (w

)

Modalna liczba, która występuje najczęściej może istnieć więcej niż jedna modalna może nie być wartości modalnej

ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA

Copyright ©2020, Joanna Szyda

Page 23: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKI OPISOWE

rozkład skośny

1 2 3 4 5 6 7

1 2 3 4 5 6 7

modalna

mediana

w. oczekiwana

rozkład symetryczny

w. oczekiwanamodalnamediana

Copyright ©2020, Joanna Szyda

Page 24: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKI OPISOWE

mała wariancja

1 2 3 4 5 6 7

1 2 3 4 5 6 7

duża wariancja

Copyright ©2020, Joanna Szyda

Page 25: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKI OPISOWE

5 number data summary

Copyright ©2020, Joanna Szyda

Page 26: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKI OPISOWE

wykres pudełkowy box plot

mediana: 50% danych

1 kwartyl: 25% danych

3 kwartyl: 75% danych

minimum

maksimum

obserwacja odstająca

Copyright ©2020, Joanna Szyda

Page 27: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

STATYSTYKI OPISOWE

https://www.khanacademy.org/math/probability/random-variables-topic/random_variables_prob_dist/v/probability-density-functions

Copyright ©2020, Joanna Szyda

Page 28: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

PRZYKŁADOWE ROZKŁADY

Page 29: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ROZKŁAD NORMALNY

E(x) = mediana = modalna

2

2

1

,

,

2

1 2

2

N

x

exf

x

• Bardzo często spotykany w danych biologicznych

• Np. wydajność mleka

• Np. masa ciała prosięcia w 4 tygodniu życia

Copyright ©2020, Joanna Szyda

Page 30: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

2

0

,

1

2

2

12

12

k

kxVar

xE

t

x

k

x

kk

k

xf

k

k

ROZKŁAD t Studenta

• Kształt zależny od stopni swobody

• Dla wielu stopni swobody zbliżony do rozkładu normalnego

William Gossetpseudonim „student”

Copyright ©2020, Joanna Szyda

Page 31: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ROZKŁAD 2

kxVar

kxE

x

ek

xxf

k

x

k

k

2

],0(

22

2

2

2

12

• Skośny

• Kształt zależny od liczby stopni swobody

Copyright ©2020, Joanna Szyda

Page 32: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ROZKŁAD DWUMIANOWY

pnpxVar

npxE

nx

ppx

nxf

xnx

1

],0[

1

• Liczba "sukcesów" (x) w n próbach

• Np. liczba urodzonych ogierków w 10 wyźrebieniach

• Dla dużej liczby prób kształt zbliżony do rozkładu normalnego

Copyright ©2020, Joanna Szyda

Page 33: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

ROZKŁAD POISSONA

Copyright ©2020, Joanna Szyda

xVar

xE

nx

ex

xfx

],0[

!

• Liczba "sukcesów" (x) w danym przedziale czasu

• np. liczba odchowanych prosiąt w 2 tyg. po urodzeniu

• Przykład: http://www.youtube.com/watch?v=Fk02TW6reiA

Page 34: STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe 3. Populacje i próby danych 4. Testowanie hipotez i

1. Zmienna losowa

2. Funkcja gęstości prawdopodobieństwa

3. Dystrybuanta

4. Statystyki opisowe

5. Przykładowe rozkłady