STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład...
Transcript of STATYSTYKA MATEMATYCZNAtheta.edu.pl/wp-content/uploads/2020/03/...STATYSTYKA MATEMATYCZNA 1. Wykład...
STATYSTYKA MATEMATYCZNA
1. Wykład wstępny
2. Zmienne losowe
3. Populacje i próby danych
4. Testowanie hipotez i estymacja parametrów
5. Test t
6. Test 2
7. Test F
8. Testy nieparametryczne
9. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
10. Korelacja
11. Regresja liniowa
12. Regresja nieliniowa
13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej
14. Analiza wariancji
15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP
1. Zmienna losowa
2. Funkcja gęstości prawdopodobieństwa
3. Dystrybuanta
4. Statystyki opisowe
5. Przykładowe rozkłady
Copyright ©2020, Joanna Szyda
ZMIENNA LOSOWA
ZMIENNA LOSOWA random variable
ZMIENNA funkcja, przyjmuje różne wartości
LOSOWA wartości są określone przez przypadek
ZMIENNA LOSOWA X
PRZYJĘTA WARTOŚĆ (REALIZACJA) x
ZMIENNA LOSOWA DYSKRETNA wartości przeliczalne
pomiar w skali nominalnej (brak uporządkowania) np.?
pomiar w skali porządkowej (uporządkowanej) np.?
ZMIENNA LOSOWA CIĄGŁA dowolne wartościCopyright ©2020, Joanna Szyda
ZMIENNA LOSOWA random variable
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
• liczba szczeniąt w miocie
X
• X=x czyli X=7
• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }
• wysokość konia w kłębie
W
• W=w czyli W=167
• W [ 150, 190 ]Copyright ©2020, Joanna Szyda
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
• funkcja prawdopodobieństwa
• jakie jest prawdopodobieństwo uzyskania danej wartości
• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }
• P(X=xi)
• np. urodzenie 5 szczeniąt:
P(X=5)
• funkcja gęstości prawdopodobieństwa
• jakie jest prawdopodobieństwo uzyskania wartości z danego przedziału
• W [ 150, 190 ]
• f(w)
• np. wys. w kłębie [160,165]
12.0
165
160
dwwf
Copyright ©2020, Joanna Szyda
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
0.00
0.05
0.10
0.15
0.20
0.25
1 2 3 4 5 6 7 8 9
P(X
=x)
liczba szczeniąt x
19
1
i
ixXP
wysokość w kłębie w
f (w
)
1
dwwf
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function
Copyright ©2020, Joanna Szyda
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
z
f (w
,z)
w
x
y
P(x
,y)
prawdopodobieństwołączne, warunkowe
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function
Copyright ©2020, Joanna Szyda
DYSTRYBUANTA
DYSTRYBUANTA cumulative distribution function
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
• dystrybuanta
• jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej x
• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }
• F(x) = P(Xx)
• np. urodzenie maksymalnie 5 szczeniąt
F(5)=P(X5)=0.40
• dystrybuanta
• jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej w
• W [ 150, 190 ]
•
• np. maksymalna wys. w kłębie 170
dwwfwF
w
69.0170
170
dwwfF
Copyright ©2020, Joanna Szyda
DYSTRYBUANTA cumulative distribution function
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
0.00
0.50
1.00
1.50
1 2 3 4 5 6 7 8 9
P(X
x)
maks. liczba szczeniąt x
19
1
i
ixXP
wysokość w kłębie w
F (w
)
1wF
Copyright ©2020, Joanna Szyda
• pr. urodzenia 1 szczeniaka:F(1)=P(X1)=0.03
• pr. urodzenia maks. 9 szczeniaków:F(9)=P(X9)=1
• pr. urodzenia maks. 3 szczeniaków:F(3)=P(X3)=0.03+0.04+0.06
• pr. urodzenia 4 lub 5 szczeniaków:F(5)-F(3)
DYSTRYBUANTA cumulative distribution function
ZMIENNA LOSOWA DYSKRETNA
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1 2 3 4 5 6 7 8 9
P(X
x)
maks. liczba szczeniąt x
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1 2 3 4 5 6 7 8 9
P(X
x)
maks. liczba szczeniąt x
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1 2 3 4 5 6 7 8 9
P(X
x)
maks. liczba szczeniąt x
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1 2 3 4 5 6 7 8 9
P(X
x)
maks. liczba szczeniąt x
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1 2 3 4 5 6 7 8 9
P(X
x)
maks. liczba szczeniąt x
Copyright ©2020, Joanna Szyda
• pr. wystąpienia osobnika o wys. w kłębie maks. 150 cm:F(150)=P(W150)=0.11
• pr. wystąpienia osobnika o wys. w kłębie maks. 190 cm:F(190)=P(W190)=1.00
• pr. wystąpienia osobnika o wys. w kłębie 160-170 cm:F(170)-F(160)=0.32
• pr. wystąpienia osobnika o wys. w kłębie pow. 165 cm:1-F(165)=0.62
DYSTRYBUANTA cumulative distribution function
ZMIENNA LOSOWA CIĄGŁA
wysokość w kłębie w
F (w
)Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
WARTOŚĆ OCZEKIWANA I WARIANCJA
wartość oczekiwana wariancja
• przebieg funkcji
• kształt rozkładu (gęstości)
prawdopodobieństwa
medianamodalna
Copyright ©2020, Joanna Szyda
WARTOŚĆ OCZEKIWANA expected value
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
• E(X)=5.72 szczeniąt liczba urodzonych szczeniąt jest bliska 5
•
• E(X)= 0.03·1 + 0.04·2 + 0.06·3 +0.10·4 + 0.17·5 + 0.22·6 + 0.23·7 + 0.10·8 + 0.05·9
• E(W)=167 cm - większość koni ma wys. w kłębie 167 cm
•
Wartość oczekiwana (średnia)
• E(X)
• liczba, wokół której skupiają się poszczególne wartości X
• wartość średnia
9
1i
ii xpXE dwwwfWE
Copyright ©2020, Joanna Szyda
WARIANCJA variance
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
Wariancja
V(X), Var(X),
liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej
odchylenie standardowe,
2
X
XdsXV X ..,,
2XEXEXV 2WEWEWV
Copyright ©2020, Joanna Szyda
Standaryzacja zmiennej X
ZMIENNA STANDARYZOWANA
XV
XEXZ
• Z i X maja taki sam rozkład
• E(Z) = 0
• Var(Z) = 1
Copyright ©2020, Joanna Szyda
Momenty rozkładu
MOMENTY
• n-ty moment
• n-ty moment centralny
• 1szy moment
• 2gi moment centralny
• 3ci moment centralny
• 4ty moment centralny
• wartość oczekiwana
• wariancja
• skośność
• kurtoza
Copyright ©2020, Joanna Szyda
MEDIANA median
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA• P(X m) ½ i P(X m) ½ • F(w)=½
0.00
0.10
0.20
0.30
1 2 3 4 5 6 7 8 9
P(X
=x)
liczba szczeniąt x wysokość w kłębie wf (w
)
Mediana liczba, która dzieli funkcję gęstości na połowymniej zależna od odstających obserwacji niż śr.
x~
Copyright ©2020, Joanna Szyda
MODALNA mode
• wartość x o najwyższym prawdopodobieństwie
0.00
0.05
0.10
0.15
0.20
0.25
1 2 3 4 5 6 7 8 9
P(X
=x)
liczba szczeniąt x
• wartość w dla której f(w) jest najwyższe
wysokość w kłębie w
f (w
)
Modalna liczba, która występuje najczęściej może istnieć więcej niż jedna modalna może nie być wartości modalnej
ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA
Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
rozkład skośny
1 2 3 4 5 6 7
1 2 3 4 5 6 7
modalna
mediana
w. oczekiwana
rozkład symetryczny
w. oczekiwanamodalnamediana
Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
mała wariancja
1 2 3 4 5 6 7
1 2 3 4 5 6 7
duża wariancja
Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
5 number data summary
Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
wykres pudełkowy box plot
mediana: 50% danych
1 kwartyl: 25% danych
3 kwartyl: 75% danych
minimum
maksimum
obserwacja odstająca
Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
https://www.khanacademy.org/math/probability/random-variables-topic/random_variables_prob_dist/v/probability-density-functions
Copyright ©2020, Joanna Szyda
PRZYKŁADOWE ROZKŁADY
ROZKŁAD NORMALNY
E(x) = mediana = modalna
2
2
1
,
,
2
1 2
2
N
x
exf
x
• Bardzo często spotykany w danych biologicznych
• Np. wydajność mleka
• Np. masa ciała prosięcia w 4 tygodniu życia
Copyright ©2020, Joanna Szyda
2
0
,
1
2
2
12
12
k
kxVar
xE
t
x
k
x
kk
k
xf
k
k
ROZKŁAD t Studenta
• Kształt zależny od stopni swobody
• Dla wielu stopni swobody zbliżony do rozkładu normalnego
William Gossetpseudonim „student”
Copyright ©2020, Joanna Szyda
ROZKŁAD 2
kxVar
kxE
x
ek
xxf
k
x
k
k
2
],0(
22
2
2
2
12
• Skośny
• Kształt zależny od liczby stopni swobody
Copyright ©2020, Joanna Szyda
ROZKŁAD DWUMIANOWY
pnpxVar
npxE
nx
ppx
nxf
xnx
1
],0[
1
• Liczba "sukcesów" (x) w n próbach
• Np. liczba urodzonych ogierków w 10 wyźrebieniach
• Dla dużej liczby prób kształt zbliżony do rozkładu normalnego
Copyright ©2020, Joanna Szyda
ROZKŁAD POISSONA
Copyright ©2020, Joanna Szyda
xVar
xE
nx
ex
xfx
],0[
!
• Liczba "sukcesów" (x) w danym przedziale czasu
• np. liczba odchowanych prosiąt w 2 tyg. po urodzeniu
• Przykład: http://www.youtube.com/watch?v=Fk02TW6reiA
1. Zmienna losowa
2. Funkcja gęstości prawdopodobieństwa
3. Dystrybuanta
4. Statystyki opisowe
5. Przykładowe rozkłady