Przeciętne
description
Transcript of Przeciętne
Przeciętne
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Główny podział przeciętnych
klasyczne: – średnia arytmetyczna– harmoniczna– geometryczna
pozycyjne: – mediana (kwartyl 2), kwartyl 1 i 3– dominanta (wartość modalna)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Sposób obliczania średniej aryt.
zsumowanie wszystkich indywidualnych wartości badanej zmiennej dla poszczególnych spostrzeżeń
podzielenie otrzymanej sumy przez liczbę spostrzeżeń
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Ogólny wzór
n
1ii
n
1ii
n21
xNx
N
xx
N
xxxx
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Przykład obliczeń (indywidualne dane)
48,0 54,1 55,0 53,5 47,5 42,5 50,5 52,0 56,4 50,1 62,0 60,0 49,2 56,9 56,4 62,5
53,516
856,6x
=średnia()
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Charakterystyka średniej aryt.
wyniki średniej są, z reguły, abstrakcją (oderwanie od rzeczywistości)
średnią wylicza się tylko dla zbiorowości jednorodnych
miara ta ma charakter pomocniczy - właściwy obraz daje szereg strukturalny i jego obraz graficzny
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Rozkład zmiennej dla średniej arytmetycznej
rozkład jednomodalny
0
50
100
150
200
250
zmienna (x)
częs
tość
(n)
x
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Rozkład asymetryczny skrajnie
0
50
100
150
200
250
zmienna (x)
częs
tość
(n)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Rozkład siodłowy
0
50
100
150
200
250
zmienna (x)
częs
tość
(n)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Rozkład bimodalny
0
50
100
150
200
250
zmienna (x)
częs
tość
(n)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
I przykład obliczeń (pogrupowane dane) 3 6 3 5 1 4 1 3 2 0 2 2 5 4 4 3
xi ni
0 11 22 33 44 35 26 1
razem 16
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna skokowa
0
1
2
3
4
5
0 1 2 3 4 5 6
zmienna
licze
bnoś
ć
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna skokowa
N
nxx
k
1iii
k21
kk2211
nnn
nxnxnxx
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna skokowaxi ni xini
0 1 0
1 2 2
2 3 6
3 4 12
4 3 12
5 2 10
6 1 6
razem 16 48
3x 16
48x
121
162110x
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna skokowa
xi ni xini
x1 n1 =A2*B2x2 n2 =A3*B3x3 n3 =A4*B4x4 n4 =A5*B5x5 n5 =A6*B6x6 n6 =A7*B7x7 n7 =A8*B8
razem =suma(B2:B8) =suma(C2:C8)
średnia =C9/B9
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
II przykład obliczeń (pogrupowane dane)
48,0 54,1 55,0 53,5 47,5 42,5 50,5 52,0 56,4 50,1 62,0 60,0 49,2 56,9 56,4 62,5
x0i-x1i ni
40-45 145-50 350-55 655-60 460-65 2razem 16
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna ciągła
0
1
2
3
4
5
6
7
40-45 45-50 50-55 55-60 60-65
zmienna
licze
bnoś
ć
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna ciągła
N
nxx
k
1iii
k21
kk2211
nnn
nxnxnxx
2
xxx 1i0i
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna ciągła
1i0i xx inix
ii nx
40-45 1 42,5 42,5
45-50 3 47,5 142,5
50-55 6 52,5 315,0
55-60 4 57,5 230,0
60-65 2 62,5 125,0
razem 16 × 855,0
53,4x 16
855x
231
262,5347,5142,5x
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna ciągła
Błędy:– przypadkowe, wynikające z
niedostatecznej liczby spostrzeżeń– przy ustalaniu indywidualnej wartości
zmiennej, w szczególności wynikające z zaokrągleń
– systematyczne, występujące przede wszystkim w rozkładach skrajnie asymetrycznych
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna ciągła
wiek liczebność %
40-44 15 15,6
45-49 24 25,0
50-54 22 22,9
55-59 16 16,7
60-64 6 6,3
65-69 6 6,3
70-74 4 4,2
75 i więcej 3 3,1
razem 96 100,0
75-79
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia aryt. - zmienna ciągła
0ix 1ix inix
ii nx
X01 X11 n1 =(A2+B2)/2 =D2*C2
X02 X12 n2 =(A3+B3)/2 =D3*C3
X03 X13 n3 =(A4+B4)/2 =D4*C4
X04 X14 n4 =(A5+B5)/2 =D5*C5
X05 X15 n5 =(A6+B6)/2 =D6*C6
razem =suma(C2:C6) =suma(E2:E6)
średnia =E7/C7
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna
jest odwrotnością średniej arytmetycznej z odwrotności wartości zmiennych
jest stosowana wówczas, kiedy wartości zmiennej podane są w jednostkach względnych, np.:– gęstość zaludnienia (osoby na km2)– spożycie artykułu X na 1 osobę
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - wzory
N
1i ix1
NH
k
1ii
i
nx1N
H
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - przykład
Gęstość zaludnienia w dwóch 60 tys. miastach wynosiła kolejno 400 osób/km2, 600 osób/km2. Ile wynosi średnia gęstość zaludnienia?
2osób/km 4805
2400
5
1200
1
2
120023
2
6001
4001
2H
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna a arytmetyczna (przykład M. Sobczyka)
Zastosowanie średniej arytmetycznej w celu obliczenia przeciętnej gęstości daje następujący wynik:
2osób/km 5002
1000
2
600400x
Wynik ten jest nieprawidłowy, ponieważ każde z miast zajmuje różną powierzchnię:
22
22
km 100osób/km 600:osób 000 60
km 150osób/km 400 :osób 000 60
a zatem:22 osób/km 084km 250 :osób 000 120
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - drugi przykład
państwo gęstość zaludnienia
Estonia 24
Litwa 45
Łotwa 30
2osób/km 4,130333,00400,00222,0
3
301
451
241
3H
Gęstość zaludnienia w trzech nadbałtyckich republikach w końcu 1936 roku
Źródło: Mały Rocznik Statystyczny 1939, s. 16.
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - formuła
xi średnia harm. =średnia.harmoniczna(A2:A6)
x1
x2
x3
x4
x5
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Wprowadzenie do formuł logicznych
=jeżeli( ; ; )
test logiczny
wartość jeżeli prawda
wartość jeżeli fałsz
Wartość prawdy lub fałszu wyrażona tekstem powinna być ujęta w cudzysłowie
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Prosty przykład działania formuły logicznej jeżeli
10 15 =jeżeli(A1>B1;”zgadza się”;”nie pasuje”)
10 10 =jeżeli(A2>B2;”zgadza się”;”nie pasuje”)
14 12 =jeżeli(A 3>B3;”zgadza się”;”nie pasuje”)
[C1] nie pasuje
[C3] zgadza się
[C2] nie pasuje
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Prosty przykład działania formuły logicznej jeżeli
10 15 =jeżeli(A1+B1=20;100;1)
10 10 =jeżeli(A2+B2=20;100;1)
14 12 =jeżeli(A3+B3=20;100;1)
[C1] 1
[C3] 1
[C2] 100
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - formuła
xi 1/xi
104 =1/A2
90 =1/A3
96 =1/A4
66 =1/A5
liczebność (N) =ile.liczb(A2:A5)
suma odwrotności wart. cechy ( ix
1) =suma(B2:B5)
średnia harmoniczna =B6/B7
Czechosłowacja
Polska
Rumunia
Węgry
[B8] 86,4
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - formuła
xi 1/xi
104 =1/A2
90 =1/A3
96 =1/A4
=1/A5
liczebność (N) =ile.liczb(A2:A5)
suma odwrotności wart. cechy ( ix
1) =suma(B2:B5)
średnia harmoniczna =B6/B7
Czechosłowacja
Polska
Węgry
#DZIEL/0!
#DZIEL/0!
#DZIEL/0!
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - formuła
xi 1/xi
104 =jeżeli(A2=0;0;1/A2)
90 =jeżeli(A3=0;0;1/A3)
96 =jeżeli(A4=0;0;1/A4)
66 =jeżeli(A5=0;0;1/A5)
liczebność (N) =ile.liczb(A2:A5)
suma odwrotności wart. cechy ( ix
1) =suma(B2:B5)
średnia harmoniczna =B6/B7
Czechosłowacja
Polska
Rumunia
Węgry
[B8] 86,4
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Średnia harmoniczna - formuła
xi 1/xi
104 =jeżeli(A2=””;””;1/A2)
90 =jeżeli(A3=””;””;1/A3)
96 =jeżeli(A4=””;””;1/A4)
=jeżeli(A5=””;””;1/A5)
liczebność (N) =ile.liczb(A2:A5)
suma odwrotności wart. cechy (ix
1) =suma(B2:B5)
średnia harmoniczna =B6/B7
Czechosłowacja
Polska
Węgry
[B8] 96,3
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Dominanta
jest to wartość zmiennej, której odpowiada największa liczba spostrzeżeń lub wartość zmiennej, dookoła której grupują się najgęściej spostrzeżenia (drugie określenie odnosi się przede wszystkim do cechy ciągłej)
jej wartość dla szeregów strukturalnych przedziałowych jest szacowana
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Warunki obliczania dominanty
badany rozkład wartości cechy ma jeden ośrodek dominujący
asymetria rozkładu jest umiarkowana przedział, w którym występuje
dominanta, oraz sąsiadujące z nim przedziały mają te same rozpiętości
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Ustalanie dominanty w szeregu wyliczającym i punktowym
3 6 3 5 1 4 1 3 2 0 2 2 5 4 4 3
0 1 1 2 2 2 3 3 3 3 4 4 4 5 5 6
wartość najczęstsza: 3
xi ni
0 11 22 33 44 35 26 1
razem 16
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Ustalanie dominanty w szeregu przedziałowym x0i-x1i ni
40-45 145-50 350-55 655-60 460-65 2razem 16
Przedział zawierający wartość dominującą
0D1DD
D1DD1DD
1DD0D
xxh
h)n(n)n(n
nnxD(x)
Największa liczebność
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie dominanty z szeregu przedziałowego
x0i-x1i ni
40-45 145-50 350-55 655-60 460-65 2razem 16
53D(x)5
1550D(x)
523
350D(x)
50)(554)(63)(6
3650D(x)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie dominanty bez automatyzacji
0ix 1ix in dominanta
X01 X11 n1
X02 X12 n2
X03 X13 n3 =A4+(C4-C3)/((C4-C3)+(C4-C5))*(B4-A4)
X04 X14 n4
X05 X15 n5
założenie: n3 jest największą liczebnością cząstkową
D1DD1DD
1DD0D h
)n(n)n(n
nnxD(x)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie dominanty z automatyzacją
0ix 1ix in dominanta
X01 X11 n1
X02 X12 n2=jeżeli(C3=max($C$2:$C$6);A3+(C3-C2)/((C3-C2)+(C3-C4))*(B3-A3);0)
X03 X13 n3=jeżeli(C4=max($C$2:$C$6);A4+(C4-C3)/((C4-C3)+(C4-C5))*(B4-A4);0)
X04 X14 n4=jeżeli(C5=max($C$2:$C$6);A5+(C5-C4)/((C5-C4)+(C5-C6))*(B5-A5);0)
X05 X15 n5
dominanta =suma(D3:D5) lub =max(D3:D5)
Jeżeli n2 jest największe wśród poszczególnych n, to wartość dominanty będzie w komórce D3 (w komórce D4 i D5 wartość 0)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Charakterystyka mediany
Mediana jest wartością cechy (zmiennej), która dzieli badaną zbiorowość na dwie połowy, co oznacza, iż u 50% jednostek statystycznych wartości cechy są niższe od mediany a u 50% jednostek statystycznych są wyższe.
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Charakterystyka mediany Medianę można stosować jako miarę
charakteryzującą nie tylko rozkłady jednomodalne, ale także bimodalne, wielomodalne, skrajnie asymetryczne i siodłowe.
Przeciętną tę można wykorzystać w charakterystyce szeregów strukturalnych dla cechy ciągłej lub quasi ciągłej, mających otwarte przedziały klasowe.
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Wartość środkowa - mediana
42,5 47,5 48,0 49,2 50,1 50,5 52,0 53,5 54,1 55,0 56,4 56,4 56,9 60,0 62,0 62,5
48,0 54,1 55,0 53,5 47,5 42,5 50,5 52,0 56,4 50,1 62,0 60,0 49,2 56,9 56,4 62,5
8,532
1,545,53
Me
42,5 47,5 48,0 49,2 50,1 50,5 52,0 53,5 54,1 55,0 56,4 56,4 56,9 60,0 62,0
5,53Me
parzystejest Ngdy ,)(2
1
enieparzystjest Ngdy ,
122
2
1
nn
n
xxMe
xMe
=mediana(A1:O1)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Mediana i szereg kumulowany - wzory
MeMeMe
MeMe
k
ii
Me
xxh
hn
nN
xMeQ
01
1
102
2
x 0 i-x 1 i n i n k u m .
x 0 1 -x 1 1 n 1 n 1
x 0 2 -x 1 2 n 2 n 1 + 2
x 0 3 -x 1 3 n 3 n 1 + 2 + 3
x 0 4 -x 1 4 n 4 n 1 + 2 + 3 + 4
x 0 5 -x 1 5 n 5 n 1 + 2 + 3 + 4 + 5
ra z e m in ×
2
N
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie medianyx0i-x1i ni nskum.
40-45 1 145-50 3 450-55 6 1055-60 4 1460-65 2 16razem 16 ×
2
16
3,53533
1050
6
2050
3,533
1050
6
20505
6
4505
6
4850
)5055(6
42
16
50
31
2
2
2
MeQ
MeQ
MeQ
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie mediany cd.
x0i-x1i ni nskum.
8-16 6 616-24 5 1124-32 3 1432-40 1 1540-48 1 16razem 16 ×
2
16
2,19195
16168
5
2168
5
6816
)1624(5
62
16
16
51
2
2
MeQ
MeQ
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie kwartyla I
8,464624
45455
24
9455
24
152445
)4550(24
154
96
45
2421
1
1
Q
Q
wiek liczebność liczeb. kum.
40-44 15 15
45-49 24 39
50-54 22 61
55-59 16 77
60-64 6 83
65-69 6 89
70-74 4 93
75 i więcej 3 96
razem 96
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie kwartyla III
4,585816
55555
16
11555
16
617255
)5560(16
614963
55
167
3
3
Q
Q
wiek liczebność liczeb. kum.
40-44 15 15
45-49 24 39
50-54 22 61
55-59 16 77
60-64 6 83
65-69 6 89
70-74 4 93
75 i więcej 3 96
razem 96
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Zasady wykresu skrzynkowego - pudełkowego
31
3311
3311
31
13
)5,1()5,1(
)3()5,1()3()5,1(
)3()3(
QxQ
QQxQQQxQ
QQxQQQQxQQ
QQxxQQ
QQQ
i
ii
ii
ii
ekstremalne
odstające
Rozstęp międzykwartylowy (ćwiartkowy)
typowe
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
nietypowe ale nieodstające
Wykres skrzynkowy - pudełkowy42,5 47,5 48,0 49,2 50,1 50,5 52,0 53,5 54,1 55,0 56,4 56,4 56,9 60,0 62,0 62,5
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
II wykres skrzynkowy - pudełkowy42,5 47,5 48,0 49,2 50,1 50,5 52,0 53,5 54,1 55,0 56,4 56,4 56,9 60,0 62,0 62,5 20,0 71,0 83,0 100,0
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Intensywność zgonów niemowląt w państwach europejskich w 2008 roku
Formuła logiczna „oraz”
Zwraca wartość „Prawda”, jeśli wszystkie argumenty mają wartość „Prawda”; zwraca wartość „Fałsz”, jeśli dowolny argument ma wartość „Fałsz”.
=oraz( ; )Test drugi
Test pierwszy
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Formuła logiczna „oraz” cd.
16 15 =oraz(A1>15;B1<20)
10 10 =oraz(A2>15;B2<20)
17 24 =oraz(A3>15;B3<20)
[C1] Prawda
[C2] Fałsz
[C3] Fałsz
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Obliczanie mediany bez automatyzacji
0ix 1ix in kum.n mediana
X01 X11 n1 n1
X02 X12 n2 n1+2
X03 X13 n3 n1+2+3
X04 X14 n4 n1+2+3+4 =A5+(C7/2-D4)/C5*(B5-A5)
X05 X15 n5 n1+2+3+4+5
razem =suma(C2:C6)
Założenie: wartość N/2 znajduje się w szeregu kumulowanym pomiędzy n1+2+3 a n1+2+3+4
MeMeMe
MeMe
k
ii
Me
xxh
hn
nN
xMeQ
01
1
102
2
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Założenie: w przedziale x04-x14 znajduje się mediana
Obliczanie medianyz automatyzacją
0ix 1ix in kum.n mediana
X01 X11 n1 =C2=jeżeli($C$7/2<D2;A2+$C$7/2/C2*(B2-A2);0)
X02 X12 n2 =D2+C3=jeżeli(oraz($C$7/2>D2;$C$7/2<D3);A3+($C$7/2-D2)/C3*(B3-A3);0)
X03 X13 n3 =D3+C4=jeżeli(oraz($C$7/2>D3;$C$7/2<D4);A4+($C$7/2-D3)/C4*(B4-A4);0)
X04 X14 n4 =D4+C5=jeżeli(oraz($C$7/2>D4;$C$7/2<D5);A5+($C$7/2-D4)/C5*(B5-A5);0)
X05 X15 n5 =D5+C6=jeżeli(oraz($C$7/2>D5;$C$7/2<D6);A6+($C$7/2-D5)/C6*(B6-A6);0)
razem =suma(C2:C6)
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US