W dalszej części zajęć wyróżniać będziemy następujące rodzaje szeregów: szereg...
description
Transcript of W dalszej części zajęć wyróżniać będziemy następujące rodzaje szeregów: szereg...
W dalszej części zajęć wyróżniać będziemy następujące rodzaje szeregów:
• szereg szczegółowy• szereg rozdzielczy przedziałowy • szereg rozdzielczy punktowy
Miary pozycyjne
Miary pozycyjne są rzeczywistymi wartościami badanej cechy statystycznej występujące w uporządkowanym szeregu statystycznym, wybrane ze względu na zajmowaną pozycję w tym szeregu.
Do miar pozycyjnych zalicza się przede wszystkim wartość modalną (dominantę) i medianę
Wartość modalna (dominanta)
Wartość modalna (Mo) jest to wartość cechy, która najczęściej (najliczniej) występuje w badanej zbiorowości statystycznej. Można, stwierdzić, że jest to wartość typowa dla tej zbiorowości. Wartość modalną przedstawiać będziemy następująco: Mo = xd
gdzie xd wartość cechy, dla której ni = max
PrzykładZbadano cenę paliwa E-95 na 9 stacjach benzynowych w Warszawie.3,5 3,7 3,6 3,7 3,6 3,8 3,6 3,9 3,8
ile wynosi wartość modalna ceny paliwa
3,5 3,6 3,6 3,6 3,7 3,7 3,8 3,8 3,9
Mo = 3,6
Wartość modalna (dominanta)
Jeżeli materiał statystyczny podany jest w postaci szeregu rozdzielczego przedziałowego, znajdujemy najpierw przedział w o największej liczebności. Następnie wyznaczamy wartość modalną na podstawie następującego wzoru interpolacyjnego.
)()( 11
1
dddd
dddDdo nnnn
nnlxM
gdzie:xDd — dolna granica przedziału wartości modalnejnd — liczebność przedziału wartości modalnejnd-1 — liczebność przedziału poprzedzającego przedział wartości modalnejnd+1 — liczebność przedziału następującego po przedziale wartości modalnejld — rozpiętość przedziału wartości modalnej.
Jest to wartość cechy, która rozdziela zbiorowość na dwie równe części, zajmując środkową pozycję w szeregu statystycznym.
Mediana (wartość środkowa)
Mediana (wartość środkowa)
2
1 ne xM
2
1n
PMe
2
122
nn
e
xx
M
2
nPMe
gdy n jest nieparzyste gdy n jest parzyste
Dysponujemy zbiorem informacji o liczbie wyrobów wytworzonych na siedmiu stanowiskach pracy: 101, 92, 95, 98, 96, 94, 97
Wyznacz medianę
Przypadek gdy n – nieparzyste
92, 94, 95, 96, 97, 98, 101
964
2
17
2
1 xxxM ne
42
17
2
1
n
PMe
Dysponujemy zbiorem informacji o liczbie wyrobów wytworzonych na siedmiu stanowiskach pracy: 101, 92, 95, 98, 96, 94, 97, 88
Wyznacz medianę
Przypadek gdy n – parzyste
88, 92, 94, 95, 96, 97, 98, 101
42
8
2
nPMe
5,952
9695
22214411
22 28
28
xxxxxx
Mnn
e
Dla szeregu rozdzielczego przedziałowego, najpierw wyznacza się przedział klasowy mediany. Przy wyznaczaniu tego przedziału korzystamy z szeregu kumulacyjnego (szereg powstały w wyniku narastającego sumowania liczebności poszczególnych klas). Następnie stosujemy następujący wzór przybliżający wartość mediany:
Mediana
1
1
M
iiMe
M
MDMe nP
n
lxM
xDM – dolna granica przedziału klasowego mediany,lM – rozpiętość przedziału klasowego mediany,nM – liczba jednostek obserwacji w przedziale klasowym medianyPMe – pozycja mediany w szeregu statystycznym
1
1
M
iin
- łączna liczba obserwacji w klasach poprzedzających klasę zawierającą medianę, czyli liczebność skumulowana przedziałów klasowych poprzedzających przedział mediany
M
MM
i
iMeDMe n
lnPxM
1
1
43500
1015040
500
1075090040
eM
40DMx
900MeP
7501
1
M
i
in 10Ml 500Mn
Liczebność skumulowana
100
350
750
1250
1600
1800
Mediana dzieli zbiorowość na równe dwie części, a więc informuje, poniżej i powyżej jakiej wartości cechy znajduje się 50% zbiorowości. Według tej samej zasady można podzielić zbiorowość na większą liczbę części.
Wartości te nazywamy kwantylami (od słowa „kwant”). W zależności od liczby części, na jakie dzieli się zbiór wartości badanej cechy, otrzymujemy konkretne kwantyle. Najczęściej stosowane są:
kwartyle – dzielą szereg statystyczny na 4 części (jest ich 3)decyle – dzielą szereg statystyczny na 10 części (jest ich 9)centyle – dzielą szereg statystyczny na 100 części (jest ich 99).
Miary pozycyjne wyższych rzędów
Kwantyle oznaczać będziemy następująco:
Qb,v
gdzie:b – numer kwantyla,v – rząd kwantyla, tzn. dla kwartyli v = 4, dla decyli v = 10, a dla centyli v = 100.
pierwszy element w zbiorze ostatni element w zbiorze
Q1,4 Q2,4 Q3,4
KWARTYLE
Miary i wskaźniki służące do oceny badanej cechy
• rozstęp • odchylenie ćwiartkowe• współczynnik skośności
n
xxs
n
ii
1
2
2
n
nxxs
k
iii
1
2
2
n
nxxs
k
iisi
1
2
2
Wariancja
Wariancja jest średnią arytmetyczną kwadratów odchyleń wartości cechy od średniej.
Wariancja dla szeregu szczegółowego
Wariancja dla szeregu rozdzielczego przedziałowego
Wariancja dla szeregu rozdzielczego punktowego
Odchylenie standardowe Odchylenie standardowe jest pierwiastkiem kwadratowym średniej arytmetycznej, kwadratów odchyleń wartości cechy od średniej.
Odchylenie standardowe jest pierwiastkiem z wariancji.
dla szeregu szczegółowego
dla szeregu rozdzielczego przedziałowego
dla szeregu rozdzielczego punktowego
n
xxs
n
ii
1
2
n
nxxs
k
iisi
1
2
n
nxxs
k
iii
1
2
Wiek Liczba
10-20 100
20-30 250
30-40 400
40-50 500
50-60 350
60-70 200
Razem 1800 334200
96800484
50400144
20004
2560064
81000324
78400784
76500
1300065
1925055
2250045
1400035
625025
150015
2isi xx six isi nx iisi nxx 2
435,421800
765001
n
nxx
k
iisi
2GiDi
si
xxx
n
xxs
n
isi
1
2
2
68%
95%
99%
xi
ni
s s s sss
Obszar wartości typowych badanej cechy statystycznej
Obszar wartości charakterystycznych badanej
cechy statystycznej
Obszar wartości badanej cechy statystycznej
Odchylenie przeciętneOdchylenie przeciętne jest średnią arytmetyczną odchyleń poszczególnych wartości cechy od średniej.
dla szeregu szczegółowego
dla szeregu rozdzielczego przedziałowego
dla szeregu rozdzielczego punktowego
n
xxd
n
ii
x
1
n
nxxd
i
k
isi
x
1
n
nxxd
i
k
ii
x
1
Miary i wskaźniki służące do oceny badanej cechy
• rozstęp • odchylenie ćwiartkowe• współczynnik skośności