Post on 15-Jan-2016
description
11
Porównanie symulacyjne Porównanie symulacyjne wybranych testów wybranych testów wielowymiarowej wielowymiarowej
normalności w modelu normalności w modelu liniowym liniowym
Zofia Hanusz i Joanna Zofia Hanusz i Joanna TarasińskaTarasińska
Uniwersytet Przyrodniczy w Uniwersytet Przyrodniczy w LublinieLublinie
WISŁA 2010WISŁA 2010
22
Testy do badania p p - - wymiarowej wymiarowej normalnościnormalności
p=2 (T. Ledwina, T. Inglot, M. Bogdan)
p2
Metody graficzne:Q-QP-P
Metody analityczne:- uogólniające test Shapiro-Wilka
(Srivastava, Royston, Srivastava & Hui), - uogólniające testy oparte na kurtozie
i skośności (Mardia, Small, Malkovich,
Afifi)- oparte na funkcji charakterystycznej
(Arcones)
33
Tematyka badań Tematyka badań • Propozycja testu do badania wielowymiarowej
normalności, opartego na teście Shapiro-Wilka• Rozważenie wielowymiarowego liniowego
modelu obserwacji• Porównanie testu z dwoma innymi testami także
opartymi na teście Shapiro-Wilka zaproponowanymi przez Srivastavę i Hui
• Porównanie poziomu istotności i mocy powyższych testów z testem Henze-Zirklera
44
pnpnpn EBXY
33
333
222
111
nnn
nnn
nnn
100010001
X 321 μμμB
pn
pn
pn
pn
3
2
1
3
2
1
Y
Y
Y
Y
),(~ 1 ΣμpN
YXXXXYE 1 ˆH0: reszty niNpp
ppi ,,1,~
1
Σ0E
Poziom istotności Moc
ModelModel
),(~ 2 ΣμpN
),(~ 3 ΣμpN
MPII(0) – jednostajny na elipsie
MPVII(2) – wielowymiarowy t
Mieszanina rozkładów normalnych
55
Test Shapiro-Test Shapiro-WilkaWilka
Statystyka Shapiro-Wilka (Shapiro, Wilk, 1965) :
nxxx ,,, 21
)()2()1( nxxx
2210 , ~ ,,,: NxxxH n
2
1,
1
2
1
n
jjnjn
jj
xa
xx
W
- niezależne zmienne losowe o tym samym rozkładzie
- wartości uporządkowane
Wartości z tablic
66
1,01
ln ~0
NW
WWG
asH
Shapiro i Wilk (1968) zaproponowali przekształcenie
, , – stałe z tablic zależne od n.
Małe wartości statystyki wskazują brak normalności zmiennych.
77
Adaptacja statystyki Adaptacja statystyki GG((WW) do ) do zmiennych wielowymiarowychzmiennych wielowymiarowych
n
jjn 1
1xx
n
jjjn 1
1xxxxS
że takaa,ortogonaln macierz - ,,1 phhH HHΛS
jiijy xh pi ,,1 nj ,,1
Σμxxx , ~ ,,,: 210 pn NH
Srivastava i Hui (1987) zaproponowali uogólnienie testu Srivastava i Hui (1987) zaproponowali uogólnienie testu Shapiro – Wilka, wykorzystując składowe główne. Shapiro – Wilka, wykorzystując składowe główne.
88
Niech piyan
iWn
jjij
i,,1,
12
1
W(i) są asymptotycznie niezależne
)1,0(~ NiWGGas
i yjednostajnGi ~ 22~ln2 iG
Srivastava i Hui (1987) do testowania H0 zaproponowali
22
11
0
~ln2 p
asH
p
iiGM
Duże wartości M1 świadczą o braku normalności.
99
Srivastava i Hui (1987) zaproponowali także statystykę
iWMpi ,,1
2 min
pxGxM 11Pr 2
Test odrzuca normalność dla małych M2 .
która przy prawdziwości hipotezy H0 ma przybliżony rozkład:
1010
GpV
p
iiG
pG
1
1
Gi są asymptotycznie niezależne
1,0~0
NGasH
i 1,0
0
~ NGpVasH
iW
iWGi 1
ln
Nasza propozycjaNasza propozycja: :
Lewy „ogon” rozkładu normalnego standardowego wskazuje na brak normalności.
1111
Shapiro-Wilk Royston
-0,3964 -0,378623-0,2737 -0,281638-0,2368 -0,240640-0,2098 -0,213270-0,1878 -0,191068-0,1691 -0,172070-0,1526 -0,155252-0,1376 -0,140012-0,1237 -0,125959-0,1108 -0,112827-0,0986 -0,100422-0,0870 -0,088599-0,0759 -0,077247-0,0651 -0,066276-0,0546 -0,055611-0,0444 -0,045191-0,0343 -0,034961-0,0244 -0,024873-0,0146 -0,014885-0,0049 -0,0049550,0049 0,0049550,0146 0,0148850,0244 0,0248730,0343 0,0349610,0444 0,0451910,0546 0,0556110,0651 0,0662760,0759 0,0772470,0870 0,0885990,0986 0,1004220,1108 0,1128270,1237 0,1259590,1376 0,1400120,1526 0,1552530,1691 0,1720700,1878 0,1910680,2098 0,2132700,2368 0,2406400,2737 0,2816380,3964 0,378623
Shapiro-Wilk Royston
0,2737 0,2816380,3964 0,378623
RozbieżnościRozbieżności
0,02
0,025
0,03
0,035
0,04
0,045
0,05
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,035
0,04
0,045
0,05
0,055
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
322110
3
2
1
0,99,29,20,1
0,59,09,00,1
ΣΣIΣ p
1212
25994
8332
ΣΣIΣ p
0,035
0,04
0,045
0,05
0,055
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,02
0,025
0,03
0,035
0,04
0,045
0,05
0,055
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
30202010100
3
2
1
μ
μ
μ
ai według Roystona
ai z Tablicy Shapiro-Wilka
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1313
MPII(0) – jednostajny na elipsieMPII(0) – jednostajny na elipsie
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,99,29,20,1
0,59,09,00,1
ΣΣIΣ p
ai według Roystona
ai z Tablicy Shapiro-Wilka
322110
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1414
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
ai według Roystona
ai z Tablicy Shapiro-Wilka
25994
8332
ΣΣIΣ p
30202010100
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1515
0,8
0,82
0,84
0,86
0,88
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
MPVII – wielowymiarowy tMPVII – wielowymiarowy t
0,75
0,8
0,85
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
ai według Roystona
ai z Tablicy Shapiro-Wilka
99,29,21
59,09,01
ΣΣIΣ p
322110
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1616
0,78
0,8
0,82
0,84
0,86
0,88
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,8
0,82
0,84
0,86
0,88
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Zai według Roystona
ai z Tablicy Shapiro-Wilka
25994
8332
ΣΣIΣ p
30202010100
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1717
Mieszanina rozkładów normalnychMieszanina rozkładów normalnych
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
ai według Roystona
ai z Tablicy Shapiro-Wilka
99,29,21
59,09,01
ΣΣIΣ p
322110
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1818
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
30202010100
3
2
1
μ
μ
μ
25994
8332
ΣΣIΣ p
ai według Roystona
ai z Tablicy Shapiro-Wilka
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
1919
59,09,01
Σ
99,29,21
Σ
322110
3
2
1
μ
μ
μ
2020
Empiryczny poziom istotności dla Empiryczny poziom istotności dla różnych liczebności (różnych liczebności (=0,05)=0,05)
0,02
0,03
0,04
0,05
0,06
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
2IΣ
3
221
10
321 μμμp=2
2121
Moc dla różnych liczebności (Moc dla różnych liczebności (=0,05)=0,05)
00,10,20,30,40,50,60,70,80,9
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
MPII
MPVII
Mieszanina
2222
WnioskiWnioski
− Test Henze-Zirklera najlepiej zachowuje poziom istotności
- W testach bazujących na wartościach obliczanych według Roystona (1992), test Henze-Zirklera okazał się lepszy od trzech pozostałych dla MPII i MPVII
- Dla MPII test oparty na średniej statystyk G(W) wykazywał się wyższą mocą niż M1 i M2
- Małą moc wszystkich testów uzyskano dla mieszaniny rozkładów normalnym dla danych o niskiej korelacji
2323
LiteraturaLiteratura1. Hanusz Z., Tarasińska J. (2009). Simulation study for a test of
multivariate normality based on Shapiro-Wilk’s statistic. Colloquium Biometricum 39, 45-51.
2. Johnson M.E.(1987). Multivariate Statistical Simulation, J. Wiley and Sons.
3. Royston P. (1992). Approximation the Shapiro-Wilk W- test for non-normality, Statistics and Computing 2, 117-119.
4. Shapiro S.S., Wilk M.B. (1965). An analysis of variance test for normality (complete samples). Biometrika 52, 591-611.
5. Shapiro S.S., Wilk M.B. (1968). Approximations for the null distribution of the W statistic. Technometrics 10, 861-866.
6. Srivastava M.S., Hui T.K. (1987). On assessing multivariate normality based on Shapiro-Wilk W statistic. Statistics & Probability Letters 5, 15-18.