Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

23
1 Porównanie symulacyjne Porównanie symulacyjne wybranych testów wybranych testów wielowymiarowej wielowymiarowej normalności w modelu normalności w modelu liniowym liniowym Zofia Hanusz i Joanna Zofia Hanusz i Joanna Tarasińska Tarasińska Uniwersytet Przyrodniczy w Uniwersytet Przyrodniczy w Lublinie Lublinie WISŁA 2010 WISŁA 2010

description

Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym. Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie WISŁA 2010. Testy do badania p - wymiarowej normalności. p= 2 (T. Ledwina, T. Inglot, M. Bogdan). p  2. Metody analityczne: - PowerPoint PPT Presentation

Transcript of Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

Page 1: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

11

Porównanie symulacyjne Porównanie symulacyjne wybranych testów wybranych testów wielowymiarowej wielowymiarowej

normalności w modelu normalności w modelu liniowym liniowym

Zofia Hanusz i Joanna Zofia Hanusz i Joanna TarasińskaTarasińska

Uniwersytet Przyrodniczy w Uniwersytet Przyrodniczy w LublinieLublinie

WISŁA 2010WISŁA 2010

Page 2: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

22

Testy do badania p p - - wymiarowej wymiarowej normalnościnormalności

p=2 (T. Ledwina, T. Inglot, M. Bogdan)

p2

Metody graficzne:Q-QP-P

Metody analityczne:- uogólniające test Shapiro-Wilka

(Srivastava, Royston, Srivastava & Hui), - uogólniające testy oparte na kurtozie

i skośności (Mardia, Small, Malkovich,

Afifi)- oparte na funkcji charakterystycznej

(Arcones)

Page 3: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

33

Tematyka badań Tematyka badań • Propozycja testu do badania wielowymiarowej

normalności, opartego na teście Shapiro-Wilka• Rozważenie wielowymiarowego liniowego

modelu obserwacji• Porównanie testu z dwoma innymi testami także

opartymi na teście Shapiro-Wilka zaproponowanymi przez Srivastavę i Hui

• Porównanie poziomu istotności i mocy powyższych testów z testem Henze-Zirklera

Page 4: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

44

pnpnpn EBXY

33

333

222

111

nnn

nnn

nnn

100010001

X 321 μμμB

pn

pn

pn

pn

3

2

1

3

2

1

Y

Y

Y

Y

),(~ 1 ΣμpN

YXXXXYE 1 ˆH0: reszty niNpp

ppi ,,1,~

1

Σ0E

Poziom istotności Moc

ModelModel

),(~ 2 ΣμpN

),(~ 3 ΣμpN

MPII(0) – jednostajny na elipsie

MPVII(2) – wielowymiarowy t

Mieszanina rozkładów normalnych

Page 5: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

55

Test Shapiro-Test Shapiro-WilkaWilka

Statystyka Shapiro-Wilka (Shapiro, Wilk, 1965) :

nxxx ,,, 21

)()2()1( nxxx

2210 , ~ ,,,: NxxxH n

2

1,

1

2

1

n

jjnjn

jj

xa

xx

W

- niezależne zmienne losowe o tym samym rozkładzie

- wartości uporządkowane

Wartości z tablic

Page 6: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

66

1,01

ln ~0

NW

WWG

asH

Shapiro i Wilk (1968) zaproponowali przekształcenie

, , – stałe z tablic zależne od n.

Małe wartości statystyki wskazują brak normalności zmiennych.

Page 7: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

77

Adaptacja statystyki Adaptacja statystyki GG((WW) do ) do zmiennych wielowymiarowychzmiennych wielowymiarowych

n

jjn 1

1xx

n

jjjn 1

1xxxxS

że takaa,ortogonaln macierz - ,,1 phhH HHΛS

jiijy xh pi ,,1 nj ,,1

Σμxxx , ~ ,,,: 210 pn NH

Srivastava i Hui (1987) zaproponowali uogólnienie testu Srivastava i Hui (1987) zaproponowali uogólnienie testu Shapiro – Wilka, wykorzystując składowe główne. Shapiro – Wilka, wykorzystując składowe główne.

Page 8: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

88

Niech piyan

iWn

jjij

i,,1,

12

1

W(i) są asymptotycznie niezależne

)1,0(~ NiWGGas

i yjednostajnGi ~ 22~ln2 iG

Srivastava i Hui (1987) do testowania H0 zaproponowali

22

11

0

~ln2 p

asH

p

iiGM

Duże wartości M1 świadczą o braku normalności.

Page 9: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

99

Srivastava i Hui (1987) zaproponowali także statystykę

iWMpi ,,1

2 min

pxGxM 11Pr 2

Test odrzuca normalność dla małych M2 .

która przy prawdziwości hipotezy H0 ma przybliżony rozkład:

Page 10: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1010

GpV

p

iiG

pG

1

1

Gi są asymptotycznie niezależne

1,0~0

NGasH

i 1,0

0

~ NGpVasH

iW

iWGi 1

ln

Nasza propozycjaNasza propozycja: :

Lewy „ogon” rozkładu normalnego standardowego wskazuje na brak normalności.

Page 11: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1111

Shapiro-Wilk Royston

-0,3964 -0,378623-0,2737 -0,281638-0,2368 -0,240640-0,2098 -0,213270-0,1878 -0,191068-0,1691 -0,172070-0,1526 -0,155252-0,1376 -0,140012-0,1237 -0,125959-0,1108 -0,112827-0,0986 -0,100422-0,0870 -0,088599-0,0759 -0,077247-0,0651 -0,066276-0,0546 -0,055611-0,0444 -0,045191-0,0343 -0,034961-0,0244 -0,024873-0,0146 -0,014885-0,0049 -0,0049550,0049 0,0049550,0146 0,0148850,0244 0,0248730,0343 0,0349610,0444 0,0451910,0546 0,0556110,0651 0,0662760,0759 0,0772470,0870 0,0885990,0986 0,1004220,1108 0,1128270,1237 0,1259590,1376 0,1400120,1526 0,1552530,1691 0,1720700,1878 0,1910680,2098 0,2132700,2368 0,2406400,2737 0,2816380,3964 0,378623

Shapiro-Wilk Royston

0,2737 0,2816380,3964 0,378623

RozbieżnościRozbieżności

0,02

0,025

0,03

0,035

0,04

0,045

0,05

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,035

0,04

0,045

0,05

0,055

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

322110

3

2

1

0,99,29,20,1

0,59,09,00,1

ΣΣIΣ p

Page 12: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1212

25994

8332

ΣΣIΣ p

0,035

0,04

0,045

0,05

0,055

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,02

0,025

0,03

0,035

0,04

0,045

0,05

0,055

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

30202010100

3

2

1

μ

μ

μ

ai według Roystona

ai z Tablicy Shapiro-Wilka

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 13: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1313

MPII(0) – jednostajny na elipsieMPII(0) – jednostajny na elipsie

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,99,29,20,1

0,59,09,00,1

ΣΣIΣ p

ai według Roystona

ai z Tablicy Shapiro-Wilka

322110

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 14: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1414

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

ai według Roystona

ai z Tablicy Shapiro-Wilka

25994

8332

ΣΣIΣ p

30202010100

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 15: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1515

0,8

0,82

0,84

0,86

0,88

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

MPVII – wielowymiarowy tMPVII – wielowymiarowy t

0,75

0,8

0,85

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

ai według Roystona

ai z Tablicy Shapiro-Wilka

99,29,21

59,09,01

ΣΣIΣ p

322110

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 16: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1616

0,78

0,8

0,82

0,84

0,86

0,88

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,8

0,82

0,84

0,86

0,88

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Zai według Roystona

ai z Tablicy Shapiro-Wilka

25994

8332

ΣΣIΣ p

30202010100

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 17: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1717

Mieszanina rozkładów normalnychMieszanina rozkładów normalnych

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

ai według Roystona

ai z Tablicy Shapiro-Wilka

99,29,21

59,09,01

ΣΣIΣ p

322110

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 18: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1818

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

30202010100

3

2

1

μ

μ

μ

25994

8332

ΣΣIΣ p

ai według Roystona

ai z Tablicy Shapiro-Wilka

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

Page 19: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

1919

59,09,01

Σ

99,29,21

Σ

322110

3

2

1

μ

μ

μ

Page 20: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

2020

Empiryczny poziom istotności dla Empiryczny poziom istotności dla różnych liczebności (różnych liczebności (=0,05)=0,05)

0,02

0,03

0,04

0,05

0,06

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

2IΣ

3

221

10

321 μμμp=2

Page 21: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

2121

Moc dla różnych liczebności (Moc dla różnych liczebności (=0,05)=0,05)

00,10,20,30,40,50,60,70,80,9

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

MPII

MPVII

Mieszanina

Page 22: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

2222

WnioskiWnioski

− Test Henze-Zirklera najlepiej zachowuje poziom istotności

- W testach bazujących na wartościach obliczanych według Roystona (1992), test Henze-Zirklera okazał się lepszy od trzech pozostałych dla MPII i MPVII

- Dla MPII test oparty na średniej statystyk G(W) wykazywał się wyższą mocą niż M1 i M2

- Małą moc wszystkich testów uzyskano dla mieszaniny rozkładów normalnym dla danych o niskiej korelacji

Page 23: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

2323

LiteraturaLiteratura1. Hanusz Z., Tarasińska J. (2009). Simulation study for a test of

multivariate normality based on Shapiro-Wilk’s statistic. Colloquium Biometricum 39, 45-51.

2. Johnson M.E.(1987). Multivariate Statistical Simulation, J. Wiley and Sons.

3. Royston P. (1992). Approximation the Shapiro-Wilk W- test for non-normality, Statistics and Computing 2, 117-119.

4. Shapiro S.S., Wilk M.B. (1965). An analysis of variance test for normality (complete samples). Biometrika 52, 591-611.

5. Shapiro S.S., Wilk M.B. (1968). Approximations for the null distribution of the W statistic. Technometrics 10, 861-866.

6. Srivastava M.S., Hui T.K. (1987). On assessing multivariate normality based on Shapiro-Wilk W statistic. Statistics & Probability Letters 5, 15-18.