Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

Post on 15-Jan-2016

42 views 0 download

description

Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym. Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie WISŁA 2010. Testy do badania p - wymiarowej normalności. p= 2 (T. Ledwina, T. Inglot, M. Bogdan). p  2. Metody analityczne: - PowerPoint PPT Presentation

Transcript of Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym

11

Porównanie symulacyjne Porównanie symulacyjne wybranych testów wybranych testów wielowymiarowej wielowymiarowej

normalności w modelu normalności w modelu liniowym liniowym

Zofia Hanusz i Joanna Zofia Hanusz i Joanna TarasińskaTarasińska

Uniwersytet Przyrodniczy w Uniwersytet Przyrodniczy w LublinieLublinie

WISŁA 2010WISŁA 2010

22

Testy do badania p p - - wymiarowej wymiarowej normalnościnormalności

p=2 (T. Ledwina, T. Inglot, M. Bogdan)

p2

Metody graficzne:Q-QP-P

Metody analityczne:- uogólniające test Shapiro-Wilka

(Srivastava, Royston, Srivastava & Hui), - uogólniające testy oparte na kurtozie

i skośności (Mardia, Small, Malkovich,

Afifi)- oparte na funkcji charakterystycznej

(Arcones)

33

Tematyka badań Tematyka badań • Propozycja testu do badania wielowymiarowej

normalności, opartego na teście Shapiro-Wilka• Rozważenie wielowymiarowego liniowego

modelu obserwacji• Porównanie testu z dwoma innymi testami także

opartymi na teście Shapiro-Wilka zaproponowanymi przez Srivastavę i Hui

• Porównanie poziomu istotności i mocy powyższych testów z testem Henze-Zirklera

44

pnpnpn EBXY

33

333

222

111

nnn

nnn

nnn

100010001

X 321 μμμB

pn

pn

pn

pn

3

2

1

3

2

1

Y

Y

Y

Y

),(~ 1 ΣμpN

YXXXXYE 1 ˆH0: reszty niNpp

ppi ,,1,~

1

Σ0E

Poziom istotności Moc

ModelModel

),(~ 2 ΣμpN

),(~ 3 ΣμpN

MPII(0) – jednostajny na elipsie

MPVII(2) – wielowymiarowy t

Mieszanina rozkładów normalnych

55

Test Shapiro-Test Shapiro-WilkaWilka

Statystyka Shapiro-Wilka (Shapiro, Wilk, 1965) :

nxxx ,,, 21

)()2()1( nxxx

2210 , ~ ,,,: NxxxH n

2

1,

1

2

1

n

jjnjn

jj

xa

xx

W

- niezależne zmienne losowe o tym samym rozkładzie

- wartości uporządkowane

Wartości z tablic

66

1,01

ln ~0

NW

WWG

asH

Shapiro i Wilk (1968) zaproponowali przekształcenie

, , – stałe z tablic zależne od n.

Małe wartości statystyki wskazują brak normalności zmiennych.

77

Adaptacja statystyki Adaptacja statystyki GG((WW) do ) do zmiennych wielowymiarowychzmiennych wielowymiarowych

n

jjn 1

1xx

n

jjjn 1

1xxxxS

że takaa,ortogonaln macierz - ,,1 phhH HHΛS

jiijy xh pi ,,1 nj ,,1

Σμxxx , ~ ,,,: 210 pn NH

Srivastava i Hui (1987) zaproponowali uogólnienie testu Srivastava i Hui (1987) zaproponowali uogólnienie testu Shapiro – Wilka, wykorzystując składowe główne. Shapiro – Wilka, wykorzystując składowe główne.

88

Niech piyan

iWn

jjij

i,,1,

12

1

W(i) są asymptotycznie niezależne

)1,0(~ NiWGGas

i yjednostajnGi ~ 22~ln2 iG

Srivastava i Hui (1987) do testowania H0 zaproponowali

22

11

0

~ln2 p

asH

p

iiGM

Duże wartości M1 świadczą o braku normalności.

99

Srivastava i Hui (1987) zaproponowali także statystykę

iWMpi ,,1

2 min

pxGxM 11Pr 2

Test odrzuca normalność dla małych M2 .

która przy prawdziwości hipotezy H0 ma przybliżony rozkład:

1010

GpV

p

iiG

pG

1

1

Gi są asymptotycznie niezależne

1,0~0

NGasH

i 1,0

0

~ NGpVasH

iW

iWGi 1

ln

Nasza propozycjaNasza propozycja: :

Lewy „ogon” rozkładu normalnego standardowego wskazuje na brak normalności.

1111

Shapiro-Wilk Royston

-0,3964 -0,378623-0,2737 -0,281638-0,2368 -0,240640-0,2098 -0,213270-0,1878 -0,191068-0,1691 -0,172070-0,1526 -0,155252-0,1376 -0,140012-0,1237 -0,125959-0,1108 -0,112827-0,0986 -0,100422-0,0870 -0,088599-0,0759 -0,077247-0,0651 -0,066276-0,0546 -0,055611-0,0444 -0,045191-0,0343 -0,034961-0,0244 -0,024873-0,0146 -0,014885-0,0049 -0,0049550,0049 0,0049550,0146 0,0148850,0244 0,0248730,0343 0,0349610,0444 0,0451910,0546 0,0556110,0651 0,0662760,0759 0,0772470,0870 0,0885990,0986 0,1004220,1108 0,1128270,1237 0,1259590,1376 0,1400120,1526 0,1552530,1691 0,1720700,1878 0,1910680,2098 0,2132700,2368 0,2406400,2737 0,2816380,3964 0,378623

Shapiro-Wilk Royston

0,2737 0,2816380,3964 0,378623

RozbieżnościRozbieżności

0,02

0,025

0,03

0,035

0,04

0,045

0,05

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,035

0,04

0,045

0,05

0,055

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

322110

3

2

1

0,99,29,20,1

0,59,09,00,1

ΣΣIΣ p

1212

25994

8332

ΣΣIΣ p

0,035

0,04

0,045

0,05

0,055

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,02

0,025

0,03

0,035

0,04

0,045

0,05

0,055

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

30202010100

3

2

1

μ

μ

μ

ai według Roystona

ai z Tablicy Shapiro-Wilka

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1313

MPII(0) – jednostajny na elipsieMPII(0) – jednostajny na elipsie

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,99,29,20,1

0,59,09,00,1

ΣΣIΣ p

ai według Roystona

ai z Tablicy Shapiro-Wilka

322110

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1414

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

ai według Roystona

ai z Tablicy Shapiro-Wilka

25994

8332

ΣΣIΣ p

30202010100

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1515

0,8

0,82

0,84

0,86

0,88

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

MPVII – wielowymiarowy tMPVII – wielowymiarowy t

0,75

0,8

0,85

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

ai według Roystona

ai z Tablicy Shapiro-Wilka

99,29,21

59,09,01

ΣΣIΣ p

322110

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1616

0,78

0,8

0,82

0,84

0,86

0,88

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0,8

0,82

0,84

0,86

0,88

0,9

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Zai według Roystona

ai z Tablicy Shapiro-Wilka

25994

8332

ΣΣIΣ p

30202010100

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1717

Mieszanina rozkładów normalnychMieszanina rozkładów normalnych

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

ai według Roystona

ai z Tablicy Shapiro-Wilka

99,29,21

59,09,01

ΣΣIΣ p

322110

3

2

1

μ

μ

μ

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1818

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9

M1

M2

V

H-Z

30202010100

3

2

1

μ

μ

μ

25994

8332

ΣΣIΣ p

ai według Roystona

ai z Tablicy Shapiro-Wilka

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

20 10 1010 20 1010 10 20

1919

59,09,01

Σ

99,29,21

Σ

322110

3

2

1

μ

μ

μ

2020

Empiryczny poziom istotności dla Empiryczny poziom istotności dla różnych liczebności (różnych liczebności (=0,05)=0,05)

0,02

0,03

0,04

0,05

0,06

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

2IΣ

3

221

10

321 μμμp=2

2121

Moc dla różnych liczebności (Moc dla różnych liczebności (=0,05)=0,05)

00,10,20,30,40,50,60,70,80,9

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

0

0,2

0,4

0,6

0,8

1

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

15 18 21 24 27 30 33 36 39 42 45 48

M1

M2

V

H-Z

MPII

MPVII

Mieszanina

2222

WnioskiWnioski

− Test Henze-Zirklera najlepiej zachowuje poziom istotności

- W testach bazujących na wartościach obliczanych według Roystona (1992), test Henze-Zirklera okazał się lepszy od trzech pozostałych dla MPII i MPVII

- Dla MPII test oparty na średniej statystyk G(W) wykazywał się wyższą mocą niż M1 i M2

- Małą moc wszystkich testów uzyskano dla mieszaniny rozkładów normalnym dla danych o niskiej korelacji

2323

LiteraturaLiteratura1. Hanusz Z., Tarasińska J. (2009). Simulation study for a test of

multivariate normality based on Shapiro-Wilk’s statistic. Colloquium Biometricum 39, 45-51.

2. Johnson M.E.(1987). Multivariate Statistical Simulation, J. Wiley and Sons.

3. Royston P. (1992). Approximation the Shapiro-Wilk W- test for non-normality, Statistics and Computing 2, 117-119.

4. Shapiro S.S., Wilk M.B. (1965). An analysis of variance test for normality (complete samples). Biometrika 52, 591-611.

5. Shapiro S.S., Wilk M.B. (1968). Approximations for the null distribution of the W statistic. Technometrics 10, 861-866.

6. Srivastava M.S., Hui T.K. (1987). On assessing multivariate normality based on Shapiro-Wilk W statistic. Statistics & Probability Letters 5, 15-18.