Bootstrap w analizie szeregów czasowych

Bootstrap w analizie szeregów czasowych

Robert Kozarski (SGH)

Bootstrap jest metodą zaproponowaną przez Bradley’a Efrona (Stanford University) w

1979 roku. Stosowana jest m.in. przy estymacji nieznanych (bądź trudnych do

wyznaczenia) rozkładów statystyk poprzez wielokrotne próbkowanie z próby pierwotnej

(Resampling) zgodnie z procesem generującym te dane

(DGP - Data Generating Process).

Bootstrapy mogą być stosowane przy:

• Estymacji punktowej i przedziałowej parametrów : - rozkładu zmiennej losowej- funkcji regresji

• Wyznaczaniu postaci rozkładu zmiennej losowej (z histogramu empirycznego )

• Weryfikacji hipotez statystycznych

Postać algorytmu bootstrapowego jest uzależniona od postaci procesu generującego dane

Teoria konieczna do sformułowania celu

prezentacji dotyczy:

- weryfikacji hipotez statystycznych - stacjonarnych szeregów czasowych

- następstw występowania pierwiastka jednostkowego

Weryfikacja hipotez statystycznych metodą

Monte Carlo i metodą bootstrap

Test DWBadamy hipotezę, że istnieje dodatnia

autokorelacja

składnika losowego w modelu postaci:

Statystyka testowa ma postać:ttt Xy

0:

0:

1

0

H

H

)1;0(~, Nt

n

tt

n

ttt

DW

1

2

2

2

1)(

Test DW metodą Monte Carlo i bootstrap:1. Wyznaczamy poziom empiryczny DW

2. Wybieramy liczbę symulacji/replikacji B jaka chcemy wykonać, następnie :

3. Dla MC losujemy z generatora N(0;1) B, n-elementowych wektorów reszt losowych b=1,2,...,B dla bootstrap: losujemy B razy niezależnie n-elementowe wektory reszt spośród elemetów wektora resztowego

4. Wyznaczamy z równania :

5. Wyznaczamy różnice :

6. Dla każdego spośród B wektorów wyznaczamy poziom statystyki

7. Wyznaczamy: gdzie I(.) jest funkcja wskazująca czy różnica pomiędzy statystyką z replikacji, a empiryczną jest dodatnia (wartość 1) lub ujemna (wartość 0).

8. Jeśli p jest większa od założonego poziomu istotności to hipotezę przyjmujemy.

b

btb Xy

tb

t

b yy t

b tDW

B

b

t DWDWIB

p1

)(1

0H

Stacjonarne szeregi czasowe i integracja

Szereg czasowy jest stacjonarny I(0) jeśli:

1. Wartość oczekiwana:

2. Wariancja:

3. Kowariancja:Są to własności tzw. słabej stacjonarności szeregu (weak stationary)

Szereg czasowy jest zintegrowany w stopniu pierwszym I(1) jeśli własność stacjonarności posiadają pierwsze przyrosty czyliInaczej

1 tt yyy

Większość ekonomicznych szeregów czasowych jest niestacjonarna

222 )()( tt yEyD

)( tyE

ktkttktt yyEyy ,))((),cov(

)0(~),1(~ IyIy tt

Testowanie występowania pierwiastka jednostkowego w

szeregu czasowym

Jeśli DGP szeregu czasowego można przedstawić w postaci procesu autoregresyjnego pierwszego rzędu bez dryfu (bez stałej) AR(1):

to mówimy, że szereg posiada pierwiastek jednostkowy jeśli współczynnik jest równy jeden i ma własności procesu błądzenia losowego (random walk).

ttt yy 1 );0(~, 2 IIDt

Jeśli szereg posiada pierwiastek jednostkowy to

wiadomo, że szereg jest niestacjonarny i jego

modelowanie może doprowadzić do zjawiska

regresji pozornej (spurious regression).

Przykładowe procesy błądzenia losowego i ich pierwsze przyrosty

Niektóre testy pierwiastka jednostkowego

• Test Dickeya-Fullera (DF)

• Rozszerzony (augmeneted) test DF (ADF)

• Phillipsa i Phillipsa-Perrona

Test DF

1. Test oparty jest na estymacji równania:

2. Hipotezy mają postać:

3. Odrzucenie hipotezy zerowej oznacza, że

czyli jest stacjonarny. W przeciwnym przypadku proces jest generowany przez proces błądzenia losowego (random walk).

01:

01:

1

0

H

Httt yy 1)1(

)0(~ Iyt

Statystyka testu t-Studenta dla parametru nie ma rozkładu symetrycznego, którego wysymulowane

wartości krytyczne są stablicowane natomiast nie jest znana postać analityczna rozkładu

Cel prezentacji:Zastosowanie bootstrapu jako alternatywy dla testów pierwiastka jednostkowego, dla szeregu którego DGP ma postać procesu AR(1) bez dryfu (bez stałej) i bez trendu, czyli bez zmiennej czasowej w modelu.

Zaproponowany (analityczny) estymator parametru ma postać:

n

t

t

t

n

ttt

y

yy

21

21

)(

)1ˆ()( 2

2

1

S

yt

n

tt

n

t

tt

n

yyS

2

2

1

2

)ˆ()(

2

121

0

2

22

))((

))1((2

)(dssW

W

t

Analiza symulacyjna

1. Wszystkie obserwacje są generowane przez proces AR(1), z N(0;1) rozkładem reszt modelu

2. Poziomy współczynników procesu: 0,7; 0,8; 0,9; 0,95; 0,99; 1,0

3. n=1000, B=1000

ttt yy 1

Wnioski z analiz symulacyjnych

Dziękuje za uwagę

Bootstrap w analizie szeregów czasowych

Documents

Transcript of Bootstrap w analizie szeregów czasowych