Bootstrap w analizie szeregów czasowych
description
Transcript of Bootstrap w analizie szeregów czasowych
Bootstrap w analizie szeregów czasowych
Robert Kozarski (SGH)
Bootstrap jest metodą zaproponowaną przez Bradley’a Efrona (Stanford University) w
1979 roku. Stosowana jest m.in. przy estymacji nieznanych (bądź trudnych do
wyznaczenia) rozkładów statystyk poprzez wielokrotne próbkowanie z próby pierwotnej
(Resampling) zgodnie z procesem generującym te dane
(DGP - Data Generating Process).
Bootstrapy mogą być stosowane przy:
• Estymacji punktowej i przedziałowej parametrów : - rozkładu zmiennej losowej- funkcji regresji
• Wyznaczaniu postaci rozkładu zmiennej losowej (z histogramu empirycznego )
• Weryfikacji hipotez statystycznych
Postać algorytmu bootstrapowego jest uzależniona od postaci procesu generującego dane
Teoria konieczna do sformułowania celu
prezentacji dotyczy:
- weryfikacji hipotez statystycznych - stacjonarnych szeregów czasowych
- następstw występowania pierwiastka jednostkowego
Weryfikacja hipotez statystycznych metodą
Monte Carlo i metodą bootstrap
Test DWBadamy hipotezę, że istnieje dodatnia
autokorelacja
składnika losowego w modelu postaci:
Statystyka testowa ma postać:ttt Xy
0:
0:
1
0
H
H
)1;0(~, Nt
n
tt
n
ttt
DW
1
2
2
2
1)(
Test DW metodą Monte Carlo i bootstrap:1. Wyznaczamy poziom empiryczny DW
2. Wybieramy liczbę symulacji/replikacji B jaka chcemy wykonać, następnie :
3. Dla MC losujemy z generatora N(0;1) B, n-elementowych wektorów reszt losowych b=1,2,...,B dla bootstrap: losujemy B razy niezależnie n-elementowe wektory reszt spośród elemetów wektora resztowego
4. Wyznaczamy z równania :
5. Wyznaczamy różnice :
6. Dla każdego spośród B wektorów wyznaczamy poziom statystyki
7. Wyznaczamy: gdzie I(.) jest funkcja wskazująca czy różnica pomiędzy statystyką z replikacji, a empiryczną jest dodatnia (wartość 1) lub ujemna (wartość 0).
8. Jeśli p jest większa od założonego poziomu istotności to hipotezę przyjmujemy.
b
btb Xy
tb
t
b yy t
b tDW
B
b
t DWDWIB
p1
)(1
0H
Stacjonarne szeregi czasowe i integracja
Szereg czasowy jest stacjonarny I(0) jeśli:
1. Wartość oczekiwana:
2. Wariancja:
3. Kowariancja:Są to własności tzw. słabej stacjonarności szeregu (weak stationary)
Szereg czasowy jest zintegrowany w stopniu pierwszym I(1) jeśli własność stacjonarności posiadają pierwsze przyrosty czyliInaczej
1 tt yyy
Większość ekonomicznych szeregów czasowych jest niestacjonarna
222 )()( tt yEyD
)( tyE
ktkttktt yyEyy ,))((),cov(
)0(~),1(~ IyIy tt
Testowanie występowania pierwiastka jednostkowego w
szeregu czasowym
Jeśli DGP szeregu czasowego można przedstawić w postaci procesu autoregresyjnego pierwszego rzędu bez dryfu (bez stałej) AR(1):
to mówimy, że szereg posiada pierwiastek jednostkowy jeśli współczynnik jest równy jeden i ma własności procesu błądzenia losowego (random walk).
ttt yy 1 );0(~, 2 IIDt
Jeśli szereg posiada pierwiastek jednostkowy to
wiadomo, że szereg jest niestacjonarny i jego
modelowanie może doprowadzić do zjawiska
regresji pozornej (spurious regression).
Przykładowe procesy błądzenia losowego i ich pierwsze przyrosty
Niektóre testy pierwiastka jednostkowego
• Test Dickeya-Fullera (DF)
• Rozszerzony (augmeneted) test DF (ADF)
• Phillipsa i Phillipsa-Perrona
Test DF
1. Test oparty jest na estymacji równania:
2. Hipotezy mają postać:
3. Odrzucenie hipotezy zerowej oznacza, że
czyli jest stacjonarny. W przeciwnym przypadku proces jest generowany przez proces błądzenia losowego (random walk).
01:
01:
1
0
H
Httt yy 1)1(
)0(~ Iyt
Statystyka testu t-Studenta dla parametru nie ma rozkładu symetrycznego, którego wysymulowane
wartości krytyczne są stablicowane natomiast nie jest znana postać analityczna rozkładu
Cel prezentacji:Zastosowanie bootstrapu jako alternatywy dla testów pierwiastka jednostkowego, dla szeregu którego DGP ma postać procesu AR(1) bez dryfu (bez stałej) i bez trendu, czyli bez zmiennej czasowej w modelu.
Zaproponowany (analityczny) estymator parametru ma postać:
n
t
t
t
n
ttt
y
yy
21
21
)(
)1ˆ()( 2
2
1
S
yt
n
tt
n
t
tt
n
yyS
2
2
1
2
)ˆ()(
2
121
0
2
22
))((
))1((2
)(dssW
W
t
Analiza symulacyjna
1. Wszystkie obserwacje są generowane przez proces AR(1), z N(0;1) rozkładem reszt modelu
2. Poziomy współczynników procesu: 0,7; 0,8; 0,9; 0,95; 0,99; 1,0
3. n=1000, B=1000
ttt yy 1
Wnioski z analiz symulacyjnych
Dziękuje za uwagę