Andrzej Torój - Lato 2013/20141
Ekonometria stosowana
Wykład 5WSPÓŁLINIOWOŚĆWSPÓŁCZYNNIKI BETA
Porównywalność współczynników regresji
2
iiiii śpiewkobietywinostałtcuzytecznos 1,50,46,0
[l] [szt.] [min] jak interpretujemy poszczególne współczynniki? który z trzech czynników wpływa na użyteczność najbardziej? a jeżeli śpiew zaczniemy mierzyć w godzinach, a wino w liczbie
półlitrowych butelek? wartość współczynnika wynika z:
– siły oddziaływania na zmienną objaśnianą– skali zmienności regresora, przy którym stoi
[deklarowane j]
Współczynniki beta (1)
3
standaryzujemy zmienne (wystarczy podzielić przez odchylenie standardowe):
szacujemy równanie za pomocą MNK:
)(*
ysyy
)(*
k
kk xs
xx dla każdego k = 1, …, K
iKiKii xxy **110
* ...
iKi
KiK
i
i
xsx
xsx
ysy
)(...
)()( 1
110
iKiKi
Kii
i xxsysx
xsysy
)()(...
)()(
11
10
Współczynniki beta (2)
4
WNIOSEK: równoważną metodą jest skorygowanie współczynników zwykłej regresji o iloraz odchyleń standardowych zmiennej objaśnianej i objaśniających
iKiKii xxy ...110
iKiKi
Kii
i xxsysx
xsysy
)()(...
)()(
11
10
)()(
)()(
ysxs
xsys k
kkk
kk
Ćwiczenie
Plik powiaty.Rozważamy czynniki wpływające na
wysokość dochodów samorządów.Który z nich ma największy wpływ?
nie obliczymy
ze względu na nieodwracalność XTX
Czym jest współliniowość?
regresory nie są niezależne
niektóre kombinacją liniową pozostałych
niektóre wysoko skorelowane
yXXX TT 1ˆ
XTX będzie macierzą osobliwą (-> Matematyka)
elementy diagonalne XTX blisko 0
elementy diagonalne (XTX)-1 i s2(XTX)-1 wysokie, a więc wysokie także błędy standardowe oszacowań i precyzja szacunku niska
Diagnostyka współliniowości
1. macierz korelacji– Gretl: widok – macierz korelacji– pokazuje tylko bilateralne związki– brak jasnej granicy, powyżej której uznajemy problem za poważny
2. czynnik inflacji wariancji dla j-tego regresora
gdzie R2j to R2 z regresji j-tego regresora względem pozostałych (ze stałą)
umowna wartość graniczna: 10, powyżej - współliniowość3. indeks warunkowy
gdzie l to wartości własne macierzy powstałej z macierzy XTX przez podzielenie każdej jej komórki (i,j) przez iloczyn pierwiastków jej elementów diagonalnych (i,i) i (j,j)
umowna wartość graniczna: 20, powyżej - współliniowość
jj R
VIF 211
2/1
min
max
Gretl: testy – test współliniowości w oknie modelu
Ćwiczenie
czy w naszym modelu dochodów samorządów skala współliniowości jest znacząca?
Co robić?
wzmocnić precyzję szacunku przez rozszerzenie próby, usunięcie zmiennej, nałożenie warunków na parametry lub rezygnację z estymacji parametru (wyniki innych badań itp.)
„ręcznie” zwiększyć wartości diagonalnych elementów macierzy XTX (regresja grzbietowa)
ze współliniowych zmiennych „wycisnąć” wspólną zmienność i zapisać ją w mniejszej liczbie nowych, niezależnych zmiennych (metoda głównych składowych)
Metoda głównych składowych
n silnie skorelowanych regresorów jeżeli silnie skorelowane, to wśród nich istnieje pewien obszar
wspólnej zmienności znaczną część wariancji n skorelowanych zmiennych można
wyrazić za pomocą mniejszej liczby zmiennych niezależnych od siebie
te niezależne zmienne (główne składowe) można potem wykorzystać w regresji, eliminując problem współliniowości
zmienne będą kombinacjami liniowymi wyjściowych zmiennych; współczynniki tych kombinacji będą dobierane tak, aby w jak najmniejszej liczbie składowych zawrzeć jak największy procent wariancji zmiennych wyjściowych– szczegóły na Metodach statystycznych (część prof. Rószkiewicz)
Ćwiczenie
Spróbujmy zastosować metodę głównych składowych do naszego modelu.
Widok – główne składowe. Naciskamy znak „+”, aby zapisać składowe w bazie danych. Decyzja o ich liczbie jest arbitralna, ogólna zasada jest taka, aby jak najmniejsza ich liczba obejmowała jak najwięcej wariancji zmiennych wyjściowych.
Obserwujemy, jak skonstruowane są główne składowe. Jak je interpretować?
Spróbujmy zastąpić 14 regresorów trzema składowymi. Czy wyniki są satysfakcjonujące?
Regresja grzbietowa
skoro estymator MNKtraci efektywność ze względu na niskie wartości diagonalne macierzy XTX...
to powiększmy je wszystkie o g:
ten estymator jest efektywniejszy od MNKale:
– jest za to obciążony – coś za coś...– skąd wziąć g?
yXXX TTOLS
1ˆ
yXgIXX TTORR
1ˆ
Ćwiczenie
korzystając z przygotowanego pliku powiaty.xls, porównaj wyniki regresji grzbietowej dla różnych g, w tym dla estymatora MNK (g=0)
Andrzej Torój - Metody ekonometryczne - Wiosna 2007/2008 14
Literatura do wykładu 5
Welfe, rozdział 5 (cały!)
Dla chętnych:– Maddala, rozdział 7