Ekonometria — ćwiczenia Kolokwium 2 semestr 22/05/05...

Ekonometria Kolokwium 22/05/05

imię, nazwisko, nr indeksu:

Ekonometria — ćwiczeniaKolokwium 2 semestr

22/05/05

Zadanie 1 / 4 pkt

Zadanie 2 / 4 pkt

Zadanie 3 / 3 pkt

Zadanie 4 / 7 pkt [1/1/1/2/2]

Zadanie 5 / 4 pkt

Razem /22 pkt

Skala ocen:do 8,80 punktów 208,85-12,05 punktów 312,10-14,25 punktów 3+14,30-16,45 punktów 416,50-18,65 punktów 4+18,70 + punktów 5

Regulamin i informacje dodatkowe

• Przed przystąpieniem do rozwiązywania kolokwium należy podpisać pracę.

• Każda zauważona próba ściągania będzie karana podpisem osoby pilnującej złożo-nym na pracy. Pierwszy podpis oznacza utratę jednego punktu. Drugi podpis oznaczapodzielenie wyniku punktowego przez 2. Trzeci podpis jest równoznaczny z odebra-niem pracy i poinformowaniem władz wydziału o zaistniałej sytuacji.

• Zastrzegam sobie prawo do obniżenia progów wymaganych do otrzymania ocen.

• Osoby rażąco naruszające dyscyplinę i przeszkadzające w przeprowadzeniu kolo-kwium mogą zostać wyproszone z sali. O zaistniałym fakcie zostaną poinformowanewładze dziekańskie.

Powodzenia :-)


TeoriaNależy odpowiedzieć na 2 wybranie pytania. W przypadku udzielenia odpowiedzi na

więcej pytań należy zaznaczyć które mają być sprawdzane, w przeciwnym przypadku oce-nione zostaną dwa pierwsze w kolejności udzielania odpowiedzi.

1. Estymator Least Absolute Deviation (LAD) jest zdefiniowany następująco:

LAD : βmin

∑| yi −Xβ |

Pokaż, że estymator LAD jest estymatorem M. Wiedząc, że estymator MNK jestzgodny pokaż, że estymator LAD jest zgodny.

2. Na czym polega problem identyfikacji w modelu nielosowej selekcji

3. Co to jest obciążenie Lovella. Oblicz ile będzie wynosił prawdziwy poziom istotnościjeśli do wyjaśnienia zmiennej y wybierzemy 2 regresory spośród 5, a nominalnypoziom istotności wynosi 5 %.

Rozwiązanie

1. Estymatory M, to estymatory minimalizujące funkcję celu. Ponieważ estymator LADminimalizuję sumę modułów jest estymatorem klasy M. Wiemy, że estymator MNKdany wzorem

∑(y − i −Xβ)2. Jest więc kwadratem normy euklidesowej (drugiej).

Estymator LAD jest równoważny normie 1. Ponieważ normy są równoważne to mi-nimum będzie niezależne od normy.

2. Model Heckmana jest dwurównaniowy. Składa się z równania selekcji i równaniazjawiska. Jeżeli w obu równaniach występuje ten sam zestaw zmiennych niezależnychX to model redukuje się do Tobitu, ponieważ:{

di = X ′iγ + ui

yi = X ′iβ + εi

ponieważ zmienna di jest równa 1 gdy yi > y∗. Parametry modelu są trudne dozidentyfikowania, ponieważ równanie probitowe może być zbliżone do równania li-niowego, a jeśli oba równania są liniowe to nie możemy jednoznacznie zidentyfikowaćparametrów bez nałożenia dodatkowych ograniczeń na parametry.

3. Obciążenie Lovella występuje gdy wybieramy model regresji spośród grupy modeli”konkurencyjnych”. W takim przypadku rzeczywisty poziom istotności będzie wyż-szy od nominalnego. Częściej będziemy podejmować błędne decyzje.

α∗ ≈ 1− (1− α)c

k= 1− (1− 0.05)

52


Zadanie 1.

Na podstawie danych BAEL 2000 oszacowano model wyjaśniający fakt posiadaniapracy dodatkowej za pomocą charakterystyk społeczno-demograficznych respondenta: płci(0 oznacza kobietę), w latach, dochodu gospodarstwa, posiadania rodziny na utrzymaniuoraz wykształcenia (dwie zmiennne 0-1). Otrzymano wyniki

Logit estimates Number of obs = 28248LR chi2(5) = 430.24Prob > chi2 = 0.0000

Log likelihood = -1665.117 Pseudo R2 = 0.1144-------------------------------------------------------------dodatkowa | Odds Ratio Std. Err. z P>|z|

-------------+-----------------------------------------------plec | 3.847853 .4666835 11.11 0.000wiek | .9652003 .0036769 -9.30 0.000

rodzina | 6.078828 1.025346 10.70 0.000wyzsze | 6.079864 1.123512 9.77 0.000srednie | 1.971332 .2638736 5.07 0.000

-------------------------------------------------------------

Marginal effects after logity = Pr(dodatkowa) (predict)= .00096351

-------------------------------------------------------------variable | dy/dx Std. Err. z P>|z| X---------+---------------------------------------------------plec*| .0027338 .00043 6.38 0.000 0wiek | -.0000341 .00001 -6.21 0.000 46.1379

rodzina*| .004865 .00075 6.48 0.000 0wyzsze*| .004866 .00125 3.90 0.000 0srednie*| .0009341 .00028 3.36 0.001 0-------------------------------------------------------------

Przyjmując poziom istotności 5 % dokonaj interpretacji wyników oraz zbadaj istot-ność oraz łączną istotność modelu. Wartości krytyczne: χ2(2) = 5.99, χ2(5) = 11.07.Wiedząc, że wartość funkcji logarytmu wiarogodności dla modelu bez wykształcenia wy-nosi −1706.83 przeprowadź odpowiedni test badający czy te zmienne są istotne zapisująchipotezę zerową i alternatywną.Rozwiązanie

1. Mężczyźni mają prawie 4 kronie większą szansę na posiadanie dodatkowej pracy niżkobiety, wraz z wiekiem maleje szansa na posiadanie dodatkowej płacy o 4 % z każ-dym przeżytym rokiem, posiadanie rodziny zwiększa 6 krotnie szansę na posiadaniepracy dodatkowej, legitymowanie się wyższym wykształceniem zwiększa 6 krotnieszansę na posiadanie pracy dodatkowej w stosunku do wykształcenia podstawowego,legitymowanie się średnim wykształceniem zwiększa 2 krotnie szansę na posiadaniepracy dodatkowej w stosunku do wykształcenia podstawowego,

2. Wszystkie zmienne są łącznie istotne, świadczą o tym statystyki |z| > 2. Są równieżłącznie istotne ponieważ wartość statystyki LR > χ2(5) = 11.07, a jej p-value wynosi0.

3.H0 : βwyzsze = βsrednie = 0 H1 : ¬H0

LR = 2(L1 − L0) = 2(−1665 + 1706) = 82 > χ2(2) = 5.99

Wobec tego odrzucamy H0 o nieistotności zmiennych związanych z poziomami wy-kształcenia.


Zadanie 2.

Jesteś pracownikiem firmy ubezpieczeniowej. Na podstawie następujących danych do-tyczących liczby wypadków drogowych powodowanych przez klientów firmy:0, 1, 2, 0, 0, 1, 3, 1, 0, 1, 2, 0, 1, 1, 0, masz oszacować przeciętną liczbę wypadków.

1. wyprowadź estymator metodą momentów dla liczby wypadków. Podpowiedź: Roz-pocznij od wyprowadzenia wzoru na wartość oczekiwaną wiedząc że

∑∞i=0

λx

x! = eλ

2. wyprowadź wzór na estymator największej wiarogodności

3. opracuj procedurę dla programu Stata, która może być wykorzystana dla analizy 1mln obserwacji.

Rozwiązanie

1. Liczbę wypadków dobrze przybliża rozkład Poissona.

EX =∞∑i=0

xλx

x!e−λ = 0 + 1λe−λ + 2

λ2

2!e−λ + 3

λ3

3!e−λ + . . . =

= λ(e−λ + 2λ

2!e−λ + 3

λ2

3!e−λ + . . .) = λ

I przyrównujemy średnią próbkową do średniej z populacji.

EMM(λ) =∑

xi

n=

1315

2.

L = Πni=1

λxi

xi!e−λ

lnL =∑

xilnλ−∑

ln(xi!)−∑

λ

∂lnL

∂λ=

∑xi

λ− n = 0 → λ =

∑xi

n=

1315

3. program define poissonversion 8args lnf thetatempvar lambdaquietly gen double ‘lambda’ = exp(‘theta)quietly replace ‘lnf’= -‘lambda’+$ML_y1*ln(‘lambda’)end


Zadanie 3.

Wskaż model, który według Ciebie jest najbardziej odpowiedni do analizy następują-cych problemów społeczno-ekonomicznych. Uzasadnij swój wybór.

(a) stopień zadowolenia z życia mierzony za pomocą siedmiostopniowej skali

(b) wysokość zarobków mężczyzn

(c) długość pozostawania na bezrobociu

Rozwiązanie

(a) Stopień zadowolenia z życia mierzony za pomocą siedmiostopniowej skali może byćmodelowany za pomocą jednego z modeli dla dyskretnej uporządkowanej zmien-nej zależnej. Ankiety psychologiczne i socjologiczne zakładają, że respondent jestw stanie wartościować swoje odpowiedzi, wobec tego budując model powinniśmywykorzystać tą informację.

(b) Wysokość zarobków meżczyzn jest cechą charakterystycznej subpopulacji - pracują-cych mężczyzn. Powinniśmy użyć modelu Heckmana. Bycie mężczyzną jest czynni-kiem niezależnym od badanej osoby, ale fakt pracowania zależy od respondenta.

(c) Długość pozostawania na bezrobociu, jest okresem czasu. Jest to liczba rzeczywista(wielkość jest ciągła), ograniczona z dołu. Wobec tego powinniśmy użyć modelu dlazmiennej ocenzurowanej, czyli tobitu.


Zadanie 3.

Wskaż model, który według Ciebie jest najbardziej odpowiedni do analizy następują-cych problemów społeczno-ekonomicznych. Uzasadnij swój wybór.

(a) ilość izb w mieszkaniu

(b) wysokość zarobków kobiet

(c) wydatki na zakup sprzętu audio-video poniesione w ostatnim roku

Rozwiązanie

(a) Ilość izb w mieszkaniu jest dana liczbą naturalną. Z reguły mieszkanie liczy od 1 do5 izb, więc zarówno średnia jak i wariancja powinny zawierać się w przedziale 2-3.Wobec tego rozsądnym wyborem jest model Poissona.

(b) Wysokość zarobków kobiet jest cechą charakterystycznej subpopulacji - pracującychkobiet. Powinniśmy użyć modelu Heckmana. Bycie kobietą jest czynnikiem niezależ-nym od badanej osoby, ale fakt pracowania zależy od respondenta.

(c) Nie wszystkie osoby w ostatnim roku poniosły wydatki na zakup sprzętu audio-video.W zbiorze możemy oczekiwać wielu obserwacji o wartości zero. Wobec tego,by uzyskać dobre oszacowania, powinniśmy użyć modelu tobitowego.


Zadanie 4.

Oszacowano na podstawie próby reprezentatywnej model Heckmana dla zależnościmiędzy wysokością oferowanej przez rynek płacy a charakterystykami respondenta. Wrównaniu regresji umieszczono wiek i płeć, a w równaniu selekcji wiek, płeć (1 mężczyzna,2 kobieta) i dochód pozapłacowy. Zarówno płaca jak i dochód pozapłacowy zostały zlo-garytmowane. Uzyskane oszacowania parametrów modelu i efektów cząstkowych znajdująsię poniżej.

Heckman selection model Number of obs = 1470(regression model with sample selection) Censored obs = 837

Uncensored obs = 633Wald chi2(2) = 36.92

Log likelihood = -1351.816 Prob > chi2 = 0.0000----------------------------------------------------------------

| Coef. Std. Err. z P>|z|-------------+--------------------------------------------------lrincome |

age | -.0038008 .0030392 -1.25 0.211_Isex_2 | -.2935203 .0483514 -6.07 0.000_cons | 5.494951 .1011862 54.31 0.000

-------------+--------------------------------------------------select |

_Isex_2 | -.2672067 .0718456 -3.72 0.000age | -.0358237 .0023274 -15.39 0.000

lextincome | -.450367 .0527881 -8.53 0.000_cons | 4.132161 .3303863 12.51 0.000

-------------+--------------------------------------------------/athrho | .5645339 .1583798 3.56 0.000/lnsigma | -.5155443 .0505479 -10.20 0.000

-------------+--------------------------------------------------rho | .5113336 .1169695sigma | .5971755 .030186lambda | .3053559 .0831266

----------------------------------------------------------------LR test of indep. eqns.(rho = 0):chi2(1)=11.82 Pr > chi2 =0.0006----------------------------------------------------------------

Marginal effects after heckmany = E(lrincome|Zg>0) (predict, ycond)= 5.4370371

----------------------------------------------------------------variable | dy/dx Std. Err. z P>|z| X---------+------------------------------------------------------

age | .003688 .00224 1.64 0.100 47.4558_Isex_2*| -.2380003 .04373 -5.44 0.000 .57415lextin~e | .0941472 .02617 3.60 0.000 5.58034----------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1

Marginal effects after heckmany = Pr(select) (predict, psel)= .40729903


age | -.013904 .00089 -15.65 0.000 47.4558_Isex_2*| -.1038767 .0279 -3.72 0.000 .57415lextin~e | -.1747977 .02055 -8.51 0.000 5.58034----------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1

Marginal effects after heckmany = E(lrincome*|Pr(select)) (predict, yexpected)= 2.2145



age | -.0740944 .00486 -15.26 0.000 47.4558_Isex_2*| -.6656166 .1532 -4.34 0.000 .57415lextin~e | -.9120358 .10958 -8.32 0.000 5.58034----------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1

1. Sprawdź istotność oraz łączną istotność zmiennych w modelu α = 0.05. Oceń dopa-sowanie modelu do danych empirycznych.

2. Podaj interpretację ekonomiczną wielkości oszacowanych parametrów modelu.

3. Podaj interpretację ekonomiczną efektów cząstkowych dla wieku w pierwszej, drugieji trzeciej tablicy efektów cząstkowych.

4. Zinterpretuj wyliczoną wielkość parametru ρ i wyjaśnij, czy jest ona zgodna z intu-icją. Przeprowadź test na korelację między efektami błędami losowymi w równaniupłac i równaniu selekcji i wyjaśnij jego znaczenie praktyczne.

5. Podaj ekonomiczne i ekonometryczne powody, dla których zmienna dochód poza-płacowy (lrincome) nie została umieszczona w równaniu regresji.

Rozwiązanie

1. W równaniu zjawiska zmienną nieistotną okazał się wiek [−1.25,p-value0.211 > 0.05].Pozostałe zmienne w modelu są istotne. Łącznie wszystkie zmienne w modelu sąistotne [36.92,p-value0.000 < 0.05].

2. Oszacowany model opisuje wpływ czynników na ofertę płacy. Każdy dodatkowy rokżycia obniża oferowaną płacę o 0.38%. Kobietom oferowana jest płaca o 29% niższaniż mężczyznom.

3. Osoby, które pracują z każdym dodatkowym rokiem życia otrzymują ofertę płacy o0.37% niższą. Dodatkowy rok życia obniża prawdopodobieństwo posiadania pracy o1.4%. Oczekiwany dochód z pracy spada z każdym rokiem życia o 7.4%.

4. Parametr ρ mierzy stopień korelacji między nieobserwowalnymi czynnikami w rów-naniu płac i partycypacji w rynku pracy. W modelu korelacja ta wyszła dodatnia.Ponieważ oczekujemy, że czynniki, które pozytywnie wpływają na prawdopodobień-stwo posiadania pracy wpływają także pozytywnie na wysokość płacy, więc dodatniznak tego oszacowania tego parametru jest zgodny z intuicją. By przeprowadzić testpatrzymy na statystykę LR dla H0 : ρ = 0. Wielkość statystyki testowej równa 11.82i wartość p − value = 0.0006 < 0.05 skłaniają nas do odrzucenia H0 i przyjęciahipotezy alternatywnej, że istnieje niezerowa korelacja między błędami losowymi wrównaniach. Praktyczne znaczenie tego testu wiąże się z tym, że w razie prawdzi-wości H − 0 : ρ = 0 można do oszacowania równania regresji zastosować zwykłeMNK.

5. Z punktu widzenia ekonomii dla pracodawcy jest nieistotne jaki dochód pozapłacowyosiąga pracownik. W równaniu oferty płacy ta zmienna nie powinna się pojawiać. Zdrugiej strony z przyczyn ekonometrycznych bardzo pożądane jest, by w równaniuselekcji pojawiały się zmienne nie pojawiające się w równaniu zjawiska. Tylko w tymprzypadku można uzyskać precyzyjne oszacowania parametrów.


Zadanie 5.

Rozważ następujący model:

yi = exp (α + βxi) + ui, i = 1, . . . , n

ε ∼ N(0, σ2I

)1. Znajdź warunki pierwszego rzędu na estymatory MNW parametrów α i β

2. Jakie własności będą miały uzyskane w ten sposób estymatory?

3. Wyprowadź statystykę LM dla hipotezy β = 0. Przedyskutuj zalety statystyki LMw stosunku do statystyki Walda i statystyki LR.

4. Wyjaśnij, czy model ten można przekształcić do modelu, który można oszacować zapomocą MNK.

Rozwiązanie

1.yi ∼ N(exp(α + βxi), σ2I)

Więc funkcja gęstości jest dana przez

f(yi) =1√

2πσ2exp

{− [yi − exp (α + βxi)]

2

2σ2

}

ln f (y1 . . . yn) = −n

2ln (2π)− n

2ln

(σ2

)−

∑ [yi − exp (α + βxi)]2

2σ2

∂ ln f

∂β=

n∑i=1

{[yi − exp (α + βxi)] exp (α + βxi) xi

σ2

}n∑

i=1

yi exp (α + βxi) xi =n∑

i=1

exp (2α + 2βxi) xi

∂ ln f

∂σ2= −n

21σ2

+n∑

i=1

[yi − exp (α + βxi)]2

2σ4

σ2 =1n

n∑i=1

[yi − exp (α + βxi)]2

2. Dla spełnionych założeń MNW estymator ten będzie estymatorem zgodnym ponie-waż estymatory MNW są zgodne.

3. Statystykę LM można policzyć w następujący sposób:

(a) oszacować model, w którym zakładamy, że H0 : β = 0. Taki model ma postaćyi = exp (α) + ui jest więc zwykłym model liniowym, w którym występujejedynie stała α∗ = exp (α). Po oszacowaniu α∗ za pomocą MNK znajdujemyoszacowanie α = ln (α∗). Oznaczmy reszty z MNK jako ui = yi − α∗ = yi −exp (α).


(b) Liczymy gradienty funkcji wiarogodności dla modelu bez ograniczeń dla warto-ści oszacowanych w modelu z ograniczeniami (wektory score):

∂ ln fi

∂β

∣∣∣∣ β=0α=bα

σ2=s2

=[yi − exp (α)] exp (α) xi

s2=

uiα∗xi

s2

∂ ln fi

∂σ2

∣∣∣∣β=0α=bα

σ2=s2

= −12

1s2

+[yi − exp (α)]2

2s4= − 1

2s2

[1−

(ui

s

)2]

(c) Znajdujemy statystykę LM przy jako sumę wartości dopasowanych w regresjiscore’ów na 1.Statystykę tą można znaleźć przy zastosowaniu MNK. Statystyki LR i Wwymagałyby oszacowania modelu nieliniowego.

4. Nie, modelu tego nie da się sprowadzić do liniowości.

Ekonometria — ćwiczenia Kolokwium 2 semestr 22/05/05...

Documents

Transcript of Ekonometria — ćwiczenia Kolokwium 2 semestr 22/05/05...