Mikroekonometria 12 - Czaj.orgczaj.org/pub/teaching/ME/me.12.f.pdf · czaj.org Modele binarne...
Transcript of Mikroekonometria 12 - Czaj.orgczaj.org/pub/teaching/ME/me.12.f.pdf · czaj.org Modele binarne...
Mikroekonometria12
Mikołaj CzajkowskiWiktor Budziński
czaj.org
Modele binarne – heterogeniczność parametrów Heterogeniczność stałej (model efektów stałych) lub
wariancji składnika losowego (model efektów losowych) można uznać za szczególny przypadek heterogeniczności parametrów modelu
Rozluźniamy założenie o tym, że każda osoba ma takie same parametry funkcji użyteczności
Teraz parametry też są indeksowane po i (są różne dla różnych respondentów) mogą mieć zadany rozkład w populacji / próbie Np.
( )ε∗
∗
′= += =
= > ; 1,..., ; 1,...,
0it i it it
iit it
Yi N t T
Y Y
β X
1
iβ( ),i MVNβ B Σ
czaj.org
Modele binarne – heterogeniczność parametrówModel parametrów losowych Gdy parametry mają rozkłady ciągłe – mówimy o modelu
parametrów losowych
Nie wszystkie parametry muszą być losowe Parametry mogą być skorelowane (macierz Σ nie musi być
diagonalna) Estymowany jest nie pojedynczy parametr, lecz np. średnia i
wariancja opisujące rozkład parametrów w próbie (ewentualnie także korelacje)
Możemy także zbudować model, w którym średnie uzależnione są od jakichś zmiennych objaśniających (np. cech respondenta)
Nieobserwowalna / obserwowalna heterogeniczność
( ),i fβ β Σ
( )′+ ,i ifβ β γ z Σ
czaj.org
Modele binarne – heterogeniczność parametrówModel parametrów losowych
Dla większości rozkładów można zoperacjonalizować następująco
vi – zmienne losowe o zadanym rozkładzie (np. normalny, lognormalny, trójkątny, jednostajny), średniej zero i znanej wariancji – niezależne lub z autokorelacją R jest macierzą diagonalną z parametrami określającymi siłę
autokorelacji ui – zdefiniowane jak niezależne vi
Γ – macierz dolnotrójkątna lub diagonalna, z 1 na przekątnej, (taka, że ΓΓ'vi = Σ) Jeśli w modelu nie ma korelacji pomiędzy parametrami losowymi to ΓΓ' jest macierzą jednostkową, a vi zawiera wariancje
( )+ ,i ifβ β z γ Σ
= + + Γi i iβ β z γ v
==∀
1,..., i
it it T
v v−= +1it it itv Rv u
czaj.org
Modele binarne – heterogeniczność parametrówModel parametrów losowych Prawdopodobieństwo zaobserwowania określonych wyborów
respondenta i:
vi jest nieobserwowalne, więc bezwarunkowe prawdopodobieństwo to:
Funkcja LL: Tej wielokrotnej całki nie ma się niestety jak pozbyć, w pochodnych też
występuje – analityczna maksymalizacja raczej niemożliwa Metoda – maksymalizacja symulowanej wartości funkcji ML
( ) ( )
( )( ) ( )=
= =
= =
′= + + Γ =
∏
∏ ∏
11
1 1
Pr ,..., | , , Pr | , ,
, | , |
i
i
i i
T
i i iT i i i it i i it
T T
it i i i i it i i it t
L Y Y Y
g Y g Y
X z v X z β
β z γ v X v X β v
( ) ( ) ( )=
= = ∏ 1
| ... Pr | , ,i
i
i
T
i i i i it i i i it
L E L g v Y dvv
v X z β v
( ) ( )= =
=
∏
1 1ln ln ... Pr | , ,
i
i
TN
i it i i i ii t
L g v Y dv
X z β v
czaj.org
Metoda maksymalizacji symulowanej wartości funkcji ML
Czasem funkcja ML jest zbyt skomplikowana, żeby analitycznie obliczyć jej wartość (i wartości jej pochodnych) Np. parametry losowe, efekty losowe itp. – wielokrotne całki Wartości takich funkcji można symulować
Szacowanie wartości całek przez symulacje Np. parametr losowy Losujemy n różnych wartości parametru z zadanego rozkładu Dla każdej z wylosowanych wartości obliczamy wartość funkcji ML Bierzemy średnią, która jest wartością oczekiwaną funkcji ML
( ) ( )
( )
= =
= = =
=
=
∏
∏
1 1
1 1 1
ln ln ... Pr |
1ln ln Pr |
i
i
i
TN
i it i i ii t
TN R
S it i iri r t
L g v Y d
L YR
v
X β v
X β
czaj.org
Przykład – opieka zdrowotna w Niemczech1. Wczytaj projekt me.gerhealth.lpj2. Skonstruuj model, w którym odbycie wizyty u lekarza (Y = 1(docvis > 0))
wyjaśniane jest przez stałą, wiek, dochód, posiadanie dzieci, liczbę lat edukacji i bycie w małżeństwie
3. Skonstruuj model ekwiwalentny do modelu efektów losowych, wprowadzając heterogeniczność odpowiednich zmiennych Porównaj wyniki z modelem efektów losowych Dlaczego model konwerguje tak długo?
MODEL ; ...; rpm; fcn = <zmienna>(<oznaczenie rozkładu>); pds = <liczba lub zmienna> (lub ; panel) $
► n – rozkład normalny► t – rozkład trójkątny► u – rozkład jednostajny► l – rozkład lognormalny► o – rozkład trójkątny zakotwiczony w 0► g – rozkład log gamma
czaj.org
Modele binarne – heterogeniczność parametrówModel parametrów losowych
Zezwolenie na korelacje zmiennych
Wprowadzenie zmiennych objaśniających średnie rozkładów losowych
W celu wykluczenia niektórych parametrów losowych z wyjaśniania ich średnich:
; cor
; rpm =
MODEL ; ...; rhs = <var1>, <var2>, ...; rpm = <cvar1>, <cvar2>,...; fcn = <var1(f)|#10...>, <var2(f)|#01...>,...
czaj.org
Kontrolowanie symulacji w NLOGIT► CALC; ran(<seed>) $ - ustala wartość ziarna ► ; halton – wymusza zastosowanie liczb z ciągu Haltona
► ; pts = <liczba> – liczba losowań► ; maxit = <liczba> – maksymalna liczba iteracji
► ; tlg = <liczba> – ustala poziom tolerancji konwergencji dla gradientu
► ; tlb = <liczba> – ustala poziom tolerancji konwergencji dla zmiany wartości parametrów
► ; tlf = <liczba> – ustala poziom tolerancji konwergencji dla zmiany wartości funkcji LL
► TIMER $ – wyświetla czas estymacji modeli
czaj.org
Kontrolowanie symulacji w NLOGIT Informacje pozwalające znaleźć przyczynę braku konwergencji, i inne
problemy (np. nieodpowiednio wyskalowane dane)
Uwagi Modele z heterogenicznością parametrów zwykle wymagają więcej niż
jednej obserwacji na respondenta, żeby dobrze działać – pamiętaj o uwzględnieniu struktury panelowej
Modele z heterogenicznością parametrów trudniejsze w estymacji –mogą wymagać zwiększenia maksymalnej liczby iteracji
Modele z heterogenicznością wymagające symulacji – dla ostatecznego modelu liczba ‘drawów’ powinna wynosić co najmniej kilkaset (1000+?) Przyjmijmy, że dla prac domowych wystarczy 100
► ; output = 0 – nie wyświetla informacji technicznych► ; output = 1 – wyświetla wartości startowe, maksymalną liczbę
iteracji, tolerancję konwergencji, algorytm optymalizacyjny► ; output = 2 – jak 1 + dodatkowo gradient► ; output = 3 – jak 2 + dodatkowo wartości parametrów► ; output = 4 – jak 3 + dodatkowo wielkość kroku
czaj.org
Modele binarne – heterogeniczność parametrówModel klas ukrytych
Jeśli parametry mają rozkłady dyskretne – mówimy o modelu klas ukrytych Zakładamy istnienie J różnych typów (klas) parametrów
Prawdopodobieństwo warunkowe (pod warunkiem przynależności do danej klasy) to:
Zaś przynależność osoby do danej klasy jest losowa Nie wiemy kto jest w jakiej klasie parametrów
{ }∈ 1 ,...,i Jβ β β
( ) ε= +Pr | ,it it it j itY j XX β
czaj.org
Modele binarne – heterogeniczność parametrówModel klas ukrytych Przynależność osoby do danej klasy jest losowa
Prawdopodobieństwo przynależności do określonej klasy można zapisać jako
Przy czym jedna z klas jest referencyjna Można też przynależność do danej klasy wyjaśniać obserwowalnymi
zmiennymi (cechami osób)
Liczba klas ustalana jest przez badacza a priori
( )( )
θ
θ=
=
1
exp
exp
jji J
jj
F
θ = 0J
( )( )
=
=
1
exp
exp
ji jji J
ji jj
Fz θ
z θ
=
=1
1J
jij
F
czaj.org
Modele binarne – heterogeniczność parametrówModel klas ukrytych Prawdopodobieństwo zaobserwowania określonego wyboru to
Wybory są niezależne, więc warunkowe prawdopodobieństwo zaobserwowania serii Ti wyborów to
A funkcja LL to po prostu
I dalej estymacja (maksymalizacja LL po i )normalnie
( ) ( ) ( )=
=1
Pr | , Pr |J
it it it ji ji j it jij
Y F YX z z θ β
( ) ( ) ( )= =
=
∏1
1 1Pr ,..., | , Pr |
i
i
TJ
i iT i i ji ji j it jij t
Y Y F YX z z θ β
( ) ( )= = =
= ∏
1 1 1ln ln Pr |
iTN J
ji ji j it jii j t
L F Yz θ β
( )= 1 ,..., Jβ β β ( )−= 1 1,..., ,Jθ θ θ 0
czaj.org
Przykład – opieka zdrowotna w Niemczech4. Skonstruuj model klas ukrytych
Ile różnych klas parametrów wykorzystać? Przetestuj różne możliwości
Dodaj zmienne objaśniające przynależność do klas
W jaki sposób wybrać optymalną liczbę klas? AIC Możliwość interpretacji wyników
MODEL ; ...; lcm; pds = <liczba lub zmienna> (lub ; panel) $
; pts = <liczba>
; lcm = ...
czaj.org
Modele wielomianowe – heterogeniczność parametrówModel parametrów losowych
Model parametrów losowych można zastosować także w przypadku modeli wielomianowych
Inne opcje
NLOGIT ; ...; rpl (lub RPLOGIT); fcn = ... ; pds = ... $
; start = ...; tlg = ...; tlf = ...; tlb = ...; alg = ...; maxit = ...; pts = ...; halton; output = ... ; set
czaj.org
Modele wielomianowe – heterogeniczność parametrówModel parametrów losowych
Inne opcje; list; keep = ...; prob = ...; CML:; test: (or ; wald); rst =; show model; describe; crosstab; par; effects:; table = ...; covariance matrix (or ; printvc); cluster = ...; robust; pds = ...; correlated (= ...); sdv = ...; fix; rpl = ...; hfr = ...; ecm = ...; checkdata; wtp = ...
czaj.org
Modele wielomianowe – heterogeniczność parametrówModel parametrów losowych
Możliwe do zastosowania rozkłady► c – niestochastyczny βi = β ► n – normalny βi = β + σvi,vi ~ N[0,1] ► s – normalny skośny βi = β + σvi + λ|wi|, vi, wi ~ N[0,1] ► l – lognormalny βi = exp(β + σvi), vi ~ N[0.1] ► z – normalny ucięty βi = β + σvi, vi ~ ucięty normalny (-1.96 to 1.96) ► u – jednostajny βi = β + σvi, vi ~ U[-1,1] ► f – jednostronny jednostajny βi = β + βvi, vi ~ jednostajny [-1,1] ► t – trójkątny βi = β + σvi, vi ~ trójkątny[-1,1] ► o – jednostronny trójkątny βi = β + βvi, vi ~ trójkątny [-1,1] ► d – beta, dome βi = β + σvi, vi ~ 2×beta(2,2) - 1 ► b – beta, skalowany βi = βvi, vi ~ beta(3,3) ► e – Erlang βi = β + σvi, vi ~ gamma(1,4) - 4 ► g – gamma βi = exp(β + σvi), vi = log(-log(u1*u2*u3*u4)) ► w – Weibull βi = β + σvi, vi = 2(-logui)√.5, ui~ U[0,1] ► r – Rayleigh βi = exp(βi (Weibull)) ► p – wykładniczy βi = β + σvi, vi ~ wykłądniczy - 1 ► q – wykładniczy, skalowany βi = βvi, vi ~ wykładniczy► x – cenzurowany (z lewej) βi = max(0, βi (normalny)) ► m – cenzurowany (z prawej) βi = min(0, βi (normalny)) ► v – exp(trójkątny) βi = exp(βi (trójkątny)) ► i – rozkład wartości ekstremalnych I typu βi = β + σvi, vi ~ standardowy
rozkład Gumbela
czaj.org
Modele wielomianowe – heterogeniczność parametrówModel klas ukrytych
Model klas ukrytych dla modeli wielomianowychNLOGIT ; ...
; LCM (or LCLOGIT) = ...; pts = <no. of classes> $
czaj.org
Praca domowa ME.11 (grupy 2 lub 3-osobowe)1. Skonstruuj najlepszy, Twoim zdaniem, model
wyjaśniający wybory optymalnego kontraktu wywozu odpadów (projekt me.recycling.lpj), który uwzględnia nieobserwowalną i obserwowalną heterogeniczność preferencji (model parametrów losowych lub model klas ukrytych)
2. Zinterpretuj uzyskane wyniki
czaj.org
Modele uporządkowane – heterogeniczność parametrówModel parametrów losowych
Rozluźnienie założenia o stałości parametrów funkcji wskaźnikowej Parametry – zmiennymi losowymi o zadanych rozkładach (estymowana
średnia i wariancja rozkładu)
Estymacja – maksymalizacja symulowanej wartości funkcji ML
ε∗ = +i i i iy X β ( ),i fβ β Σ
( ) ( ) ( )= = − −| , , , 1, ,it i i it i it iP y j F j F jX β α X β α X β
ORDERED; ... $ ? model bez parametrów losowych – wartości startowe ORDERED; ...
; pds = ...; rpm; fcn = ... ? specyfikacja parametrów ; ... $
czaj.org
Przykład – opieka zdrowotna w Niemczech5. Skonstruuj model, w którym ocena własnego stanu
zdrowia (hstat) wyjaśniana za pomocą modelu efektów losowych i modelu parametrów losowych
Modele są ekwiwalentne, choć metoda estymacji nieco odmienna
Losowe parametry nie muszą ograniczać się do stałej Inne zmienne Inne rozkłady
czaj.org
Modele uporządkowane – heterogeniczność parametrówModel parametrów losowych
Średnie parametrów losowych można objaśniać za pomocą obserwowalnych charakterystyk respondenta
Parametry mogą być skorelowane
ε∗ = +i i i iy X β
( ) ( ) ( )= = − −| , , , 1, ,it i i it i it iP y j F j F jX β α X β α X β
( )+ ,i ifβ β z γ Σ
► '; rpm = ...' – lista zmiennych objaśniających średnie parametrów losowych
► '; cor' – zezwala na korelacje parametrów losowych ► Macierz wariancji-kowariancji parametrów losowych (Σ)
nie musi być diagonalna► Dodatkowo estymowane elementy macierzy
dolnotrójkątnej pochodzącej z dekompozycji Choleskiego Σ
czaj.org
Modele uporządkowane – heterogeniczność parametrówModel klas ukrytych
Model klas ukrytych Parametry – zmiennymi losowymi o rozkładach dyskretnych Estymowany osobny parametr dla każdej z 'klas' preferencji Przynależność do klas probabilistyczna (nie wiadomo a priori
który respondent należy do której klasy) Możliwa do wyjaśniania za pomocą charakterystyk respondenta
ε∗ = +i i i iy X β { }∈ 1 2, ,...,i Kβ β β β
( ) ( ) ( )= = + − − +| , , , 1, ,it i i it it i it it iP y j F j F jX β α X β X δ α X β X δ
{ }∈ + + + +1 2, ,...,i Kβ β δ β δ β δ
czaj.org
Modele uporządkowane – heterogeniczność parametrówModel klas ukrytych
Model klas ukrytych
6. Skonstruuj model, w którym ocena własnego stanu zdrowia (hstat) wyjaśniana za pomocą modelu klas ukrytych
ORDERED; ... $ ? model bez klas ukrytych – wartości startowe ORDERED; ...
; lcm ? = ... – zmienne objaśniające przynależność do klas; pts = ... ? liczba klas; pds = ...; ... $
czaj.org
Modele uporządkowane – heterogeniczność progówHierarchiczny model wyborów uporządkowanych Idea – progi prawdopodobnie nie są takie same dla
wszystkich, a składnik losowy / efekty stałe / efekty losowe / parametry losowe mogą nie załatwiać sprawy
Zróbmy model, w którym progi będą zależały od obserwowalnych zmiennych charakteryzujących respondenta
Hierarchiczny model wyborów uporządkowanych (ang. hierarchical ordered probit)
czaj.org
Modele uporządkowane – heterogeniczność progówHierarchiczny model wyborów uporządkowanych
Dwie możliwe specyfikacje – każdy ma inną stałą, ale taki sam wektor
współczynników – każdy ma inną stałą i inny wektor
współczynników Możliwy różny wpływ tej samej cechy na różne progi Może powodować problemy z uporządkowaniem progów
( )α θ ′= +expj j iδ Z
( )α θ ′= +expj j j iδ Z
► '; HO1 = ...' – specyfikacja 1► '; HO2 = ...' – specyfikacja 2► Lista zmiennych nie może zawierać stałej
czaj.org
Modele uporządkowane – heterogeniczność progówHierarchiczny model wyborów uporządkowanych Dodatkowo – możliwe wprowadzenie nieobserwowalnej
heterogeniczności progów
7. Skonstruuj model, w którym ocena własnego stanu zdrowia (hstat) wyjaśniana za pomocą panelowego modelu progów losowych, z losowymi parametrami i zmiennymi objaśniającymi średnie i wariancje parametrów losowych oraz średnie progów losowych
( )αα α α θ−
=′= + + +
0
, 1
0
expij i j j i ijuδ Z ( )0,1iju N
ORDERED; ...; pds = ...; rtm ? model z losowymi progami (random thresholds model); limits = ... ? zmienne objaśniające średnie progów ? ; random effects – progi wykorzystywać będą wspólne u_i; ... $
czaj.org
Modele liczności zdarzeń – heterogeniczność parametrówModel parametrów losowych
Modele można zmodyfikować pozwalając aby parametry były zmiennymi losowymi o zadanych rozkładach ciągłych
Model parametrów losowych β – średnie Z – obserwowalne zmienne socjodemograficzne (zmienne objaśniające
średnie) Σ – macierz wariancji-kowariancji (diagonalna lub pozwalająca na
korelacje losowych parametrów)
( )′+ ,i ifβ β γ Z Σ
► Działa zarówno z modelem Poissona jak i ujemnym dwumianowym
► '; rpm' lub '; rpm = ...' jeśli model ze zmiennymi objaśniającymi średnie
► '; fcn = ...' – specyfikacja losowych parametrów i ich rozkładów
► '; cor' – model ze skorelowanymi parametrami
czaj.org
Modele liczności zdarzeń – heterogeniczność parametrówModel klas ukrytych
Modele można zmodyfikować pozwalając aby parametry były zmiennymi losowymi o zadanych rozkładach dyskretnych
Model klas ukrytych K – 'typów' preferencji (klas)
Jak zawsze, modele z nieobserwowalną heterogenicznością działają znacznie lepiej dla wielu obserwacji na respondenta
{ }∈ 1 2, ,...,i Kβ β β β
► Działa zarówno z modelem Poissona jak i ujemnym dwumianowym
► '; lcm' lub '; lcm = ...' jeśli model ze zmiennymi objaśniającymi przynależność do klas
► '; pts = ...' – specyfikacja liczby klas
► '; panel' lub '; pds = ...'
czaj.org
Modele liczności zdarzeń – heterogeniczność parametrów
8. Wczytaj projekt me.baltic.lpj9. Skonstruuj model, w którym liczba wizyt nad morze (TRIPS),
wyjaśniana jest przez stałą specyficzną dla kraju i koszt podróży (TC_km)
Przygotuj model parametrów losowych Przygotuj model klas ukrytych
2015-12-18 14:51:17