Mikroekonometria 12 - Czaj.orgczaj.org/pub/teaching/ME/me.12.f.pdf · czaj.org Modele binarne...

Mikroekonometria12

Mikołaj CzajkowskiWiktor Budziński

czaj.org

Modele binarne – heterogeniczność parametrów Heterogeniczność stałej (model efektów stałych) lub

wariancji składnika losowego (model efektów losowych) można uznać za szczególny przypadek heterogeniczności parametrów modelu

Rozluźniamy założenie o tym, że każda osoba ma takie same parametry funkcji użyteczności

Teraz parametry też są indeksowane po i (są różne dla różnych respondentów) mogą mieć zadany rozkład w populacji / próbie Np.

( )ε∗

∗

′= += =

= > ; 1,..., ; 1,...,

0it i it it

iit it

Yi N t T

Y Y

β X

1

iβ( ),i MVNβ B Σ

czaj.org

Modele binarne – heterogeniczność parametrówModel parametrów losowych Gdy parametry mają rozkłady ciągłe – mówimy o modelu

parametrów losowych

Nie wszystkie parametry muszą być losowe Parametry mogą być skorelowane (macierz Σ nie musi być

diagonalna) Estymowany jest nie pojedynczy parametr, lecz np. średnia i

wariancja opisujące rozkład parametrów w próbie (ewentualnie także korelacje)

Możemy także zbudować model, w którym średnie uzależnione są od jakichś zmiennych objaśniających (np. cech respondenta)

Nieobserwowalna / obserwowalna heterogeniczność

( ),i fβ β Σ

( )′+ ,i ifβ β γ z Σ

czaj.org

Modele binarne – heterogeniczność parametrówModel parametrów losowych

Dla większości rozkładów można zoperacjonalizować następująco

vi – zmienne losowe o zadanym rozkładzie (np. normalny, lognormalny, trójkątny, jednostajny), średniej zero i znanej wariancji – niezależne lub z autokorelacją R jest macierzą diagonalną z parametrami określającymi siłę

autokorelacji ui – zdefiniowane jak niezależne vi

Γ – macierz dolnotrójkątna lub diagonalna, z 1 na przekątnej, (taka, że ΓΓ'vi = Σ) Jeśli w modelu nie ma korelacji pomiędzy parametrami losowymi to ΓΓ' jest macierzą jednostkową, a vi zawiera wariancje

( )+ ,i ifβ β z γ Σ

= + + Γi i iβ β z γ v

==∀

1,..., i

it it T

v v−= +1it it itv Rv u

czaj.org

Modele binarne – heterogeniczność parametrówModel parametrów losowych Prawdopodobieństwo zaobserwowania określonych wyborów

respondenta i:

vi jest nieobserwowalne, więc bezwarunkowe prawdopodobieństwo to:

Funkcja LL: Tej wielokrotnej całki nie ma się niestety jak pozbyć, w pochodnych też

występuje – analityczna maksymalizacja raczej niemożliwa Metoda – maksymalizacja symulowanej wartości funkcji ML

( ) ( )

( )( ) ( )=

= =

= =

′= + + Γ =

∏

∏ ∏

11

1 1

Pr ,..., | , , Pr | , ,

, | , |

i

i

i i

T

i i iT i i i it i i it

T T

it i i i i it i i it t

L Y Y Y

g Y g Y

X z v X z β

β z γ v X v X β v

( ) ( ) ( )=

= = ∏ 1

| ... Pr | , ,i

i

i

T

i i i i it i i i it

L E L g v Y dvv

v X z β v

( ) ( )= =

=

∏

1 1ln ln ... Pr | , ,

i

i

TN

i it i i i ii t

L g v Y dv

X z β v

czaj.org

Metoda maksymalizacji symulowanej wartości funkcji ML

Czasem funkcja ML jest zbyt skomplikowana, żeby analitycznie obliczyć jej wartość (i wartości jej pochodnych) Np. parametry losowe, efekty losowe itp. – wielokrotne całki Wartości takich funkcji można symulować

Szacowanie wartości całek przez symulacje Np. parametr losowy Losujemy n różnych wartości parametru z zadanego rozkładu Dla każdej z wylosowanych wartości obliczamy wartość funkcji ML Bierzemy średnią, która jest wartością oczekiwaną funkcji ML

( ) ( )

( )

= =

= = =

=

=

∏

∏

1 1

1 1 1

ln ln ... Pr |

1ln ln Pr |

i

i

i

TN

i it i i ii t

TN R

S it i iri r t

L g v Y d

L YR

v

X β v

X β

czaj.org

Przykład – opieka zdrowotna w Niemczech1. Wczytaj projekt me.gerhealth.lpj2. Skonstruuj model, w którym odbycie wizyty u lekarza (Y = 1(docvis > 0))

wyjaśniane jest przez stałą, wiek, dochód, posiadanie dzieci, liczbę lat edukacji i bycie w małżeństwie

3. Skonstruuj model ekwiwalentny do modelu efektów losowych, wprowadzając heterogeniczność odpowiednich zmiennych Porównaj wyniki z modelem efektów losowych Dlaczego model konwerguje tak długo?

MODEL ; ...; rpm; fcn = <zmienna>(<oznaczenie rozkładu>); pds = <liczba lub zmienna> (lub ; panel) $

► n – rozkład normalny► t – rozkład trójkątny► u – rozkład jednostajny► l – rozkład lognormalny► o – rozkład trójkątny zakotwiczony w 0► g – rozkład log gamma

czaj.org

Modele binarne – heterogeniczność parametrówModel parametrów losowych

Zezwolenie na korelacje zmiennych

Wprowadzenie zmiennych objaśniających średnie rozkładów losowych

W celu wykluczenia niektórych parametrów losowych z wyjaśniania ich średnich:

; cor

; rpm =

MODEL ; ...; rhs = <var1>, <var2>, ...; rpm = <cvar1>, <cvar2>,...; fcn = <var1(f)|#10...>, <var2(f)|#01...>,...

czaj.org

Kontrolowanie symulacji w NLOGIT► CALC; ran(<seed>) $ - ustala wartość ziarna ► ; halton – wymusza zastosowanie liczb z ciągu Haltona

► ; pts = <liczba> – liczba losowań► ; maxit = <liczba> – maksymalna liczba iteracji

► ; tlg = <liczba> – ustala poziom tolerancji konwergencji dla gradientu

► ; tlb = <liczba> – ustala poziom tolerancji konwergencji dla zmiany wartości parametrów

► ; tlf = <liczba> – ustala poziom tolerancji konwergencji dla zmiany wartości funkcji LL

► TIMER $ – wyświetla czas estymacji modeli

czaj.org

Kontrolowanie symulacji w NLOGIT Informacje pozwalające znaleźć przyczynę braku konwergencji, i inne

problemy (np. nieodpowiednio wyskalowane dane)

Uwagi Modele z heterogenicznością parametrów zwykle wymagają więcej niż

jednej obserwacji na respondenta, żeby dobrze działać – pamiętaj o uwzględnieniu struktury panelowej

Modele z heterogenicznością parametrów trudniejsze w estymacji –mogą wymagać zwiększenia maksymalnej liczby iteracji

Modele z heterogenicznością wymagające symulacji – dla ostatecznego modelu liczba ‘drawów’ powinna wynosić co najmniej kilkaset (1000+?) Przyjmijmy, że dla prac domowych wystarczy 100

► ; output = 0 – nie wyświetla informacji technicznych► ; output = 1 – wyświetla wartości startowe, maksymalną liczbę

iteracji, tolerancję konwergencji, algorytm optymalizacyjny► ; output = 2 – jak 1 + dodatkowo gradient► ; output = 3 – jak 2 + dodatkowo wartości parametrów► ; output = 4 – jak 3 + dodatkowo wielkość kroku

czaj.org

Modele binarne – heterogeniczność parametrówModel klas ukrytych

Jeśli parametry mają rozkłady dyskretne – mówimy o modelu klas ukrytych Zakładamy istnienie J różnych typów (klas) parametrów

Prawdopodobieństwo warunkowe (pod warunkiem przynależności do danej klasy) to:

Zaś przynależność osoby do danej klasy jest losowa Nie wiemy kto jest w jakiej klasie parametrów

{ }∈ 1 ,...,i Jβ β β

( ) ε= +Pr | ,it it it j itY j XX β

czaj.org

Modele binarne – heterogeniczność parametrówModel klas ukrytych Przynależność osoby do danej klasy jest losowa

Prawdopodobieństwo przynależności do określonej klasy można zapisać jako

Przy czym jedna z klas jest referencyjna Można też przynależność do danej klasy wyjaśniać obserwowalnymi

zmiennymi (cechami osób)

Liczba klas ustalana jest przez badacza a priori

( )( )

θ

θ=

=

1

exp

exp

jji J

jj

F

θ = 0J

( )( )

=

=

1

exp

exp

ji jji J

ji jj

Fz θ

z θ

=

=1

1J

jij

F

czaj.org

Modele binarne – heterogeniczność parametrówModel klas ukrytych Prawdopodobieństwo zaobserwowania określonego wyboru to

Wybory są niezależne, więc warunkowe prawdopodobieństwo zaobserwowania serii Ti wyborów to

A funkcja LL to po prostu

I dalej estymacja (maksymalizacja LL po i )normalnie

( ) ( ) ( )=

=1

Pr | , Pr |J

it it it ji ji j it jij

Y F YX z z θ β

( ) ( ) ( )= =

=

∏1

1 1Pr ,..., | , Pr |

i

i

TJ

i iT i i ji ji j it jij t

Y Y F YX z z θ β

( ) ( )= = =

= ∏

1 1 1ln ln Pr |

iTN J

ji ji j it jii j t

L F Yz θ β

( )= 1 ,..., Jβ β β ( )−= 1 1,..., ,Jθ θ θ 0

czaj.org

Przykład – opieka zdrowotna w Niemczech4. Skonstruuj model klas ukrytych

Ile różnych klas parametrów wykorzystać? Przetestuj różne możliwości

Dodaj zmienne objaśniające przynależność do klas

W jaki sposób wybrać optymalną liczbę klas? AIC Możliwość interpretacji wyników

MODEL ; ...; lcm; pds = <liczba lub zmienna> (lub ; panel) $

; pts = <liczba>

; lcm = ...

czaj.org

Modele wielomianowe – heterogeniczność parametrówModel parametrów losowych

Model parametrów losowych można zastosować także w przypadku modeli wielomianowych

Inne opcje

NLOGIT ; ...; rpl (lub RPLOGIT); fcn = ... ; pds = ... $

; start = ...; tlg = ...; tlf = ...; tlb = ...; alg = ...; maxit = ...; pts = ...; halton; output = ... ; set

czaj.org


Inne opcje; list; keep = ...; prob = ...; CML:; test: (or ; wald); rst =; show model; describe; crosstab; par; effects:; table = ...; covariance matrix (or ; printvc); cluster = ...; robust; pds = ...; correlated (= ...); sdv = ...; fix; rpl = ...; hfr = ...; ecm = ...; checkdata; wtp = ...

czaj.org


Możliwe do zastosowania rozkłady► c – niestochastyczny βi = β ► n – normalny βi = β + σvi,vi ~ N[0,1] ► s – normalny skośny βi = β + σvi + λ|wi|, vi, wi ~ N[0,1] ► l – lognormalny βi = exp(β + σvi), vi ~ N[0.1] ► z – normalny ucięty βi = β + σvi, vi ~ ucięty normalny (-1.96 to 1.96) ► u – jednostajny βi = β + σvi, vi ~ U[-1,1] ► f – jednostronny jednostajny βi = β + βvi, vi ~ jednostajny [-1,1] ► t – trójkątny βi = β + σvi, vi ~ trójkątny[-1,1] ► o – jednostronny trójkątny βi = β + βvi, vi ~ trójkątny [-1,1] ► d – beta, dome βi = β + σvi, vi ~ 2×beta(2,2) - 1 ► b – beta, skalowany βi = βvi, vi ~ beta(3,3) ► e – Erlang βi = β + σvi, vi ~ gamma(1,4) - 4 ► g – gamma βi = exp(β + σvi), vi = log(-log(u1*u2*u3*u4)) ► w – Weibull βi = β + σvi, vi = 2(-logui)√.5, ui~ U[0,1] ► r – Rayleigh βi = exp(βi (Weibull)) ► p – wykładniczy βi = β + σvi, vi ~ wykłądniczy - 1 ► q – wykładniczy, skalowany βi = βvi, vi ~ wykładniczy► x – cenzurowany (z lewej) βi = max(0, βi (normalny)) ► m – cenzurowany (z prawej) βi = min(0, βi (normalny)) ► v – exp(trójkątny) βi = exp(βi (trójkątny)) ► i – rozkład wartości ekstremalnych I typu βi = β + σvi, vi ~ standardowy

rozkład Gumbela

czaj.org

Modele wielomianowe – heterogeniczność parametrówModel klas ukrytych

Model klas ukrytych dla modeli wielomianowychNLOGIT ; ...

; LCM (or LCLOGIT) = ...; pts = <no. of classes> $

czaj.org

Praca domowa ME.11 (grupy 2 lub 3-osobowe)1. Skonstruuj najlepszy, Twoim zdaniem, model

wyjaśniający wybory optymalnego kontraktu wywozu odpadów (projekt me.recycling.lpj), który uwzględnia nieobserwowalną i obserwowalną heterogeniczność preferencji (model parametrów losowych lub model klas ukrytych)

2. Zinterpretuj uzyskane wyniki

czaj.org

Modele uporządkowane – heterogeniczność parametrówModel parametrów losowych

Rozluźnienie założenia o stałości parametrów funkcji wskaźnikowej Parametry – zmiennymi losowymi o zadanych rozkładach (estymowana

średnia i wariancja rozkładu)

Estymacja – maksymalizacja symulowanej wartości funkcji ML

ε∗ = +i i i iy X β ( ),i fβ β Σ

( ) ( ) ( )= = − −| , , , 1, ,it i i it i it iP y j F j F jX β α X β α X β

ORDERED; ... $ ? model bez parametrów losowych – wartości startowe ORDERED; ...

; pds = ...; rpm; fcn = ... ? specyfikacja parametrów ; ... $

czaj.org

Przykład – opieka zdrowotna w Niemczech5. Skonstruuj model, w którym ocena własnego stanu

zdrowia (hstat) wyjaśniana za pomocą modelu efektów losowych i modelu parametrów losowych

Modele są ekwiwalentne, choć metoda estymacji nieco odmienna

Losowe parametry nie muszą ograniczać się do stałej Inne zmienne Inne rozkłady

czaj.org

Modele uporządkowane – heterogeniczność parametrówModel parametrów losowych

Średnie parametrów losowych można objaśniać za pomocą obserwowalnych charakterystyk respondenta

Parametry mogą być skorelowane

ε∗ = +i i i iy X β

( ) ( ) ( )= = − −| , , , 1, ,it i i it i it iP y j F j F jX β α X β α X β

( )+ ,i ifβ β z γ Σ

► '; rpm = ...' – lista zmiennych objaśniających średnie parametrów losowych

► '; cor' – zezwala na korelacje parametrów losowych ► Macierz wariancji-kowariancji parametrów losowych (Σ)

nie musi być diagonalna► Dodatkowo estymowane elementy macierzy

dolnotrójkątnej pochodzącej z dekompozycji Choleskiego Σ

czaj.org

Modele uporządkowane – heterogeniczność parametrówModel klas ukrytych

Model klas ukrytych Parametry – zmiennymi losowymi o rozkładach dyskretnych Estymowany osobny parametr dla każdej z 'klas' preferencji Przynależność do klas probabilistyczna (nie wiadomo a priori

który respondent należy do której klasy) Możliwa do wyjaśniania za pomocą charakterystyk respondenta

ε∗ = +i i i iy X β { }∈ 1 2, ,...,i Kβ β β β

( ) ( ) ( )= = + − − +| , , , 1, ,it i i it it i it it iP y j F j F jX β α X β X δ α X β X δ

{ }∈ + + + +1 2, ,...,i Kβ β δ β δ β δ

czaj.org

Modele uporządkowane – heterogeniczność parametrówModel klas ukrytych

Model klas ukrytych

6. Skonstruuj model, w którym ocena własnego stanu zdrowia (hstat) wyjaśniana za pomocą modelu klas ukrytych

ORDERED; ... $ ? model bez klas ukrytych – wartości startowe ORDERED; ...

; lcm ? = ... – zmienne objaśniające przynależność do klas; pts = ... ? liczba klas; pds = ...; ... $

czaj.org

Modele uporządkowane – heterogeniczność progówHierarchiczny model wyborów uporządkowanych Idea – progi prawdopodobnie nie są takie same dla

wszystkich, a składnik losowy / efekty stałe / efekty losowe / parametry losowe mogą nie załatwiać sprawy

Zróbmy model, w którym progi będą zależały od obserwowalnych zmiennych charakteryzujących respondenta

Hierarchiczny model wyborów uporządkowanych (ang. hierarchical ordered probit)

czaj.org

Modele uporządkowane – heterogeniczność progówHierarchiczny model wyborów uporządkowanych

Dwie możliwe specyfikacje – każdy ma inną stałą, ale taki sam wektor

współczynników – każdy ma inną stałą i inny wektor

współczynników Możliwy różny wpływ tej samej cechy na różne progi Może powodować problemy z uporządkowaniem progów

( )α θ ′= +expj j iδ Z

( )α θ ′= +expj j j iδ Z

► '; HO1 = ...' – specyfikacja 1► '; HO2 = ...' – specyfikacja 2► Lista zmiennych nie może zawierać stałej

czaj.org

Modele uporządkowane – heterogeniczność progówHierarchiczny model wyborów uporządkowanych Dodatkowo – możliwe wprowadzenie nieobserwowalnej

heterogeniczności progów

7. Skonstruuj model, w którym ocena własnego stanu zdrowia (hstat) wyjaśniana za pomocą panelowego modelu progów losowych, z losowymi parametrami i zmiennymi objaśniającymi średnie i wariancje parametrów losowych oraz średnie progów losowych

( )αα α α θ−

=′= + + +

0

, 1

0

expij i j j i ijuδ Z ( )0,1iju N

ORDERED; ...; pds = ...; rtm ? model z losowymi progami (random thresholds model); limits = ... ? zmienne objaśniające średnie progów ? ; random effects – progi wykorzystywać będą wspólne u_i; ... $

czaj.org

Modele liczności zdarzeń – heterogeniczność parametrówModel parametrów losowych

Modele można zmodyfikować pozwalając aby parametry były zmiennymi losowymi o zadanych rozkładach ciągłych

Model parametrów losowych β – średnie Z – obserwowalne zmienne socjodemograficzne (zmienne objaśniające

średnie) Σ – macierz wariancji-kowariancji (diagonalna lub pozwalająca na

korelacje losowych parametrów)

( )′+ ,i ifβ β γ Z Σ

► Działa zarówno z modelem Poissona jak i ujemnym dwumianowym

► '; rpm' lub '; rpm = ...' jeśli model ze zmiennymi objaśniającymi średnie

► '; fcn = ...' – specyfikacja losowych parametrów i ich rozkładów

► '; cor' – model ze skorelowanymi parametrami

czaj.org

Modele liczności zdarzeń – heterogeniczność parametrówModel klas ukrytych

Modele można zmodyfikować pozwalając aby parametry były zmiennymi losowymi o zadanych rozkładach dyskretnych

Model klas ukrytych K – 'typów' preferencji (klas)

Jak zawsze, modele z nieobserwowalną heterogenicznością działają znacznie lepiej dla wielu obserwacji na respondenta

{ }∈ 1 2, ,...,i Kβ β β β

► Działa zarówno z modelem Poissona jak i ujemnym dwumianowym

► '; lcm' lub '; lcm = ...' jeśli model ze zmiennymi objaśniającymi przynależność do klas

► '; pts = ...' – specyfikacja liczby klas

► '; panel' lub '; pds = ...'

czaj.org

Modele liczności zdarzeń – heterogeniczność parametrów

8. Wczytaj projekt me.baltic.lpj9. Skonstruuj model, w którym liczba wizyt nad morze (TRIPS),

wyjaśniana jest przez stałą specyficzną dla kraju i koszt podróży (TC_km)

Przygotuj model parametrów losowych Przygotuj model klas ukrytych

2015-12-18 14:51:17

Mikroekonometria 12 - Czaj.orgczaj.org/pub/teaching/ME/me.12.f.pdf · czaj.org Modele binarne...

Documents

Transcript of Mikroekonometria 12 - Czaj.orgczaj.org/pub/teaching/ME/me.12.f.pdf · czaj.org Modele binarne...