Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw...

14
Sabina Nowak Podstawy statystyki i ekonometrii Część II Podyplomowe Studia Wycena Nieruchomości Wydział Zarządzania Uniwersytetu Gdańskiego 27-28 kwietnia 2019 roku

Transcript of Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw...

Page 1: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

Sabina Nowak

Podstawy statystyki i ekonometrii Część II

Podyplomowe Studia Wycena Nieruchomości

Wydział Zarządzania Uniwersytetu Gdańskiego

27-28 kwietnia 2019 roku

Page 2: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

2

1. Model ekonometryczny. Pojęcie modelu, rodzaje modeli Model – kopia rzeczywistego obiektu, zachowująca pewne jego cechy a pomijająca inne, mniej ważne z punktu widzenia konstruktora modelu. Modele można podzielić na:

ikonograficzne (kopie fizyczne – zabawki, fotografie, manekiny, symulatory lotów/jazdy), analogowe (modele pojęć abstrakcyjnych takich jak prędkość, temperatura, czas – schematy,

diagramy, mapy, prędkościomierze), matematyczne (reprezentują realne sytuacje za pomocą znaków i symboli matematycznych).

Model ekonometryczny – równanie lub układ równań przedstawiający w sposób uproszczony i sformalizowany ilościowe zależności między badanymi zmiennymi ekonomicznymi, wynikające z adekwatnej teorii ekonomii. 2. Modele ekonometryczne szeregów czasowych1 Można wyróżnić trzy rodzaje komponentów szeregów czasowych:

– składnik systematyczny, – składniki powtarzalne (cykliczne i sezonowe), – składnik zakłócający (przypadkowy).

Składnik systematyczny (tendencja rozwojowa) szeregu czasowego badanej zmiennej ekonomicznej jest wynikiem oddziaływania czynników głównych, zwykle definiowanych przez teorie ekonomiczne. Czynniki te oddziałują w jednym kierunku, powodując systematyczny wzrost (spadek) badanej zmiennej. Składnik cykliczny (wahania cykliczne) jest wynikiem występowania długookresowych zmian siły oddziaływania czynników głównych. Okres powtarzalności wahań cyklicznych przekracza 1 rok. Składnik sezonowy jest wynikiem występowania czynników sezonowych w każdym roku. Czynniki sezonowe mogą mieć różnorodny charakter. Większość z nich ma charakter kalendarzowy. Występowanie pór roku z charakterystycznym dla każdej z nich układem warunków atmosferycznych powoduje sezonowe zmiany produkcji (szczególnie rolniczej, budowlano-montażowej, transportowej), cen (produktów rolnych, usług budowlanych), zatrudnienia i bezrobocia (sezonowa obniżka bezrobocia w miesiącach letnich). Wymienione wyżej czynniki mogą w konsekwencji powodować sezonowe zmiany płac, dochodów osobistych i dochodów budżetowych. Obligatoryjne terminy ogłaszania sprawozdań przez spółki publiczne, bądź fundusze inwestycyjne mogą być przyczyną występowania sezonowych zmian przychodów, kosztów i zysków, na skutek realizowania przez te podmioty odpowiednich krótkookresowych strategii działania. Wszystko to powoduje, że możemy obserwować charakterystyczne dla danego podokresu (sezonu) w każdym roku odchylenia wartości szeregu czasowego od składowej systematycznej. Odchylenia te mogą mieć stałą, bądź zmienną amplitudę. Składnik zakłócający jest wynikiem występowania czynników niesystematycznych, odziaływujących na badaną zmienną ekonomiczną z różną siłą i w różnych kierunkach. Czynniki te nie są identyfikowane przez teorie ekonomiczne lub też są to czynniki, które w procesie testowania istotności są odrzucane jako statystycznie nieistotne. Szeregiem czasowym zmiennej ekonomicznej ty nazywać będziemy uporządkowany chronologicznie

zbiór wartości jakie zaobserwowano i jakie, jak zakładamy, są wynikiem istnienia pewnego mechanizmu (w szczególności losowego) generującego te obserwacje. Zmienną ty , której zmiany w czasie chcemy wyjaśnić

za pomocą równania modelu nazywać będziemy zmienną endogeniczną (wyjaśnianą, zależną). Mierzalne czynniki, które wykorzystujemy do objaśnienia zmian zmiennej endogenicznej nazywamy zmiennymi objaśniającymi (egzogenicznymi, niezależnymi). W tym miejscu warto zauważyć, że nie wszystkie składowe występują w każdym szeregu czasowym. Zmienne ekonomiczne występujące w modelu ekonometrycznym można podzielić na zasoby i strumienie. Zasób jest pojęciem bezczasowym. Oznacza posiadanie czegoś w określonej wielkości (np. zasób kapitału, zasób pracy). Zasoby mierzymy określając stan na pewien moment np. wartość kapitału na koniec roku, przeciętne zatrudnienie w roku. Strumienie mają wymiar czasowy. Oznaczają posiadanie (wyprodukowanie) czegoś w jednostce czasu (okresie). (np. dochód, produkcja, konsumpcja, obroty, inwestycje). Strumienie mierzymy podając jednostkę miary danej zmiennej oraz jednostkę czasu; np. dochód miesięczny, produkcja dzienna, inwestycje w roku. W ekonomii ważne są także zmienne (parametry) będące relacjami dwóch strumieni, zasobów, bądź strumieni do zasobów. Wymiary czasowe są konsekwencją ich definicji. Zarówno strumienie jak i zasoby mogą być rejestrowane (mierzone) z różną częstotliwością w czasie.

1 Punkt 2 opracowano na podstawie wykładu prof. UG dr. hab. Tadeusza W. Bołta.

Page 3: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

3

Przyjęło się wyróżniać dane w postaci:

1. szeregów czasowych rocznych (zagregowanych w czasie), 2. szeregów zdezagregowanych w czasie (kwartalnych, miesięcznych, dziennych, itp.), 3. prób przekrojowych pobranych z populacji obiektów w danym momencie (dane przekrojowe), 4. prób czasowo-przekrojowych (dane panelowe).

Postać analityczna modelu w ogólnym przypadku nie jest apriori dana. Zwykle wybór tej postaci jest wynikiem testowania. Jeśli teoria ekonomiczna nie określa postaci analitycznej, zwykle analiza empiryczna rozpoczyna się od postaci liniowej. 3. Klasyfikacja modeli ekonometrycznych

Kryteria klasyfikacji

A. zadania, którym w praktyce gospodarczej modele mają służyć: ♣ modele opisowe ♣ modele optymalizacyjne

B. występowanie składnika losowego: ♣ modele deterministyczne ♣ modele stochastyczne C. forma związku pomiędzy zmienną endogeniczną a zmiennymi objaśniającymi:

♣ modele liniowe ♣ modele nieliniowe - modele sprowadzalne do postaci liniowej - modele niesprowadzalne do postaci liniowej

D. struktura dynamiczna modeli: ♣ modele statyczne ♣ modele dynamiczne

- modele trendu - modele autoregresyjne - modele z rozłożonymi opóźnieniami - modele autoregresyjne z rozłożonymi

opóźnieniami E. zakres badawczy:

♣ modele mikroekonomiczne ♣ modele makroekonomiczne F. liczba rozpatrywanych równań modelu:

♣ modele jednorównaniowe ♣ modele wielorównaniowe - modele proste - modele rekurencyjne - modele o równaniach współzależnych

4. Etapy konstrukcji modelu ekonometrycznego

1) określenie celu badania 2) specyfikacja modelu – teoria ekonomiczna 3) zebranie danych statystycznych 4) opracowanie danych 5) wybór postaci analitycznej modelu teoretycznego 6) oszacowanie modelu 7) weryfikacja ekonomiczna 8) testowanie hipotez dotyczących modelu 9) ocena dobroci dopasowania 10) wybór modelu empirycznego 11) wykorzystanie modelu

5. Ogólny zapis liniowego modelu ekonometrycznego Zapis skalarny:

ttkkttt xxxy ...22110 t = 1,2,...,T

Page 4: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

4

Zapis macierzowy: ξXβY

TkkTkk

k

k

T XXX

XXX

XXX

Y

Y

Y

......

...1

............

...1

...1

...2

1

1

0

21

22221

11211

2

1

6. Klasyczna Metoda Najmniejszych Kwadratów (K)MNK

Metoda Najmniejszych Kwadratów polega na wyznaczeniu takich ocen k ˆ,...ˆ,ˆ10 parametrów

k ,..., 10 , aby dla danych T obserwacji dokonanych na zmiennych endogenicznych ty i zmiennych

egzogenicznych tx suma kwadratów odchyleń zaobserwowanych wartości zmiennej objaśnianej od jej

wartości teoretycznych wyznaczonych za pomocą funkcji regresji, tj. funkcja

T

ttt yyS

1

210 )ˆ(),( osiągała minimum.

Założenia numeryczne Klasycznej Metody Najmniejszych Kwadratów (KMNK):

( ) 1rz X k 1k T Założenia stochastyczne modelu Klasycznej Metody Najmniejszych Kwadratów (KMNK): ( ) 0tE wartość oczekiwana składnika losowego jest równa 0

2( )ttVar const wariancja składnika losowego jest stała w czasie

t ~ ),0( 2N składnik losowy ma rozkład normalny

( ) 0 i jE dla i j składniki losowe pochodzące z różnych okresów nie są skorelowane

0)( tit xE zmienne objaśniające są nielosowe

Estymator KMNK parametrów strukturalnych:

1ˆ ( ) T Tβ X X X Y 1 1( )

det T

T TT X X

X X DX X

7. Syntetyczne miary dopasowania modelu do danych empirycznych:

wariancja resztowa

)1(

ˆ

ˆ 1

2

2

KT

T

tt

odchylenie standardowe składnika resztowego

(średni błąd reszt):

)1(

ˆ

ˆ 1

2

KT

T

tt

wartości empiryczne zmiennej endogenicznej odchylają się od wartości

oszacowanych za pomocą modelu średnio o (+/-) wartość odchylenia

standardowego

współczynnik zmienności przypadkowej:

%100ˆ

y

V

średni błąd resztowy stanowi V*100% przeciętnego

poziomu zmiennej endogenicznej

Page 5: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

5

współczynnik determinacji:

T

tt

T

tt

yy

yyR

1

2

1

2

2

)(

)ˆ(

współczynnik ten informuje jaki % całkowitej zmienności

zmiennej endogenicznej został wyjaśniony przez model

współczynnik indeterminacji:

T

tt

T

ttt

yy

yy

1

2

1

2

2

)(

)ˆ(

współczynnik ten informuje jaki %

całkowitej zmienności zmiennej endogenicznej nie został wyjaśniony

przez model

2 2 1R

skorygowany współczynnik determinacji:

2 2 2

1

kR R

T k

współczynnik ten informuje jaki

% całkowitej zmienności zmiennej endogenicznej został

wyjaśniony przez model po uwzględnieniu korekty o liczbę

stopni swobody

skorygowany współczynnik indeterminacji:

2 21

1

T

T k

współczynnik ten informuje jaki % całkowitej zmienności zmiennej

endogenicznej nie został wyjaśniony przez model po uwzględnieniu korekty o

liczbę stopni swobody

2 2 1R

8. Testowanie hipotez dotyczących modelu W większości przypadków weryfikujemy następujące hipotezy:

– indywidualne i łączne hipotezy istotności parametrów strukturalnych, – normalności rozkładu składników losowych, – braku autokorelacji różnych rzędów, – stałości wariancji składników zakłócających.

W bardziej zaawansowanych zastosowaniach przedmiotem weryfikacji jest: – hipoteza o stałości parametrów strukturalnych, wykorzystująca wyniki rekurencyjnej estymacji

modelu, – hipotezy o prognostycznej stabilności modelu, – hipotezy o stałości warunkowej wariancji (ARCH), – hipotezy stacjonarności i inne.

Prawdopodobieństwo empiryczne p-value (p), podawane przez pakiety statystyczno-ekonometryczne oznacza prawdopodobieństwo przyjęcia przez statystykę wartości nie mniejszej (w przypadku statystyki t – nie mniejszej co do modułu) od wartości próbkowej, przy założeniu, że hipoteza zerowa jest prawdziwa. Innymi słowy: jest to najmniejszy poziom istotności, na jakim można odrzucić hipotezę zerową. Poziom istotności jest to prawdopodobieństwo popełnienia błędu I rodzaju.

Błąd pierwszego rodzaju polega na odrzuceniu prawdziwej hipotezy sprawdzanej 0H .

Zastosowanie prawdopodobieństwa empirycznego do wnioskowania: p → odrzucamy hipotezę zerową. p > → brak podstaw do odrzucenia hipotezy zerowej

Page 6: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

6

Test indywidualnej istotności parametrów strukturalnych:

0 i: 0

: 0A i

H

H

Statystyka ˆ

ˆ

ˆi

iit

Przy założeniu prawdziwości hipotezy zerowej, statystyka it ma rozkład t-Studenta z liczbą stopni

swobody równą .1 kT

1

2

kTi tt – nie ma podstaw do odrzucenia 0H . Parametr i statystycznie nieistotnie różni się od 0.

Zmienna objaśniająca tix nie wpływa istotnie na zmienną objaśnianą ty .

1

2

kTi tt – odrzucamy 0H . Parametr i statystycznie istotnie różni się od 0.

Zmienna objaśniająca tix istotnie wpływa na zmienną objaśnianą ty .

Test łącznej istotności parametrów strukturalnych:

0:

0...: 210

ii

A

k

H

H

Statystyka 2

*2

1T k RF

k

wartość krytyczna 1( )kT kF

Przy założeniu prawdziwości hipotezy zerowej, statystyka F ma rozkład Fishera-Snedecora z liczbą stopni swobody równą odpowiednio k oraz .1 kT

1( )kT kF F – nie ma podstaw do odrzucenia 0H .

Parametry k ,...,, 21 nieistotnie różnią się od zera.

1( )kT kF F – odrzucamy 0H .

Przynajmniej jeden z parametrów k ,...,, 21 istotnie różni się od zera. Weryfikacja hipotezy o normalności rozkładu składników losowych – test Jarque’a-Bery:

tH :0 ~ N

tAH : ~∕ N

Statystyka 2 21 2

1 1{ ( 3) }

6 24JB T b b

gdzie 31 (3/ 2)

2

mb

m – współczynnik skośności, 4

2 22

mb

m – współczynnik kurtozy,

1

1 ˆ ( 1,2,3, 4)T

ii t

t

m iT

– próbkowy moment centralny reszt z oszacowania KMNK.

Przy założeniu prawdziwości hipotezy zerowej, statystyka JB ma rozkład 2 z dwoma stopniami swobody.

2 (2)JB – nie ma podstaw do odrzucenia 0H .

Składniki losowe mają rozkład normalny.

2 (2)JB – odrzucamy 0H na rzecz AH .

Składniki losowe modelu nie mają rozkładu normalnego.

Page 7: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

7

Weryfikacja hipotezy o stałości wariancji składników losowych – test White’a

:

:2

220

constEH

constEH

tA

t

Test White’a jest oparty na pomocniczej regresji kwadratów reszt )ˆˆ( ttt yy (wersja testu stosowana w

Gretlu):

(*) ttkktkktttkkttkktt xxxxxxxx 1,,121122*2

1*1110

2 .........ˆ .

(w relacji pomocniczej występują wszystkie oryginalne zmienne modelu, ich kwadraty oraz wszystkie iloczyny par różnych zmiennych objaśniających, łącznie w relacji pomocniczej jest N zmiennych objaśniających).

Jeżeli prawdziwa jest hipoteza zerowa o stałości wariancji składników losowych, wówczas wszystkie parametry strukturalne w relacji pomocniczej (*), oprócz wyrazu wolnego, powinny być równe zero:

0 równe sąparametry wszystkienie :

0......... : ,112**

1210

A

kkkk

H

H

Statystyka White’a jest definiowana jako: 22 )( TRWhiteN , gdzie 2R jest współczynnikiem

determinacji z relacji pomocniczej (*).

Przy założeniu prawdziwości hipotezy zerowej, statystyka White’a ma rozkład 2 z N stopniami

swobody, gdzie N oznacza liczbę zmiennych objaśniających w relacji pomocniczej (*).

)()( 22 NN White – nie ma podstaw do odrzucenia 0H .

W modelu występuje stałość wariancji składników losowych (homoskedastyczność).

)()( 22 NN White – odrzucamy 0H .

W modelu występuje zmienność wariancji składników losowych (heteroskedastyczność). Weryfikacja hipotezy o poprawności postaci funkcyjnej modelu – test Ramsey’a RESET

(Regression Equation Specification Error Test)

Rozpatrzmy liniowy model zapisany jako ttKktt xxy ...110 , ),...,2,1( Tt .

Jeśli założenie o liniowej postaci analitycznej nie byłoby prawdziwe, składniki zakłócające modelu mogłyby wykazywać zależność od nieliniowych funkcji określających poziom zmiennej endogenicznej. W teście Ramsey’a sprawdzana jest statystyczna istotność potęgowych funkcji oczekiwanych wartości zmiennej endogenicznej. Rozpatrywana jest relacja pomocnicza postaci:

tp

tptttKKtt yEEyEyxxy )(....)()(... 33

22110 , ),...,2,1( Tt

której empirycznym odpowiednikiem jest

tp

tptttKKttt yyyxxxy ˆ...ˆˆ... 33

2222110 , ),...,2,1( Tt .

Testuje się łączną hipotezę istotności współczynników i :

0:

0...: 320

ii

A

p

H

H

.

Brak podstaw do odrzucenia 0H oznacza, że potęgowe funkcje oczekiwanych wartości nie

przyczyniają się istotnie do objaśnienia zmienności zmiennej endogenicznej ty . Liniowa zależność

zmiennej endogenicznej od wybranych przez badacza zmiennych objaśniających dostatecznie wyjaśnia

zmienność tej zmiennej. Odrzucenie 0H oznacza istotną zależność nieliniową pomiędzy składnikami

zakłócającymi a wartościami oczekiwanymi zmiennej endogenicznej

Page 8: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

8

Weryfikacja hipotezy o braku autokorelacji rzędu I składników losowych – test Durbina-Watsona

Założenia testu: w modelu występuje wyraz wolny; w modelu nie występuje zmienna endogeniczna opóźniona w czasie; zmienne objaśniające są nielosowe; składniki losowe pozostają w zależności autoregresyjnej pierwszego rzędu: ttt 11 , gdzie

t jest składnikiem czysto losowym, a 1 jest współczynnikiem autokorelacji I rzędu.

2

12

2

1

ˆ ˆ

ˆ

T

t tt

T

tt

DW

1ˆ2(1 )DW

0 :

0 :

1

10

AH

H dla (0, 2)DW

0 :

0 :

1

10

AH

H dla (2, 4)DW ' 4DW DW

lDW d – odrzucamy 0H na rzecz AH .

Występuje dodatnia autokorelacja składników losowych I rzędu.

l ud DW d – nie możemy podjąć decyzji –

obszar niekonkluzywności testu. uDW d – nie ma podstaw do odrzucenia 0H . W

modelu nie występuje dodatnia autokorelacja składników losowych I rzędu.

' lDW d – odrzucamy 0H na rzecz AH .

Występuje ujemna autokorelacja składników losowych I rzędu.

'l ud DW d – nie możemy podjąć decyzji –

obszar niekonkluzywności testu. ' uDW d – nie ma podstaw do odrzucenia

0H . W modelu nie występuje ujemna

autokorelacja składników losowych I rzędu.

Weryfikacja hipotezy o braku autokorelacji składników losowych dowolnego rzędu – test Breuscha-Godfrey’a

Test Breucha-Godfrey’a jest oparty na pomocniczej regresji reszt )ˆˆ( ttt yy :

tptptttkktt xx ˆ...ˆˆ...ˆ

2211110 .

Jeżeli prawdziwa jest hipoteza zerowa o braku autokorelacji składników losowych do rzędu p włącznie, wówczas wszystkie parametry strukturalne p ,...,, 21 w relacji pomocniczej powinny być równe zero:

0 :

0... : 210

ii

A

p

H

H

Statystyka testu Breuscha-Godfrey’a dla małej próby, T<30, ma postać statystyki LMF, natomiast dla dużej

próby jest definiowana jako: 22 TRp , gdzie 2R jest współczynnikiem determinacji z powyższej relacji

pomocniczej.

Przy założeniu prawdziwości hipotezy zerowej, statystyka testu Breuscha-Godfrey’a ma rozkład 2 z p stopniami swobody, gdzie p oznacza rząd testowanej autokorelacji składników losowych.

)(22 pp – nie ma podstaw do odrzucenia 0H .

W modelu nie występuje autokorelacja składników losowych do p rzędu włącznie.

)(22 pp – odrzucamy 0H .

W modelu występuje autokorelacja składników losowych do p rzędu włącznie.

Wnioskowanie w oparciu o statystykę LMF odbywa się analogicznie, tylko wartość krytyczna pochodzi z rozkładu F-Snedecora z liczbą stopni swobody (p, T-kp-1), gdzie kp oznacza liczbę zmiennych objaśniających w modelu relacji pomocniczej, a p – rząd badanej autokorelacji.

Page 9: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

9

Zadanie 1 Dane zawarte w tablicy 1:

Tablica 1: Kwartał Gdańsk Gdynia Kraków Łódź Poznań Szczecin Warszawa Wrocław III 2006 4 541 5 756 7 114 2 740 3 752 3 190 7 179 5 261 IV 2006 5 406 6 496 7 383 3 316 4 462 3 857 8 751 5 857 I 2007 6 115 7 211 8 369 4 130 6 104 4 735 9 316 6 747 II 2007 6 602 6 747 8 272 4 609 6 698 4 959 9 740 7 038 III 2007 6 740 7 188 8 255 4 721 6 387 5 094 10 078 7 194 IV 2007 6 824 6 917 8 140 4 686 6 472 5 297 9 952 7 266 I 2008 6 795 6 984 7 979 4 737 6 235 5 124 9 850 7 138 II 2008 6 704 6 854 7 934 4 668 6 097 5 180 9 783 7 159 III 2008 6 608 6 960 7 180 4 544 5 980 5 174 9 679 6 922 IV 2008 6 793 7 059 7 251 4 873 5 954 5 079 10 196 6 859 I 2009 6 648 7 104 6 864 4 730 5 979 4 965 9 626 6 785 II 2009 6 644 6 949 6 678 4 431 6 216 4 860 10 133 6 749 III 2009 6 449 6 901 6 564 4 643 5 970 4 964 9 705 6 842 IV 2009 6 350 6 991 6 734 4 400 5 924 4 834 9 671 6 758 I 2010 6 465 7 032 6 916 4 558 6 074 4 868 9 901 6 725 II 2010 6 491 6 901 6 937 4 407 6 122 4 844 9 982 6 678 III 2010 6 286 6 700 6 909 4 406 6 012 4 864 9 788 6 562 IV 2010 6 494 6 510 6 964 4 457 6 047 4 760 9 767 6 602 I 2011 6 536 6 522 7 206 4 469 5 940 4 759 9 706 6 576 II 2011 6 573 6 493 7 246 4 363 5 911 4 733 9 472 6 582 III 2011 6 472 6 430 6 949 4 238 5 804 4 707 9 397 6 541 IV 2011 6 242 6 463 6 989 3 990 5 737 4 704 9 363 6 397 I 2012 6 384 6 370 6 776 4 006 5 604 4 586 9 111 6 367 II 2012 6 310 6 475 6 724 4 033 5 535 4 431 9 035 6 307 III 2012 6 274 6 451 6 617 3 794 5 519 4 442 8 900 6 182 IV 2012 6 240 6 475 6 648 3 854 5 446 4 336 8 768 6 100 I 2013 6 278 6 608 6 644 3 975 5 406 4 434 8 606 5 959 II 2013 6 152 6 337 6 489 4 058 5 657 4 171 8 638 5 986 III 2013 6 007 6 618 6 585 4 018 5 628 4 152 8 544 5 984 IV 2013 6 136 6 629 6 537 3 978 5 718 4 247 8 627 6 098 I 2014 6 103 6 410 6 754 3 984 5 830 4 399 8 622 6 096 II 2014 6 073 6 492 6 682 3 915 5 742 4 315 8 691 5 899 III 2014 5 858 6 657 6 644 3 907 5 806 4 289 8 626 5 980 IV 2014 5 873 6 466 6 860 3 892 5 694 4 346 8 636 6 017 I 2015 5 982 6 324 7 030 3 923 5 848 4 353 8 608 5 901 II 2015 5 949 6 187 6 978 3 865 5 831 4 414 8 553 5 812 III 2015 5 993 6 312 6 948 3 872 5 409 4 214 8 565 5 930 IV 2015 6 133 6 402 6 795 3 850 5 730 4 235 8 655 5 914 I 2016 6 193 6 407 6 827 3 940 5 941 4 432 8 658 5 951 II 2016 6 319 6 795 6 756 4 009 6 040 4 356 8 721 5 984 III 2016 6 226 6 730 6 837 4 036 6 093 4 396 8 778 6 062 IV 2016 6 455 6 654 6 910 4 096 6 123 4 358 8 709 6 165 I 2017 6 566 6 822 6 859 4 149 5 955 4 461 8 816 6 253 II 2017 6 970 7 186 6 992 4 203 6 080 4 469 8 885 6 267 III 2016 7 035 7 204 7 205 4 241 6 053 4 672 9 009 6 293 IV 2016 7 345 7 383 7 593 4 314 6 349 4 654 9 235 6 365 I 2018 7 712 7 293 7 767 4 432 6 525 4 770 9 346 6 423 II 2018 8 570 8 037 8 006 4 642 6 652 4 941 9 347 6 485 III 2018 8 593 8 111 8 059 4 711 6 763 4 963 9 612 6 491 IV 2018 8 855 8 523 8 466 4 811 6 928 5 162 10 300 6 571

odnoszą się do średniej ofertowej ceny mieszkań na rynku wtórnym w ośmiu spośród największych miast w Polsce w okresie od III kwartału 2006 roku do IV kwartału 2018 roku (źródło: baza cen nieruchomości mieszkaniowych BaRN). Dla każdego z miast:

Page 10: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

10

1. Wyznacz indeksy jednopodstawowe cen mieszkań, przyjmując za podstawę porównań odpowiednio III kwartał 2006, I kwartał 2011 i IV kwartał 2018 roku.

2. Wyznacz indeksy łańcuchowe. 3. Wyznacz wartość średniego tempa zmian w całym analizowanym okresie. 4. O ile złotych średnio wzrosły/spadły ceny mieszkań w każdym z miast w ciągu analizowanych 50

kwartałów. Zinterpretuj wyniki otrzymane w punktach 1-4.

Dane do zadania 1 znajdują się w arkuszu „miasta”. Zadanie 2 Dane do zadania 2 znajdują się w arkuszu „1m2”:

Wykorzystując dane kwartalne dotyczące ceny 1 metra kwadratowego powierzchni użytkowej budynku mieszkalnego oddanego do użytkowania w okresie 1998Q4-2018Q4 (źródło: https://stat.gov.pl/obszary-tematyczne/przemysl-budownictwo-srodki-trwale/budownictwo/cena-1-m2-powierzchni-uzytkowej-budynku-mieszkalnego-oddanego-do-uzytkowania,8,1.html): 1. Wykonaj w Excelu wykres liniowy, pozwalający ocenić kształtowanie się zjawiska w analizowanym okresie. 2. Zaimportuj dane do programu Gretl. 3. Wyznacz w programie Gretl statystyki opisowe dotyczące analizowanego szeregu czasowego: średnią

arytmetyczną, odchylenie standardowe, współczynnik zmienności, medianę, rozstęp (różnicę pomiędzy maksymalną i minimalną ceną 1 metra kwadratowego), współczynniki skośności oraz kurtozy.

4. Zinterpretuj miary z punktu 3. 5. Dodaj w Gretlu zmienną czasową t, a następnie oszacuj liniowy model trendu postaci tt ty 10 ,

wybierając kolejno: a) pełen zakres próby – od IV kwartału 1998 roku do IV kwartału 2018 roku, b) obserwacje od III kwartału 2003 roku do III kwartału roku 2010, c) obserwacje od IV kwartału 2010 roku do IV kwartału roku 2018. Zinterpretuj parametry oszacowanych modeli trendu. Sprawdź, czy model z punktu 5c) spełnia założenia stochastyczne.

Źródło: opracowanie własne.

Page 11: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

11

Liniowy model trendu tt ty 10 :

a) dla całego okresu 1998Q4-2018Q4:

Model 1: Estymacja KMNK, wykorzystane obserwacje 1998:4-2018:4 (N = 81) Zmienna zależna (Y): m2 współczynnik błąd standardowy t-Studenta wartość p --------------------------------------------------------------- const 1935,76 78,6531 24,61 8,53e-039 *** time 32,4583 1,66644 19,48 6,76e-032 *** Średn.aryt.zm.zależnej 3266,556 Odch.stand.zm.zależnej 839,3845 Suma kwadratów reszt 9714408 Błąd standardowy reszt 350,6668 Wsp. determ. R-kwadrat 0,827653 Skorygowany R-kwadrat 0,825471 F(1, 79) 379,3768 Wartość p dla testu F 6,76e-32 Logarytm wiarygodności −588,5682 Kryt. inform. Akaike'a 1181,136 Kryt. bayes. Schwarza 1185,925 Kryt. Hannana-Quinna 1183,058 Autokorel.reszt - rho1 0,857311 Stat. Durbina-Watsona 0,298570

b) dla podokresu 2003Q3-2010Q3:

Model 2: Estymacja KMNK, wykorzystane obserwacje 2003:3-2010:3 (N = 29) Zmienna zależna: m2 współczynnik błąd standardowy t-Studenta wartość p --------------------------------------------------------------- const 275,616 228,007 1,209 0,2372 time 80,7365 6,51182 12,40 1,17e-012 *** Średn.aryt.zm.zależnej 3020,655 Odch.stand.zm.zależnej 745,3775 Suma kwadratów reszt 2324152 Błąd standardowy reszt 293,3934 Wsp. determ. R-kwadrat 0,850599 Skorygowany R-kwadrat 0,845065 F(1, 27) 153,7215 Wartość p dla testu F 1,17e-12 Logarytm wiarygodności -204,8770 Kryt. inform. Akaike'a 413,7540 Kryt. bayes. Schwarza 416,4886 Kryt. Hannana-Quinna 414,6104 Autokorel.reszt - rho1 0,834698 Stat. Durbina-Watsona 0,382253

c) dla podokresu 2010Q4-2018Q4:

Model 3: Estymacja KMNK, wykorzystane obserwacje 2010:4-2018:4 (N = 33) Zmienna zależna (Y): m2 współczynnik błąd standardowy t-Studenta wartość p --------------------------------------------------------------- const 3423,60 151,572 22,59 8,20e-021 *** time 9,49699 2,30725 4,116 0,0003 *** Średn.aryt.zm.zależnej 4040,909 Odch.stand.zm.zależnej 154,4762 Suma kwadratów reszt 493755,7 Błąd standardowy reszt 126,2046 Wsp. determ. R-kwadrat 0,353395 Skorygowany R-kwadrat 0,332537 F(1, 31) 16,94273 Wartość p dla testu F 0,000264 Logarytm wiarygodności −205,4442 Kryt. inform. Akaike'a 414,8885 Kryt. bayes. Schwarza 417,8815 Kryt. Hannana-Quinna 415,8955 Autokorel.reszt - rho1 −0,027794 Stat. Durbina-Watsona 2,035082 Sprawdzenie spełnienia założeń stochastycznych dla modelu z punktu 5c):

Page 12: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

12

(1) normalność rozkładu składników losowych: Test na normalność rozkładu reszt - Hipoteza zerowa: składnik losowy ma rozkład normalny Statystyka testu: Chi-kwadrat(2) = 7,50589 z wartością p = 0,0234486

(2) stałość wariancji składników losowych:

Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) - Hipoteza zerowa: heteroskedastyczność reszt nie występuje Statystyka testu: LM = 0,420794 z wartością p = P(Chi-kwadrat(2) > 0,420794) = 0,810263

(3) brak autokorelacji składników losowych: Test Breuscha-Godfreya na autokorelację do rzędu 4 Estymacja KMNK, wykorzystane obserwacje 2010:4-2018:4 (N = 33) Zmienna zależna (Y): uhat współczynnik błąd standardowy t-Studenta wartość p --------------------------------------------------------------- const 28,7658 161,102 0,1786 0,8596 time −0,480600 2,46123 −0,1953 0,8466 uhat_1 −0,0417569 0,190605 −0,2191 0,8282 uhat_2 −0,207057 0,200381 −1,033 0,3106 uhat_3 −0,0635332 0,205699 −0,3089 0,7598 uhat_4 −0,153884 0,205376 −0,7493 0,4602 Wsp. determ. R-kwadrat = 0,051221 Statystyka testu: LMF = 0,364410, z wartością p = P(F(4,27) > 0,36441) = 0,832 Statystyka testu: TR^2 = 1,690304, z wartością p = P(Chi-kwadrat(4) > 1,6903) = 0,792 Ljung-Box Q' = 1,40272, z wartością p = P(Chi-kwadrat(4) > 1,40272) = 0,844 Test Durbina-Watsona na autokorelację rzędu I: DW= 2,035082 Wartości krytyczne: dL=1,3834; dU=1,5078 Pomocnicze równanie regresji dla testu specyfikacji RESET Estymacja KMNK, wykorzystane obserwacje 2010:4-2018:4 (N = 33) Zmienna zależna (Y): m2 współczynnik błąd standardowy t-Studenta wartość p ------------------------------------------------------------------ const −24167,7 34330,3 −0,7040 0,4869 time −177,116 232,201 −0,7628 0,4516 yhat^2 0,00243134 0,00302515 0,8037 0,4279 Statystyka testu: F = 0,645949, z wartością p = P(F(1,30) > 0,645949) = 0,428

Page 13: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

13

Zadanie 3 W tablicy 2 zgromadzono dane dotyczące oferty nowych mieszkań wybudowanych na osiedlu Królewskie Wzgórze przy ul. Myśliwskiej w Gdańsku-Morenie przez developera ALLCON S.A. Oferty te zostały zamieszczone na stronie internetowej dewelopera (www.allcon.pl) z 8 lutego 2011 roku.

Tablica 2:

L.p. ilość pokoi

(x1) powierzchnia

(x2) parter (d1)

I piętro (d2)

II piętro (d3)

III piętro (d4)

cena (zł) (y)

1 1 35,4 1 0 0 0 217 041

2 2 45,3 1 0 0 0 261 170

3 2 46,9 1 0 0 0 287 735

4 2 47,3 0 0 1 0 287 727

5 2 47,31 0 1 0 0 275 013

6 2 47,5 0 1 0 0 288 915

7 2 47,9 0 0 1 0 283 531

8 2 48 0 0 1 0 284 109

9 2 48,1 0 1 0 0 284 687

10 2 48,1 0 1 0 0 284 687

11 2 48,2 1 0 0 0 277 456

12 2 48,3 1 0 0 0 278 018

13 2 49,2 0 1 0 0 304 327

14 2 56 0 1 0 0 300 093

15 2 + antresola 60,96 0 0 0 1 341 216

16 2 + antresola 61,07 0 0 0 1 356 330

17 2 + antresola 61,8 0 0 0 1 360 508

18 2 + antresola 62,5 0 0 0 1 367 890

19 3 64,2 0 0 1 0 363 845

20 3 64,4 0 1 0 0 364 958

21 3 64,6 1 0 0 0 355 605

22 3 69,1 0 0 1 0 379 905

23 3 69,2 0 1 0 0 380 445

24 3 73 0 0 1 0 420 675

25 3 73,1 0 1 0 0 421 242

26 3 73,7 0 1 0 0 408 725

27 3 74,1 1 0 0 0 390 899

28 3 74,1 0 0 1 0 410 906

29 3 74,3 0 1 0 0 411 997

30 3 74,4 1 0 0 0 392 455

31 3 75,4 0 1 0 0 410 625 Źródło: www.allcon.pl z 8 lutego 2011 r. Na podstawie wszystkich obserwacji 31,...,2,1( i ) oszacuj następujące modele:

(3.1) iiii dxy 1210 , (3.2) iiii dxy 1210ln

(3.3) iiii dxy 4210ln

gdzie: iy oznacza cenę i-tego mieszkania, ix1 - liczbę pokoi w i-tym mieszkaniu, ix2 - powierzchnię i-tego

mieszkania, zmienne id to zmienne zerojedynkowe oznaczające kondygnację.

Czy któryś z powyższych modeli spełnia wszystkie założenia stochastyczne? Dane do zadania 3 znajdują się w arkuszu „Morena”.

Page 14: Ekonometria czÄ Å Ä 2wzr.pl/sabina_nowak/upload/files/Ekonometria część 2.pdf · 7hvw lqg\zlgxdoqhm lvwrwqr fl sdudphwuyz vwuxnwxudoq\fk l $ l e e z 6wdw\vw\nd Ö Ö Ö l l

14

Model 3.1: Model 1: Estymacja KMNK, wykorzystane obserwacje 1-31 Zmienna zależna: cena:

współczynnik błąd standardowy t-Studenta wartość p ------------------------------------------------------------------- const 61718,7 8795,34 7,017 1,24e-07 *** powierzchnia 4707,52 141,561 33,25 4,74e-024 *** d1 -11437,2 3784,97 -3,022 0,0053 *** Średn.aryt.zm.zależnej 337185,0 Odch.stand.zm.zależnej 58005,10 Suma kwadratów reszt 2,26e+09 Błąd standardowy reszt 8981,610 Wsp. determ. R-kwadrat 0,977622 Skorygowany R-kwadrat 0,976024 F(2, 28) 611,6267 Wartość p dla testu F 7,90e-24 Logarytm wiarygodności -324,6004 Kryt. inform. Akaike'a 655,2009 Kryt. bayes. Schwarza 659,5028 Kryt. Hannana-Quinna 656,6032 Model 3.2: Model 2: Estymacja KMNK, wykorzystane obserwacje 1-31 Zmienna zależna: l_cena:

współczynnik błąd standardowy t-Studenta wartość p ------------------------------------------------------------------- const 11,8821 0,0288773 411,5 1,71e-054 *** powierzchnia 0,0142479 0,000464781 30,66 4,37e-023 *** d1 -0,0435673 0,0124270 -3,506 0,0016 *** Średn.aryt.zm.zależnej 12,71352 Odch.stand.zm.zależnej 0,177164 Suma kwadratów reszt 0,024349 Błąd standardowy reszt 0,029489 Wsp. determ. R-kwadrat 0,974142 Skorygowany R-kwadrat 0,972295 F(2, 28) 527,4131 Wartość p dla testu F 5,98e-23 Logarytm wiarygodności 66,82658 Kryt. inform. Akaike'a -127,6532 Kryt. bayes. Schwarza -123,3512 Kryt. Hannana-Quinna -126,2508 Model 3.3: Model 4: Estymacja KMNK, wykorzystane obserwacje 1-31 Zmienna zależna: l_cena:

współczynnik błąd standardowy t-Studenta wartość p ------------------------------------------------------------------- const 11,8493 0,0300595 394,2 5,67e-054 *** powierzchnia 0,0145253 0,000500197 29,04 1,90e-022 *** d4 0,0398709 0,0174564 2,284 0,0302 ** Średn.aryt.zm.zależnej 12,71352 Odch.stand.zm.zależnej 0,177164 Suma kwadratów reszt 0,029534 Błąd standardowy reszt 0,032478 Wsp. determ. R-kwadrat 0,968635 Skorygowany R-kwadrat 0,966394 F(2, 28) 432,3515 Wartość p dla testu F 8,92e-22 Logarytm wiarygodności 63,83390 Kryt. inform. Akaike'a -121,6678 Kryt. bayes. Schwarza -117,3658 Kryt. Hannana-Quinna -120,2655 Sprawdzenie założeń stochastycznych dla modelu 3.2: Test na normalność rozkładu reszt - Hipoteza zerowa: składnik losowy ma rozkład normalny Statystyka testu: Chi-kwadrat(2) = 1,23956 z wartością p = 0,538064

Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) - Hipoteza zerowa: heteroskedastyczność reszt nie występuje Statystyka testu: LM = 3,50419 z wartością p = P(Chi-Square(4) > 3,50419) = 0,477241

Test RESET na specyfikację (kwadrat i sześcian zmiennej) Statystyka testu: F = 2,397751, z wartością p = P(F(2,26) > 2,39775) = 0,111