Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

85
Wybrane zagadnienia ekonometrii z wykorzystaniem programu Statistica Marcin Kurpas UPGOW – Uniwersytet Partnerem Gospodarki Opartej na Wiedzy Uniwersytet Śląski w Katowicach, ul. Bankowa 12, 40-007 Katowice, http://www.us.edu.pl Publikacja jest wspólfinansowana z Unii Europejskiej w ramach Europejskiego Funduszu Spolecznego. Skrypt jest dystrybuowany bezplatnie.

Transcript of Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Page 1: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Wybrane zagadnienia ekonometrii z wykorzystaniemprogramu Statistica

Marcin Kurpas

UPGOW – Uniwersytet Partnerem Gospodarki Opartej na Wiedzy Uniwersytet Śląski wKatowicach, ul. Bankowa 12, 40-007 Katowice, http://www.us.edu.pl

Publikacja jest współfinansowana z Unii Europejskiej w ramach Europejskiego FunduszuSpołecznego.

Skrypt jest dystrybuowany bezpłatnie.

Page 2: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2

Page 3: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Spis treści

1 Wstęp 51.1 Czym jest ekonometria? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Podstawowe pojęcia ekonometrii . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2.1 Zmienne modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.2 Parametry strukturalne . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.3 Dane statystyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3 Etapy badań ekonometrycznych . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Klasyczna metoda najmniejszych kwadratów 112.1 Jednorównaniowy liniowy model ekonometryczny z jedną zmienną obja-

śniającą . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Wyznaczenie parametrów modelu liniowego z jedną zmienną objaśniającą

metodą najmniejszych kwadratów . . . . . . . . . . . . . . . . . . . . . . . 132.3 Uogólnienie na model wielowymiarowy . . . . . . . . . . . . . . . . . . . . 152.4 Klasyczna metoda najmniejszych kwadratów - założenia . . . . . . . . . . 172.5 Twierdzenie Gaussa-Markowa . . . . . . . . . . . . . . . . . . . . . . . . . 182.6 Ocena stopnia dopasowania modelu ekonometrycznego do danych empi-

rycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.7 Zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.8 KMNK w Statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.8.1 Wykres rozrzutu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.8.2 Szacowanie parametrów modelu . . . . . . . . . . . . . . . . . . . . 262.8.3 Statystyczna istotność modelu . . . . . . . . . . . . . . . . . . . . . 28

3 Weryfikacja założeń KMNK 313.1 Wartość średnia reszt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.2 Badanie losowości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.3 Badanie normalności rozkładu składnika losowego . . . . . . . . . . . . . . 333.4 Badanie autokorelacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.5 Badanie homoskedastyczności . . . . . . . . . . . . . . . . . . . . . . . . . 373.6 Zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4 Metody doboru zmiennych objaśniających do modelu 414.0.1 Wykresy rozrzutu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.0.2 Korelacie Pearsona . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.0.3 Eliminacja zmiennych kwazistałych . . . . . . . . . . . . . . . . . . 44

3

Page 4: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

4 SPIS TREŚCI

4.0.4 Regresja krokowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.0.5 Metoda Hellwiga . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.1 Zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5 Szacowanie parametrów modeli w przypadku autokorelacji i heteroske-dastyczności 49

5.0.1 Ważona metoda najmniejszych kwadratów . . . . . . . . . . . . . . 505.0.2 Metoda Cochrane’a-Orcutta . . . . . . . . . . . . . . . . . . . . . . 51

6 Prognozowanie na podstawie modelu ekonometrycznego 53

7 Nieliniowe modele ekonometryczne 577.1 Linearyzowalne modele ekonometryczne . . . . . . . . . . . . . . . . . . . . 57

8 Funkcja produkcji 618.1 Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

8.1.1 Zastosowanie funkcji produkcji . . . . . . . . . . . . . . . . . . . . . 618.2 Funkcja produkcji Cobba-Douglasa . . . . . . . . . . . . . . . . . . . . . . 63

8.2.1 Linearyzacja funkcji Cobba-Douglasa . . . . . . . . . . . . . . . . . 63

9 Ekonometryczna analiza rynku i popytu konsumpcyjnego 659.1 Podstawowe pojęcia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

9.1.1 Ekonometryczne modele popytu dochodowego . . . . . . . . . . . . 67

10 Dodatek 69

Page 5: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 1

Wstęp

1.1 Czym jest ekonometria?

Pierwszym pytaniem, jakie należy sobie zadać rozpoczynając przygodę z ekonometrią jest”czym zajmuje się ekonometria?”. Odpowiedź, w dość ogólnej postaci, jest następująca:ekonometria to nauka, która zajmuje się badaniem związków przyczynowo–skutkowychmiędzy zjawiskami ekonomicznymi i społecznymi oraz ilościowym opisem tych relacji. Ce-lem badań ekonometrycznych jest również konfrontacja teorii ekonomicznych z praktyką,a także prognozowanie, na podstawie pewnych przesłanek, o rozwoju zjawisk ekonomicz-nych. Powyższe sformułowanie, jak już napisaliśmy, jest dość ogólne, ponieważ metodyekonometrii znajdują zastosowanie także w badaniu zjawisk przyrodniczych, technicznych,socjalnych, medycynie lub w naukach o sporcie. Pojęcie ekonometria zostało sformułowane(tak się przynajmniej uważa) przez norweskiego uczonego Ragnara Frischa, współzałoży-ciela Towarzystwa ekonometrycznego, pierwszego edytora czasopisma Econometrica. W1969 roku Frisch (wraz z Janem Tinbergenem) został uhonorowany pierwszą NagrodąNobla w w dziedzinie ekonomii.

1.2 Podstawowe pojęcia ekonometrii

Czym jest model ekonometryczny?

Podstawowym pojęciem ekonometrii (również narzędziem ekonometryka) jest model eko-nometryczny. Model ekonometryczny jest uproszczoną wersją rzeczywistości, ponieważzjawiska ekonomiczne są na ogół bardzo złożone. Jest to układ równań stochastycznych(w najprostszym przypadku jedno równanie), który z pewną dokładnością opisuje rze-czywiste zależności pomiędzy rozpatrywanymi zjawiskami ekonomicznymi. Pierwszym,który zwrócił uwagę na probabilistyczną istotę modelu ekonometrycznego był równieżNorweg, i również laureat Nagrody Nobla w dziedzinie ekonomii Tryvge Haavelmo. Wgniego, modele deterministyczne nie są konsystentne z obserwacjami ekonomicznymi, dla-tego niewłaściwe jest stosowanie modeli deterministycznych do niedeterministycznych da-nych. Składnikami modelu ekonometrycznego są zmienne oraz *parametry strukturalne*.Dodatkowym składnikiem jest czynnik losowy, którego obecność wynika z przybliżonegocharakteru (niedokładności) badanej zależności.

5

Page 6: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

6 ROZDZIAŁ 1. WSTĘP

1.2.1 Zmienne modelu

Zmienne modelu możemy podzielić na dwie grupy: zmienne objaśniane - których zmien-ność (zachowanie) będziemy chcieli wyjaśnić za pomocą modelu, oraz zmienne objaśniają-ce czyli takie, które wpływają na zachowanie się zmiennej objaśnianej - objaśniają zmien-ność zmiennej objaśnianej. Czasem zdarza się (np. w modelach wielorównaniowych), żezmienne objaśniane pełnią rolę również zmiennych objaśniających. Wtedy taki podziałnie jest do końca jednoznaczny. Dlatego wprowadzono podział na zmienne endogeniczne- wszystkie zmienne objaśniane modelu, które mogą występować również jako zmienneobjaśniające (w tym samym modelu) oraz zmienne egzogeniczne - zmienne, które w da-nym modelu pełnią wyłącznie rolę zmiennych objaśniających. Zakres niniejszego skryptuogranicza się jedynie do prostych modeli, w których zmienne objaśniane nie będą pełniłyroli zmiennych objaśniających. Będziemy zatem używali podziału na zmienne objaśnianei objaśniające.

Innym podziałem zmiennych, o którym warto wspomnieć, jest podział na zmienne ilo-ściowe i zmienne jakościowe. Zmienne ilościowe przyjmują wartości liczbowe (są mierzalne)np. liczba sprzedanych samochodów, liczba urodzeń, dochód na członka rodziny. Zmiennejakościowe przyjmują wartości słowne i dotyczą takich cech jak np. płeć, wykształcenie.Takie zmienne powodują pewne utrudnienia w procesie mierzenia relacji ekonomicznych,istnieją jednak metody zastąpienia ich zmiennymi ilościowymi np. poprzez wprowadzeniezmiennych zero-jedynkowych.

1.2.2 Parametry strukturalne

Wnioskowanie na podstawie modelu ekonometrycznego o zależnościach ekonomicznychmoże mieć miejsce dopiero po oszacowaniu parametrów strukturalnych modelu. Parametrystrukturalne to współczynniki, które wiążą ze sobą zmienne objaśniane i objaśniające. Dlaprostych liniowych modeli ekonometrycznych, będą one współczynnikami proporcjonalno-ści pomiędzy zmiennymi objaśniającymi a objaśnianą (np. podobnie jak opór elektrycznyjest współczynnikiem proporcjonalności pomiędzy napięciem przyłożonym do obwodu, aprądem płynącym w tym obwodzie). Wartości parametrów strukturalnych dla danegozjawiska ekonomicznego na ogół nie są znane i wymagają wyznaczenia na podstawie da-nych obserwacyjnych. Dlatego też, w modelu ekonometrycznym (wyznaczanym w procesiemodelowania) występują estymatory parametrów strukturalnych, a nie same parametry.Chcielibyśmy, aby wartości estymatorów parametrów strukturalnych były jak najbliższeparametrom strukturalnym tzn. aby model teoretyczny w jak największym stopniu od-zwierciedlał prawdziwe zależności ekonomiczne. Jak zobaczymy nie jest to zadanie prosteze względu na złożoność zjawisk, które chcemy opisywać.

Trzecim składnikiem modelu jest element losowy. Obecność składnika losowego świad-czy o stochastycznym charakterze modelu. Czynnik losowy odzwierciedla wpływ drugo-rzędnych, jawnie niewyróżnionych czynników, niedoskonałość danych statystycznych, atakże nieprzewidywalne zachowanie podmiotów ekonomicznych.

Model ekonometryczny, nie precyzując jego postaci matematycznej, możemy zapisaćjako związek funkcyjny pomiędzy zmiennymi

Yk = fk(Xk, ξk), (1.1)

Page 7: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

1.2. PODSTAWOWE POJĘCIA EKONOMETRII 7

gdzie Yk jest k-tą obserwacją zmiennej objaśnianej, Xk jest wektorem obserwacji zmien-nych objaśniających, ξk jest elementem losowym. Indeks k = 1, 2 . . . n numeruje równaniaw modelu, a liczba n to ilość obserwacji danej wielkości.

Modele ekonometryczne można sklasyfikować ze względu na różne cechy. Poniżej wy-piszemy najczęściej spotykane podziały:

• ze względu na postać analityczną modelu: modele liniowe, nieliniowe (sprowadzalnedo liniowych, niesprowadzalne do liniowych),

• ze względu na ilość równań modelu: jednorównaniowe, wielorównaniowe,

• ze względu na rolę czynnika czasu: modele statyczne (niezależne od czasu), modeledynamiczne (zależne od czasu np. modele trendu).

Powyższy podział nie jest tylko zabiegiem formalnym, lecz ma swoje podstawy staty-styczne: od typu i postaci modelu zależą metody szacowania jego parametrów.

1.2.3 Dane statystyczne

Podstawową wiedzę o zjawiskach ekonomicznym uzyskuje się na podstawie zebranych da-nych statystycznych. Dane statystyczne to wyniki powtarzanych pomiarów danej cechynp. zarobków, wykształcenia itp.. Pomiaru danej cechy dokonuje się zwykle na pewnympodzbiorze populacji zwanym próbą. Populacja to zbiorowość obiektów (osób, przedmio-tów, faktów) podobnych pod względem pewnych cech. Przykładowo, chcemy zbadać średniwzrost Polaków. Zatem populacją będą wszyscy obywatele Polski. Łatwo sobie wyobrazić,że dokonanie pomiaru ok 40 milionów ludzi byłoby bardzo czasochłonne i statystycznienieuzasadnione. Dlatego wybiera się losowo próbę statystyczną - pewien podzbiór popu-lacji np. 1000 osób z różnych regionów kraju i na tym podzbiorze dokonuje się pomiaruoraz analizy statystycznej. Jeśli próba losowa jest dostatecznie liczna, to jest próbą re-prezentatywną i wyniki badań można uogólnić na całą populację, tzn. z dużym prawdo-podobieństwem można sądzić że rozkład danej cechy w populacji (w naszym przykładziewzrostu Polaków) jest taki sam jak w wybranej próbie.

Dane statystyczne również możemy podzielić na rodzaje: dane mogą dotyczyć zmien-ności danej cechy w zależności od chwili czasu, w którym ją mierzymy - takie dane nosząnazwę szeregów czasowych (np. kursy walut lub indeksy giełdowe); zmienności danej cechyw ustalonym czasie, ale w odniesieniu do różnych obiektów - dane przekrojowe (np. średnidochód gospodarstwa domowego w województwie Małopolskim). Dane stanowiące połą-czenie dwóch poprzednich rodzajów danych noszą nazwę danych panelowych i składają sięz danych dla wielu obiektów, z których każdy jest obserwowany w kilku okresach czasu.

Dysponując surowymi danymi trudno jest wyciągnąć wnioski o zależności pomiędzybadanymi zjawiskami ekonomicznymi. Dopiero przetworzenie tych danych z zastosowa-niem narzędzi ekonometrycznych np. zbudowanie na ich podstawie modelu ekonometrycz-nego pozwala na określenie ilościowych związków przyczynowo-skutkowych dla danegozjawiska.

Page 8: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

8 ROZDZIAŁ 1. WSTĘP

Tabela 1.1: Przykład danych przekrojowych: liczba mieszkańców Polski w 2010 roku wdanym województwie. Źródło: GUS.

Województwo liczba mieszkańcówDolnośląskie 2877840

Kujawsko-pomorskie 2069543Lubelskie 2151895Lubuskie 1011024Łódzkie 2534357

Małopolskie 3310094Mazowieckie 5242911

Opolskie 1028585Podkarpackie 2103505

Podlaskie 1188329Pomorskie 2240319

Śląskie 4635882Świętokrzyskie 1266014

Warmińsko-mazurskie 1427241Wielkopolskie 3419426

Zachodniopomorskie 1693072

Tabela 1.2: Przykład szeregu czasowego: cena dolara amerykańskiego zarejestrowana wciągu kilku dni. Źródło: FOREX.

Data Cena w PLN za jednostkę22.01.2014 3.060823.01.2014 3.04822.01.2014 3.068221.01.2014 3.066020.01.2014 3.062019.01.2014 3.0730

Page 9: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

1.3. ETAPY BADAŃ EKONOMETRYCZNYCH 9

1.3 Etapy badań ekonometrycznych

Badanie procesów ekonomicznych odbywa się wieloetapowo i wymaga zarówno wiedzystatystycznej, jak i merytorycznej dotyczącej danego problemu. Pierwszym etapem badańjest zapoznanie się ze zjawiskiem ekonomicznym, którego analizę chcemy wykonać. Wie-dza na temat praw rządzących danym zjawiskiem jest niezbędna na późniejszych etapachi jej brak może doprowadzić do błędnych decyzji (np. źle dobrane zmienne objaśniającelub analityczna postać modelu) lub do błędnych wniosków. Kolejnym etapem jest do-bór zmiennych objaśniających do modelu. Jest to zadanie wymagające szczególnej uwagi.Może się bowiem zdarzyć, że źle dobrane zmienne nie będą w wystarczającym stopniuwyjaśniały kształtowania się zmiennej objaśnianej lub, co gorsza, ekonometryk podejmiedecyzję o zmianie postaci analitycznej modelu, który dla dobrze dobranych zmiennychobjaśniających dawałby poprawne wyniki. Dobór zmiennych do modelu można podzie-lić na dwa etapy: wybór potencjalnych zmiennych objaśniających bazujących na wiedzymerytorycznej, a następnie jego weryfikacja za pomocą narzędzi statystycznych.

Następnym krokiem jest wybór postaci analitycznej modelu. To zadanie również na-leży do niełatwych, ponieważ dużą rolę odgrywa w nim znajomość teorii ekonometrii,modelowanego zjawiska oraz doświadczenie. Po dokonaniu wyboru zmiennych objaśnia-jących i postaci modelu przystępuje się do estymacji parametrów strukturalnych modelu.W tym celu stosuje się rożne metody np. metodę najmniejszych kwadratów lub metodęnajwiększej wiarygodności, które są zaimplementowane w wielu pakietach statystycznych,zarówno komercyjnych (np. Statistica, STATA, SAS), jak i bezpłatnych (np. R, Gretl).Wybór metody szacowania parametrów strukturalnych nie może być przypadkowy, ponie-waż zależy od postaci analitycznej modelu oraz cech charakteryzujących dane statystycz-nych. Jest to ściśle związane z własnościami estymatorów uzyskanych konkretną metodąestymacji.

Page 10: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

10 ROZDZIAŁ 1. WSTĘP

Page 11: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 2

Klasyczna metoda najmniejszychkwadratów

Uwagi wstępne

W poprzednim rozdziale podaliśmy ogólną postać modelu ekonometrycznego, jako związ-ku pomiędzy zmiennymi objaśnianymi i objaśniającymi. W następnych będziemy zajmo-wali się jedną postacią modelu ekonometrycznego, która jest bardzo powszechnie stoso-wana, mianowicie modelem liniowym. Do estymacji parametrów strukturalnych modelubędziemy stosować klasyczną metodę najmniejszych kwadratów (KMNK). Jak zobaczy-my, wybór tej metody jest nieprzypadkowy.

2.1 Jednorównaniowy liniowy model ekonometrycz-ny z jedną zmienną objaśniającą

Jest to najprostsza wersja modelu liniowego i chociaż najczęściej nie wystarcza do popraw-nego opisu zjawisk ekonomicznych, jego zaletą jest prostota zrozumienia i interpretacji.

Jednorównaniowy model liniowy z jedną zmienną objaśniającą możemy zapisać wnastępującej postaci:

yi = β0 + β1xi + εi, i = 1, 2, . . . , n, (2.1)

gdzie βi są nieznanymi parametrami strukturalnymi modelu, yi- i-tą obserwacją zmiennejobjaśnianej, xi- i-tą obserwacją zmiennej objaśniającej, a εi zmienną losową. Zmienne yioraz xi są nam znane (ich wartości zostały zebrane np. w wyniku przeprowadzenia badaniaankietowego).

Wartości parametrów strukturalnych βk nie są znane, więc zadaniem ekonometrykajest wyznaczenie takich wartości estymatorów parametrów strukturalnych, które będąnajbliższe tym parametrom. Konstruuje się więc model teoretyczny, w którym parametrystrukturalne β zastępuje się ich estymatorami b:

yi = b0 + b1xi, i = 1, 2, . . . , n, (2.2)

przy czym przez yi oznaczyliśmy wartość teoretyczną zmiennej objaśnianej (wyznaczonąz modelu), a bk estymatory parametrów strukturalnych βk.

11

Page 12: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

12 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Rysunek 2.1: Schematyczne przedstawienie idei modelu ekonometrycznego. Punkty ozna-czają dane eksperymentalne, linia oznacza model teoretyczny wyznaczony na podstawiedanych eksperymentalnych. Różnice pomiędzy wartościami teoretycznymi i obserwowa-nymi to reszty ei. Dane umowne.

Uwaga

Oznaczenia yi będziemy używali w celu podkreślenia, że wartość ta jest wartością teore-tyczną, wyznaczoną z oszacowanego już modelu. Wartość empiryczną zmiennej objaśnia-nej oznaczamy yi.

Ponieważ model teoretyczny z reguły nie tłumaczy w stu procentach rozpatrywanegozjawiska ekonomicznego (np. ze względu na złą jakość danych, zbyt małą próbę lub złąpostać funkcyjną modelu), wartości teoretyczne zmiennej objaśnianej wyznaczone z mo-delu mogą różnić się od wartości empirycznych. Ich różnice nazywa się resztami modelu:

ei = yi − yi, i = 1, 2, . . . , n. (2.3)

Widać, że reszty będą w pewien sposób odzwierciedlały dopasowanie modelu teoretycz-nego do danych empirycznych.

Wprowadźmy wielkość, która będzie opisywała dopasowanie modelu do danych empi-rycznych. Zdefiniujmy ją jako sumę wszystkich reszt:

η =n∑i=1

ei, (2.4)

gdzie n jest wielkością próby (liczbą obserwacji danej cechy). Na pierwszy rzut oka wydajesię, że przypadek η = 0 oznaczać będzie idealnie dopasowany model. Niestety, jest tobardzo zła miara dopasowania, ponieważ w metodzia najmniejszych kwadratów suma

reszt jest zawsze równa zerun∑i=1

ei = 0. Reszty dodatnie (powyżej prostej na rysunku 2.1)

są przeciwne do reszt ujemnych (poniżej prostej na rysunku 2.1) i wzajemnie się znoszą.

Page 13: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.2. WYZNACZENIE PARAMETRÓWMODELU LINIOWEGO Z JEDNĄ ZMIENNĄOBJAŚNIAJĄCĄMETODĄNAJMNIEJSZYCHKWADRATÓW13

Lepszą miarą dopasowania jest suma modułów reszt

η1 =n∑i=1

|ei|. (2.5)

W tym przypadku dodatnie i ujemne reszty nie znoszą się i im większe są reszty ei,tym większa jest wartość η1. Niestety ta funkcja nie jest ”ładną” funkcją matematyczną,ponieważ nie jest wszędzie różniczkowalna, co powoduje pewne trudności w szukaniu jejminimum. Dlatego jako miary dopasowania używa się sumy kwadratów reszt

χ =n∑i=1

e2i . (2.6)

W następnym rozdziale pokażemy, że stosując miarę dopasowania (2.6), jesteśmy wstanie wyznaczyć jednoznacznie takie wartości estymatorów parametrów strukturalnychb0 i b1, dla których χ osiąga minimum.

2.2 Wyznaczenie parametrów modelu liniowego z jed-ną zmienną objaśniającą metodą najmniejszychkwadratów

Najczęściej stosowaną metodą wyznaczenia ocen bk w parametrycznych modelach linio-wych jest metoda najmniejszych kwadratów. Polega ona na wyznaczeniu takich oszacowańb0 i b1, dla których suma kwadratów reszt (2.6) jest najmniejsza

χ =n∑i=1

e2i → min. (2.7)

Z równania 2.3 wynika, że przy danych wielkościach xi i yi reszty są funkcjami ocenparametrów strukturalnych:

χ(b0, b1) =n∑i=1

e2i =n∑i=1

(yi − yi)2 =n∑i=1

(yi − b0 − b1xi)2 . (2.8)

Chcemy zatem zminimalizować χ(b0, b1) ze względu na parametry b0 i b1.Warunkiem koniecznym, aby funkcja miała minimum w punkcie, jest znikanie jej pierw-szych pochodnych cząstkowych w tym punkcie:

∂χ(b0, b1)∂b0

= 0, (2.9)

∂χ(b0, b1)∂b1

= 0. (2.10)

Zatem,

∂χ(b0, b1)∂b0

=∂ (∑ni=1(yi − b0 − b1xi)2)

∂b0=∂∑ni=1 [(yi − b1xi)− b0]2

∂b0

=n∑i=1

(2b0 − 2(yi − b1xi)) = −2n∑i=1

(yi − b0 − b1xi) = 0 (2.11)

Page 14: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

14 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

∂χ(b0, b1)∂b1

=∂∑ni=1 [(yi − b0)− b1xi]2

∂b1=

n∑i=1

(−2xi(yi − b0) + 2b1x2i

)= −2

n∑i=1

(xiyi − xib0 − b1x2i

)= −2

n∑i=1

xi (yi − b0 − b1xi) = 0. (2.12)

Ponieważ obydwa warunki muszą być spełnione jednocześnie, otrzymujemy układ rów-nań:

−2n∑i=1

(yi − b0 − b1xi) = 0,

−2n∑i=1

xi (yi − b0 − b1xi) = 0.(2.13)

Wchodząc ze znakiem sumy pod nawiasy i dzieląc obydwa równania przez (-2) otrzymu-jemy:

n∑i=1

yi −n∑i=1

b1xi − nb0 = 0,n∑i=1

xiyi − b0n∑i=1

xi − b1n∑i=1

x2i = 0,(2.14)

gdzien∑i=1

b0 = b0n∑i=1

1 = b0n.

Jeśli pierwsze równanie w (2.14) podzielimy przez n i dokonamy podstawienia

1n

n∑i=1

yi = y,1n

n∑i=1

xi = x (2.15)

gdzie x oznaczana średnią arytmetyczną z xi, to otrzymamy:

1n

n∑i=1

yi − b11n

n∑i=1

xi − b0 = y − b1x− b0 = 0. (2.16)

Z tego równania możemy wyliczyć wartość parametru b0:

b0 = y − b1x (2.17)

i wstawić do drugiego równania w (2.14)b0 = y − b1x,n∑i=1

xiyi − (y − b1x)n∑i=1

xi − b1n∑i=1

x2i = 0.(2.18)

Analogicznie, stosując podstawienie

n∑i=1

xi = nx

Page 15: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.2. WYZNACZENIE PARAMETRÓWMODELU LINIOWEGO Z JEDNĄ ZMIENNĄOBJAŚNIAJĄCĄMETODĄNAJMNIEJSZYCHKWADRATÓW15

otrzymujemy: b0 = y − b1x,n∑i=1

xiyi − nxy + nb1x2 − b1

n∑i=1

x2i = 0.(2.19)

Policzmy, czemu są równe wyrażenian∑i=1

(xi − x)2 orazn∑i=1

(xi − x)(yi − y):

n∑i=1

(xi − x)2 =n∑i=1

(x2i − 2xxi + x2) (2.20)

=n∑i=1

x2i − 2nxx+ nx2 =n∑i=1

x2i − nx2

n∑i=1

(xi − x)(yi − y) =n∑i=1

xiyi − yn∑i=1

xi − xn∑i=1

yi + xyn∑i=1

1 (2.21)

=n∑i=1

xiyi − nxy

Wstawiając te wyrażenia do drugiego równania w (2.19) i po kilku przekształceniachotrzymujemy:

b0 = y − b1x,

b1 =

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2.

(2.22)

Otrzymaliśmy rozwiązanie warunku koniecznego na istnienie ekstremum funkcji χ(b0, b1).Pozostało nam sprawdzenie warunku wystarczającego na istnienie minimum. Ponieważmamy do czynienia z funkcją dwóch zmiennych, musimy policzyć zarówno drugie pochod-ne po bk jak i pochodne mieszane.

A =

∂2χ(b0, b1)

∂b20

∂2χ(b0, b1)∂b0b1

∂2χ(b0, b1)∂b0b1

∂2χ(b0, b1)∂b21

=

2n 2nx

2nX 2n∑i=1

x2i

(2.23)

Jeśli det(A) > 0, oraz pochodna∂2χ(b0, b1)

∂b20> 0 to funkcja ma lokalne minimum. Ponieważ

det(A) = 4n(

n∑i=1

x2i − nx2)

= 4n(

n∑i=1

(xi − x)2)> 0 (2.24)

oraz 2n > 0, to w b0 i b1 danymi przez (2.22) funkcja χ(b0, b1) ma minimum.

Page 16: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

16 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Wniosek

Użycie metody najmniejszych kwadratów do znalezienia wartości estymatorów bk para-metrów strukturalnych βk pozwoliło na znalezienie takich wartości bk, dla których sumakwadratów reszt osiąga minimum. Oznacza to, że o ile reszty mają rozkład normalny(patrz np. [6]), inne metody estymacji mogą dać co najwyżej tak samo dobre oszacowaniaparametrów strukturalnych.

2.3 Uogólnienie na model wielowymiarowy

W poprzednim rozdziale zdefiniowaliśmy liniowy (względem parametrów i zmiennych ob-jaśnianych) model ekonometryczny z jedną zmienną objaśniającą. W tym rozdziale wpro-wadzimy ogólniejszy zapis modelu z dowolną liczbą zmiennych objaśniających.Rozważmy zatem model liniowy

yi = β0 + β1x1i + β2x2i + . . .+ βkxki + εi, i = 1, 2, . . . , n, (2.25)

gdzie:yi- jest i-tą obserwacją zmiennej objaśnianej, xki- i-tą obserwacją k−tej zmiennej obja-śniającej, a εi zmienną losową.Obserwacje zmiennych objaśnianych dla całej próby tworzą wektor jednokolumnowy

Y =

y1y2...yn

. (2.26)

Dla k− tej zmiennej objaśniającej jej wektor obserwacji jest postaci

Xk =

xk1xk2...xkn

. (2.27)

Łatwo zauważyć, że wektory obserwacji dla wszystkich zmiennych objaśniających, dlacałej próby o liczebności n tworzą macierz postaci

X =

1 x11 x21 . . . xk11 x12 x22 . . . xk2...

......

......

1 x1n x2n . . . xkn

, (2.28)

gdzie pierwsza kolumna (złożona z jedynek) odpowiada stałej w modelu (parametrowiβ0).Wektor parametrów βββ oraz czynników losowych εiεiεi również są jednokolumnowy

βββ =

β1β2...βk

, (2.29)

Page 17: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.4. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW - ZAŁOŻENIA 17

εεεi =

ε1ε2...εn

. (2.30)

Stosując powyższy zapis, model (2.25) możemy zapisać jako

Y = Xβββ + εεε. (2.31)

Analogicznie jak robiliśmy to w rozdziale poprzednim, można wyprowadzić warunkina istnienie minimum funkcjonału χ(bbb), który ma następującą postać

χ(bbb) = χ(b0, b1, . . . , bk) =n∑i=1e2i , (2.32)

gdzie resztyei = y − b0 − b1x1i − b2x2i . . .− bkxki. (2.33)

Warunkiem koniecznym istnienia ekstremum jest zerowanie się wszystkich pochodnychcząstkowych pierwszego rzędu

∂χ(bbb)∂bl

= 0, l = 1, 2, . . . , k, (2.34)

a warunkiem wystarczającym na istnienie minimum jest dodatnio określona macierz dru-gich pochodnych

∂2χ(bbb)∂bbb2

> 0. (2.35)

Poniżej podamy tylko wynik obliczeń, zainteresowanych szczegółami rachunkowymi od-syłamy np. do książki [4] lub do skryptu [6].

Z powyższych warunków na minimum funkcjonału χ(bbb) otrzymujemy następującą po-stać wektora estymatorów parametrów strukturalnych:

b =(XTX

)−1XTY, (2.36)

gdzie XT oznacza macierz transponowaną do macierzy X, a (XTX)−1 jest macierzą od-wrotną do macierzy XTX.

2.4 Klasyczna metoda najmniejszych kwadratów - za-łożenia

Aby powyższy formalizm szacowania wartości estymatorów parametrów strukturalnychmógł nosić nazwę klasycznej metody najmniejszych kwadratów (KMNK), muszą być speł-nione pewne założenia [3, 2], co daje nam większe możliwości wnioskowania statystyczne-go.

Page 18: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

18 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

1. Istnieje liniowa zależność pomiędzy zmienną objaśnianą i objaśniającymi. Zmienneobjaśniające xi są nielosowe, a ich wartości są traktowane jako stałe w powtarzają-cych się próbkach (pomiarach).

2. Wartości oczekiwane składników losowych są równe zeru: E(εεε) = 0.

3. Wariancje składników losowych są stałe, tzn. D2(εεε) = E(εεεεεεT ) = σ2III, σ2 <∞.

4. r(XXX) = k + 1 ¬ n, gdzie r() oznacza rząd macierzy.

5. Składniki losowe εi, i = 1, 2, . . . , n mają rozkład normalny.

Interpretacja założeń

Pierwsze założenie o nielosowości i stałości w próbach zmiennych objaśniających ozna-cza, że wartości tych zmiennych są znane (założone z góry) np. chcąc zbadać wpływintensywności stosowania środków ochrony roślin na zbiór ziemniaków wybiera się trzygospodarstwa. Każdy z rolników stosuje ten sam środek ochrony roślin, ale z różną, leczstałą intensywnością (pierwszy rolnik spryskuje pole raz w miesiącu, drugi dwa razy atrzeci trzy razy). Bada się ile ton ziemniaków pierwszej klasy zbierze każdy z gospoda-rzy. Plony ziemniaków są oczywiście zmienną losową, lecz ilość środka ochrony roślin nie,ponieważ jest z góry ustalona.

Drugie założenie, o zerowej wartości oczekiwanej składnika losowego oznacza, że zakłó-cenia od poszczególnych składników losowych mają tendencję do wzajemnego znoszeniasię. Konsekwencją tego założenia jest równość E[yi|x1i, . . . , xki] = βββX, która nadaje na-stępującą interpretację liczbową parametrom modelu: wartość parametru βl mówi o ileśrednio zmieni się wartość zmiennej objaśnianej y, gdy zmienna objaśniająca xl zmienisię o jednostkę, przy niezmienionych wartościach pozostałych zmiennych.

Trzecie założenie oznacza jednorodność wariancji składnika losowego (tzw. homoske-dastyczność). Dodatkowo, E(εi, εj) = 0 (lub cov(εi, εj) = 0) dla i 6= j co oznacza, żeskładniki losowe są nieskorelowane, a ich rozkład jest niezależny od zmiennych objaśnia-jących i taki sam dla wszystkich obserwacji.

Czwarte założenie mówi, że rząd macierzy zmiennych objaśniających jest mniejszy lubrówny liczbie obserwacji. Jest to założenie algebraiczne, lecz niezbędne do jednoznacznegowyznaczenia wartości estymatorów parametrów strukturalnych.

Ostatnie, piąte założenie nie musi być spełnione w klasycznej metodzie najmniejszychkwadratów, ale ułatwia wnioskowanie statystyczne i weryfikację modelu ekonometryczne-go.

Należy podkreślić, że nie jesteśmy w stanie sprawdzić założeń dotyczących składnikalosowego przed oszacowaniem parametrów modelu. Procedurę tę wykonuje się za pomocąodpowiednich testów statystycznych już dla otrzymanego modelu. Dlatego też czasem zda-rza się, że model trzeba poprawić (zastosować inne metody estymacji) lub nawet odrzucić,ponieważ nie są spełnione założenia KMNK.

Na koniec jeszcze jedna uwaga odnośnie nazwy powyższej metody. Słowo klasycznanie występuje tu przypadkowo i nie może być pominięte. Istnieją bowiem inne metodyestymacji parametrów modelu liniowego, które różnią się od KMNK i które stosuje się, gdyktóreś z założeń KMNK nie są spełnione (np. ważona metoda najmniejszych kwadratów).

Page 19: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.5. TWIERDZENIE GAUSSA-MARKOWA 19

2.5 Twierdzenie Gaussa-Markowa

Twierdzenie 2.5.1. Estymator parametrów strukturalnych

b =(XTX

)−1XTy (2.37)

wyznaczony klasyczną metodą najmniejszych kwadratów jest estymatorem zgodnym, nie-obciążonym i najefektywniejszym w klasie liniowych estymatorów wektora parametrów β[4].

Wyjaśnijmy pokrótce te własności.

Estymator zgodny

Estymator b jest zgodny, jeśli że wraz ze wzrostem liczebności próby, tj. n → ∞ jeststochastycznie zbieżny do szacowanego parametru, tzn.

limn→∞

P (|b(n) − β| < δ) = 1, (2.38)

gdzie δ jest dowolnie małą liczbą dodatnią, a b(n) ciągiem estymatorów.Inaczej mówiąc, wraz ze wzrostem liczebności próby n prawdopodobieństwo, że estyma-tor b różni się o dowolnie małą liczbę od estymowanego parametru β dąży do jedności.Stąd wynika, że zwiększenie liczebności próby prowadzi do uzyskania mniejszych błędówestymacji.

Estymator nieobciążony

Estymator jest nieobciążony, jeśli jego wartość oczekiwana jest równa wartości szacowa-nego parametru, tzn.

E(b) = β. (2.39)

Estymator, który nie jest nieobciążony nazywa się obciążonym, a różnicę

Θ = E(b)− β (2.40)

nazywa się obciążeniem estymatora.Jeśli Θ > 0, to estymator b daje przeciętnie za wysokie oceny parametru strukturalnegoβ, jeśli Θ < 0, to estymator b daje przeciętnie za niskie oceny parametru strukturalnegoβ.Estymator jest asymptotycznie nieobciążony, jeśli obciążenie estymatora dąży do zerawraz ze wzrostem próby: lim

n→∞(E(b(n) − β)) = 0.

Estymator najefektywniejszy

Niech będzie dany zbiór m estymatorów Γl, l = 1, 2, . . . ,m tego samego parametru β.Efektywność e (Γl) estymatora Γl to stosunek wariancji estymatora odznaczającego sięnajmniejszą wariancją Γmin, do wariancji tego estymatora:

eff (Γl) =σ2(Γmin)σ2(Γl)

. (2.41)

Page 20: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

20 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Jak łatwo można zauważyć, dla estymatora najefektywniejszego eff(Γeffl

)= 1, a dla

wszystkich estymatorów mających większą wariancję eff < 1.

2.6 Ocena stopnia dopasowania modelu ekonometrycz-nego do danych empirycznych

Oszacowanie parametrów modelu ekonometrycznego metodą najmniejszych kwadratówjest zadaniem stosunkowo prostym. Większość programów statystycznych wykonuje tozadanie prawie natychmiastowo. Jednak samo wyliczenie ocen estymatorów b nie wystar-cza, aby móc formułować wnioski na podstawie otrzymanego modelu. Najpierw należysprawdzić, czy otrzymany model w wystarczającym stopniu wyjaśnia zachowanie zmien-nej objaśnianej oraz czy jest poprawny pod względem statystycznym i merytorycznym.Ekonometria dysponuje narzędziami do oceny stopnia dopasowania modelu teoretycznegodo danych empirycznych. Poniżej omówimy kilka z nich.

Odchylenie standardowe reszt

Dopasowanie modelu do danych empirycznych moglibyśmy ocenić na podstawie warian-cji składnika losowego σ2(ε). Niestety składowe wektora εεε(ε1, . . . , εn) nie są wielkościamiobserwowanymi i wyliczenie wariancji σ2(ε) jest niemożliwe. Trzeba poszukać innej drogi.W poprzednim rozdziale wprowadziliśmy pojęcie reszt modelu (2.3), jako różnicę war-tości empirycznej i teoretycznej zmiennej objaśnianej. Jeśli zapiszemy to równanie niecodokładniej zobaczymy, że reszty modelu będą odpowiednikami czynnika losowego:

e = y − y =⇒ y = y + e→ Xβ + ε = Xb + e (2.42)

Twierdzenie 2.6.1. W klasycznym modelu regresji liniowej nieobciążonym i zgodnymestymatorem wariancji składnika losowego σ2(ε) jest

S2e =eTe

n− (k + 1)=

1n− k − 1

n∑i=1

e2i . (2.43)

Odchylenie standardowe reszt, zwane również standardowym błędem szacunku jest de-finiowane jako pierwiastek z wariancji reszt

Se =

√√√√ 1n− (k + 1)

n∑i=1

e2i . (2.44)

We wzorach (2.43,2.44) suma kwadratów reszt nie jest dzielona przez liczebność próbyn, a przez liczebność próby pomniejszoną o liczbę zmiennych objaśniających n− (k + 1).Wielkość ta nazywana jest stopniami swobody równania (2.25). Warto o tym pamiętaćnp. podczas pisania własnych procedur do estymacji KMNK np. w programach Excel czyMatlab, gdzie domyślnie suma kwadratów reszt dzielona jest przez liczebność próby.Standardowy błąd estymacji informuje, o ile przeciętnie wartości teoretyczne odchylająsię od wartości empirycznych zmiennej objaśnianej. Jest więc oczywiste, że im mniejszyjest standardowy błąd estymacji, tym lepiej model odzwierciedla rzeczywistą sytuację.

Page 21: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.6. OCENA STOPNIA DOPASOWANIAMODELU EKONOMETRYCZNEGODODANYCH EMPIRYCZNYCH21

Macierz wariancji–kowariancji estymatorów b

Zanim przejdziemy do macierzy kowariacji estymatorów b, przypomnijmy definicję kowa-riancji. Kowariancja jest miarą jednoczesnej zmienności dwóch zmiennych (ang. co-vary).Z jednej strony, kowariancja dwóch zmiennych jest dodatnia, jeśli zmieniają się one w tymsamym kierunku względem ich wartości oczekiwanej (np. obie zmienne przyjmują wartościpowyżej ich wartości oczekiwanej). Z drugiej strony, kowariancja dwóch zmiennych jestujemna, jeśli kierunek ich zmienności względem wartości oczekiwanych jest przeciwny (np.jeśli jedna zmienna przyjmuje wartości powyżej jej wartości oczekiwanej, druga przyjmujewartości mniejsze niż wartość oczekiwana). Jeśli nie istnieje liniowa zależność pomiędzyzmiennymi, wtedy ich kowariancja jest równa zeru.Kowariancję dwóch zmiennych możemy zapisać w postaci:

D2(Xi, Xj) ≡ cov(Xi, Xj) = E [(Xi − µi)(Xj − µj)] , (2.45)

gdzie µi(j) = E(Xi(j)) jest wartością oczekiwaną zmienej Xi(j). Można pokazać, że macierzwariancji-kowariancji wektora estymatorów bbb ma postać

D2(b) = S2e(XTX

)−1. (2.46)

Elementy diagonalne djj, j = 1, . . . , k macierzy kowariancji są wariancjami estymatorówbi, a ich pierwiastki kwadratowe noszą nazwę standardowych błędów szacunku Sbjparametrów βj

Sbj =√djj. (2.47)

Standardowy błąd szacunku Sbj informuje nas o ile średnio wartość estymatora bj osza-cowanego KMNK różni się od prawdziwej wartości parametru βj. Wynika stad, że imwiększy błąd szacunku, tym bardziej wynik estymacji różni się od prawdziwej wartościparametru strukturalnego. Dlatego istotne jest, aby wartość Sbj była jak najmniejsza. Wszczególności ważne jest, aby Sbj nie było porównywalne (tego samego rzędu) z bj. Wpracy [2] autorzy sugerują, że standardowy błąd szacunku nie powinien być większy niż50% dla dużych prób (gdy liczba stopni swobody jest większa niż 20).

Błędy względne estymatorów

Kolejną wielkością, która niesie informację o stopniu dopasowania modelu do danych jestbłąd względny estymatora bi

V (bi) =S(bi)|bi|

· 100%. (2.48)

Przyjmuje się, że granicą dopuszczalności błędu jest V (bi) ¬ 50%.

Współczynnik determinancji i współczynnik zbieżności

W poprzednim rozdziale zdefiniowaliśmy, jako miarę dopasowania modelu do danych,wariancję reszt. Miara ta, mimo iż jest bardzo dobra, jest dość niewygodna w użyciuze względu na fakt, że wyrażona jest w jednostkach zmiennej objaśnianej. Dodatkowo,

Page 22: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

22 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

wariancja reszt skaluje się razem ze zmiennymi, tzn. załóżmy, że zmienna objaśniana iobjaśniająca wyrażone są w PLN: X[PLN ], Y [PLN ]. Wtedy Se również będzie wyrażonew tych jednostkach np. Se = 10PLN. Jeżeli jednak wyrazimy zmienną objaśniającą wPLN , a objaśnianą w tysPLN wtedy Se = 0.01tys PLN. To powoduje, że na pierwszy rzutoka model stał się lepiej dopasowany, co oczywiście jest nieprawdą. Dlatego lepiej stosowaćmiary dopasowania, które nie zależą od jednostek, w których wyrażone są zmienne. Takąmiarą jest współczynnik determinancji R2.Współczynnik determinancji

R2 = 1−

n∑i=1

e2i

n∑i=1

(yi − y)2. (2.49)

Zanim omówimy znaczenie R2 wprowadźmy następujące oznaczenia:

TSS =n∑i=1

(yi − y) - (Total Sum of Squares) całkowita zmienność zmiennej objaśnianej,

ESS =n∑i=1

(yi − y) - (Explained Sum of Squares) część zmienności zmiennej objaśnianej

wytłumaczonej przez model,

RSS =n∑i=1

e2i - (Residual Sum of Squares) część zmienności zmiennej objaśnianej nie

wytłumaczonej przez model.Zachodzi przy tym zależność

TSS = ESS +RSS. (2.50)

Jeśli zapiszemy równanie (2.49) w postaci

R2 =ESS

TSS, (2.51)

to od razu widzimy interpretację współczynnika determinancji. Określa on, w jakim stop-niu model tłumaczy zmienność zmiennej objaśniającej. Wartości R2 należą do przedziału[0; 1]. Jeśli R2 = 0, to model w ogóle nie opisuje zmienności zmiennej objaśnianej, jeśliR2 = 1 - model całkowicie tłumaczy zmienność zmiennej objaśnianej.Współczynnik zbieżnościWspółczynnik zbieżności określa, jaka część całkowitej zmienności zmiennej objaśnianej,jaka nie została wyjaśniona przez model

φ2 =∑ni=1 e

2i∑n

i=1(yi − y)2=RSS

TSS(2.52)

φ2 przyjmuje również wartości z przedziału [0; 1], przy czym możemy go określić szybkona podstawie zależności φ2 = 1−R2.

Page 23: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.6. OCENA STOPNIA DOPASOWANIAMODELU EKONOMETRYCZNEGODODANYCH EMPIRYCZNYCH23

Niescentrowany współczynnik determinancji

Współczynnik determinancji określony równaniem (2.49) jest dobrą miarą jedynie dlamodelu liniowego, który zawiera wyraz wolny (b0). Jeśli model nie będzie zawierał wy-razu wolnego (ale jest modelem liniowym), należy zastosować jako miarę dopasowanianiescentrowany współczynnik determinancji

R2N = 1−∑ni=1 e

2i∑n

i=1 y2i

(2.53)

Skorygowany współczynnik determinancji

Wyobraźmy sobie sytuację, że oszacowaliśmy KMNK model liniowy oraz sprawdziliśmydopasowanie modelu do danych za pomocą współczynnika determinancji na poziomieR2 = 0.6. Uważamy, że takie dopasowanie modelu jest zbyt małe i chcemy dodać domodelu nową zmienną objaśniającą. Wyznaczamy zatem nowy model wzbogacony o tązmienną i obliczamy współczynnik determinancji. Okazuje się, że w takim przypadku, niemożemy porównać współczynników determinancji dla modeli z k oraz k + 1 zmiennymiobjaśniającymi. Przyczyną tego jest fakt, że współczynnik determinancji nie jest odpor-ny na wprowadzenie kolejnej zmiennej, tzn. nawet jeśli nowa zmienna nie wniesie żadnejinformacji do modelu, R2 może wzrosnąć dając nam błędną informację o stopniu dopa-sowania modelu (w populacji) do danych. Taki efekt nazywa się efektem katalizy. Wprzypadku, gdy chcemy porównywać modele z tą samą zmienną objaśnianą i różną liczbązmiennych objaśniających (różną liczbą stopni swobody) powinniśmy użyć skorygowanegowspółczynnika determinancji R2

R2 = R2 − k

n− k − 1(1−R2) = 1−

n∑i−1

e2i /(n− k − 1)

n∑i=1

(yi − y)2/(n− 1), (2.54)

gdzie n − k − 1 jest liczbą stopni swobody (n−liczebność próby, k−liczba zmiennychobjaśniających).

Skorygowany współczynnik determinancji ma jednak pewne wady: może przyjmowaćwartości ujemne oraz nie możemy go interpretować jako części zmienności zmiennej obja-śnianej wyjaśnionej przez model.

Współczynnik korelacji wielorakiej

Współczynnik korelacji wielorakiej R, będący pierwiastkiem kwadratowym ze współczyn-nika determinancji R =

√R2, interpretuje się jako siłę związku liniowego pomiędzy zmien-

ną objaśnianą a wszystkimi zmiennymi objaśniającymi.

Page 24: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

24 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Tabela 2.1: Typowe wartości przyjmowane przez współczynnik determinancji R2. Źródło[4].

modele oparte na danych przekrojowych(np.dane dotyczące przedsiębiorstw lub gospodarstw domowych) 0.05-0.4modele oparte na zagregowanych danych przekrojowych(np. statystyki międzynarodowe) 0.3-0.7modele szeregów czasowych dla danychrocznych lub kwartalnych > 0.9modele oparte na przyrostach zmiennych makroekonomicznych 0.7-0.9

2.7 Zadania

Zadanie 1

W tabeli 2.2 podano trzy wektory reszt modelu oszacowanego różnymi metodami. Odpo-wiedz na pytanie, który z modeli został oszacowany metodą najmniejszych kwadratów.Odpowiedź uzasadnj.

e1i e2i e3i3 6 74 2 2-2 4 -24 -5 4-1 -2 -30 3 -54 9 -3-7 -1 72 2 67 -5 34 -2 12 7 65 4 2-2 3 3

Tabela 2.2: Wektory reszt dla modelu ekonometrycznego oszacowanego trzema różnymimetodami.

2.8 KMNK w Statistica

W tym rozdziale zapoznamy się z podstawowymi narzędziami dostępnymi w programieStatistica służącymi do oszacowania parametrów modelu KMNK. Posłużymy się przy-kładem, w którym będziemy chcieli odpowiedzieć na pytanie, jaki wpływ na sprzedażproduktu ma jego cena oraz środki przeznaczone na reklamę. Dane do analizy zamiesz-czone są w Tabeli 10.1 w rozdziale 10.

Page 25: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.8. KMNK W STATISTICA 25

2.8.1 Wykres rozrzutu

Pierwszym krokiem, który zawsze należy zrobić przed rozpoczęciem estymacji parametrówmodelu jest analiza wykresów rozrzutu wartości zmiennej objaśnianej względem zmien-nych objaśniających. To bardzo proste narzędzie pozwala, na podstawie wzrokowej oceny,na wyciągnięcie wielu informacji na temat zależności pomiędzy zmiennymi np. ocenić czyistnieje widoczna zależność pomiędzy zmiennymi oraz czy zależność ta ma charakter linio-wy czy nieliniowy. Wykresy rozrzutu w programie Statistica możemy zrobić wybierając zmenu Wykresy → Wykresy 2W → Wykresy rozrzutu. Wybierając tę opcję na ekraniepojawi się okno wyboru zmiennych i opcji do wykresu (Rysunek 2.2).

Rysunek 2.2: Okno kreatora wykresu rozrzutu w programie Statistica.

Aby wybrać zmienne, dla których chcemy zrobić wykresy klikamy na przycisk Zmienne.Jako zmienną X wybieramy obydwie zmienne objaśniające (trzymając klawisz Ctrl) tj.Wydatki reklama i Indeks ceny (Rysunek 2.3), a jako zmienną Y sprzedaż, czyli zmien-ną objaśnianą. Wybierając obydwie zmienne objaśniające jednocześnie, otrzymamy dwawykresy rozrzutu dla każdej z osobna.

Rysunek 2.3: Okno kreatora wykresu rozrzutu w programie Statistica.

W efekcie otrzymujemy dwa wykresy rozrzutu z automatycznie dopasowaną przezStatistica krzywą regresji.

Na podstawie wykresów 2.4 i 2.5 możemy stwierdzić, że w pierwszym przypadku za-leżność pomiędzy zmienną Sprzedaż a Indeks ceny jest silna i ujemna (im większa cenaproduktu tym mniejsza jego sprzedaż), natomiast zależność liniową pomiędzy Sprzedażą

Page 26: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

26 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Rysunek 2.4: Wykres rozrzutu zmiennej Sprzedaż względem zmiennej Indeks ceny wraz zdopasowaną krzywą regresji. Równanie dopasowanej krzywej znajduje się nad wykresem.

a Wydatkami na reklamę jest raczej słaba.W ten sam sposób robimy wykres rozrzutu zmiennych objaśniających względem siebie.Pozwoli on nam ocenić, czy zmienne objaśniające są ze sobą w jakiś sposób związane.Wykres pokazano na Rysunku 2.6. Punkty na wykresie rozmieszczone są losowo i nieukładają się w żaden szczególny wzór co oznacza, że nie ma związku liniowego (przy-najmniej dokonując wzrokowej oceny) pomiędzy zmiennymi Indeks ceny i Wydatki nareklamę. Taki związek byłby oczywiście niepożądany (patrz założenia KMNK).

2.8.2 Szacowanie parametrów modelu

Oszacowania wartości parametrów modelu za pomocą metody najmniejszych kwadratówdokonuje się wybierając z menu Statystyka → Regresja wieloraka. Pojawi się namna ekranie okno wyboru zmiennych zależnych i niezależnych (Rysunek 2.7), w którymjako zmienną zależną wybieramy Sprzedaż a jako niezależne Indeks ceny oraz Wydatki nareklamę (Rysunek 2.8).

Następnie wybieramy w oknie regresji OK, w wyniku czego otrzymujemy okno z wy-nikami regresji (Rysunek 2.9).

W oknie Wyniki regresji wielorakiej pojawia się wiele wielkości, których wartościtrzeba zinterpretować:

• współczynnik korelacji wielorakiej R

• współczynnik determinancji R2

Page 27: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.8. KMNK W STATISTICA 27

Rysunek 2.5: Wykres rozrzutu zmiennej Sprzedaż względem zmiennej Wydatki na reklamęwraz z dopasowaną krzywą regresji. Równanie dopasowanej krzywej znajduje się nadwykresem.

• skorygowany współczynnik determinacji Popraw.R2

• wartość statystyki F oraz p-wartość dla testu F

• błąd standardowy estymacji

Na podstawie R oraz R2 (0.95) możemy stwierdzić bardzo dobre dopasowanie modeluregresji do danych empirycznych. Ponadto wszystkie zmienne są statystycznie istotne(podświetlone na czerwono, patrz rozdział 2.8.3), oraz cały model jest statystycznie istotny(p-wartość dla testu F jest mniejsza od poziomu istotności α = 0.05). Wybierając opcjęPodsumowanie regresji otrzymamy arkusz wyników przedstawiony na Rysunku 2.10.

Jak widać, wszystkie parametry modelu są statystycznie istotne (podświetlenie naczerwono), z p-wartością dla testu t-Studenta (patrz rozdział 2.8.3) podaną w ostatniejkolumnie. Wyraz wolny jest również istotny statystycznie. Możemy zatem zapisać naszmodel w formie matematycznej

y = 118.91 + 7.91 · Indeks ceny + 1.86 ·Wydatki reklama± 4.886 (2.55)

Standardowe błędy szacunku parametrów są małe w przypadku zmiennej Indeks ceny(≈ 1.1) i zmiennej Wydatki reklama (≈ 0.68) i akceptowalne w przypadku wyrazu wolne-go (≈ 6.35).Otrzymany model możemy zinterpretować następująco:

Page 28: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

28 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Rysunek 2.6: Wykres rozrzutu zmiennej Indeks ceny względem zmiennej Wydatki nareklamę wraz z dopasowaną krzywą regresji. Równanie dopasowanej krzywej znajduje sięnad wykresem.

zwiększając (zmniejszając) indeks ceny o jednostkę, średnia sprzedaż maleje (wzrasta) o7.91, przy pozostałych parametrach (wydatki na reklamę) nie zmienionych. Zwiększając(zmniejszając) wydatki na reklamę o jednostkę, średnia sprzedaż rośnie (maleje) o 1.86,przy niezmienionych wartościach pozostałych zmiennych. Ocena b0 różni się średnio odparametru β0 o 6.35, ocena b1 różni się średnio od β1 o 1.1, a ocena b2 różni się średnio odβ2 o 0.68. Szacując cały model, mylimy się średnio o 4.89. Z powyższego modelu może-my wywnioskować, że większy wpływ na konsumpcję ma cena produktu, a nie dochody.Zwróćmy również uwagę, że ta tendencja jest już widoczna na etapie tworzenia wykre-sów rozrzutu (Rysunek 2.4 i 2.5), gdzie zaobserwowaliśmy silny związek liniowy pomiędzykonsumpcją i ceną, a słaby związek pomiędzy konsumpcją a dochodem.

2.8.3 Statystyczna istotność modelu

Program Statistica automatycznie wykonuje testy istotności statystycznej zarówno całegomodelu, jak i poszczególnych jego składników. Wyniki tych testów otrzymujemy w postaciwartości statystyki i p-wartości, która jest znacznie wygodniejsza w użyciu.

Page 29: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.8. KMNK W STATISTICA 29

Rysunek 2.7: Okno regresji wielorakiej.

Rysunek 2.8: Wybór zmiennych do modelu regresji.

Rysunek 2.9: Okno z wynikami oszacowania parametrów modelu MNK.

Page 30: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

30 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Rysunek 2.10: Okno podsumowania regresji wielorakiej w Statistica.

Testowanie istotności całego modelu

Ten test bada jednoczesną istotność statystyczną całego układu zmiennych objaśniają-cych, a stawiane hipotezy dotyczą zestawu parametrów. Hipoteza zerowa

H0 : β0 = β1 = β2 = . . . = βk = 0, (2.56)

[czyt. wszystkie parametry strukturalne modelu są, statystycznie, równe zeru (nieistotnestatystycznie różne od zera)], jest testowana wobec hipotezy alternatywnej

H1 : ∨i∈0,1,2,...,kβi 6= 0, (2.57)

(czyt. przynajmniej jeden z parametrów strukturalnych jest różny od zera). Statystykatestowa

F =n− k − 1

k

R2 − 1R2

(2.58)

ma rozkład F Snedecora z m1 = k i m2 = n− k − 1 stopniami swobody (R2 jest współ-czynnikiem determinancji). Jeśli wartość statystyki F wyznaczonej na podstawie próby,dla przyjętego poziomu istotności α, jest większa od wartości krytycznej F ∗, czyli F ­ F ∗

to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej. Jeśli F < F ∗ to nie mapodstaw do odrzucenia H0. Ponieważ odczytywanie wartości krytycznych statystyki jestkłopotliwe, stosuje się p wartość jako wyznacznik do odrzucenia bądź przyjęcia hipotezyzerowej. Jeżeli:

p ¬ α odrzucamy H0, (2.59)p > α nie ma podstaw do odrzucenia H0.

W naszym przykładzie (Rysunek 2.10) p < 0.0000, czyli jest mniejsze od przyjętegopoziomu istotności α = 0.05 (wartość domyślnie stosowana w programie Statistica), więcodrzucamy hipotezę zerową (2.56) o wszystkich parametrach (statystycznie) równych zeru,na rzecz hipotezy alternatywnej H1.

Testowanie istotności statystycznej pojedynczej zmiennej

Istotność statystyczna całego modelu nie oznacza automatycznie statystycznej istotnościwszystkich jego składników. Do testowania istotności statystycznej jednej zmiennej stosujesię test t-Studenta (jest to również test parametryczny). Test ma za zadanie stwierdzić,

Page 31: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

2.8. KMNK W STATISTICA 31

czy dana zmienna objaśniająca ma istotny wpływ na zmienną objaśnianą. Podobnie jakw poprzednim przypadku, w programie Statistica, test jest wykonywany automatycznie iprezentowane są tylko jego wyniki. Statystyka testowa:

tbi =biSbi

(2.60)

ma rozkład t Studenta z n−k−1 stopniami swobody, gdzie bi - jest wartością estymatora,a Sbi jest jego odchyleniem standardowym.Jeśli dla przyjętego poziomu istotności α

|tbi| ­ t∗α, odrzucamy H0, zmienna jest statystycznie istotna, (2.61)|tbi| < t∗α, nie ma podstaw do odrzucenia H0, zmienna jest statystycznie nieistotna.

Analogicznie jak dla testu F , jeśli obliczona p wartość jest mniejsza od poziomu istotnościp ¬ α to odrzucamy H0, w przeciwnym razie nie ma podstaw do odrzucenia H0.

Page 32: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

32 ROZDZIAŁ 2. KLASYCZNA METODA NAJMNIEJSZYCH KWADRATÓW

Page 33: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 3

Weryfikacja założeń KMNK

W poprzednim rozdziale oszacowaliśmy metodą najmniejszych kwadratów parametry mo-delu ekonometrycznego. Jak już napisaliśmy w rozdziale 2.4, aby metoda najmniejszychkwadratów była klasyczną metodą najmniejszych kwadratów, muszą być spełnione zało-żenia KMNK. W tym rozdziale dokonamy weryfikacji założeń KMNK bazując na modeluz poprzedniego rozdziału. Trzeba podkreślić, że analiza założeń KMNK nie jest tylkoformalnym zabiegiem pozwalającym na dopisanie do nazwy Metoda Najmniejszych Kwa-dratów przymiotnika klasyczna. Jest ona weryfikatorem poprawności całego modelu i bezwykonania analizy składnika losowego, a konkretniej reszt modelu które są estymatoramiskładników losowych, wyciąganie jakichkolwiek wniosków na temat modelowanego zjawi-ska jest nieuzasadnione i nie ma żadnego sensu. Praktyka zawodowa powinna być taka,że po otrzymaniu końcowej wersji modelu, od razu przystępujemy do analizy reszt.

Zgodnie z założeniami KMNK, musimy sprawdzić, czy reszty modelu spełniają zało-żenia losowości,stałości wariancji, braku skorelowania i normalności rozkładuoraz czy wartość średnia reszt jest równa zeru. Analizę reszt w Statistica wykonu-jemy wybierając w oknie wyników regresji zakładkę Reszty,założenia,predykcja (Rysunek3.1).

Po wybraniu tej zakładki pojawi się okno, w którym wybieramy opcję wykonaj analizęreszt.

W efekcie pojawia się okno z opcjami analizy reszt (Rysunek 3.2).

3.1 Wartość średnia reszt

Wartość średnią reszt możemy sprawdzić wybierając w zakładce Podstawowe w oknieanalizy reszt (Rysunek 3.2) opcję Podsumowanie: Reszty i przewidywane. Otrzymamytabelę za wartościami reszt oraz wyliczoną średnią reszt (estymator wartości oczekiwanejskładnika losowego) i inne statystyki opisowe. Jak widać z Rysunku 3.3, średnia z resztjest równa zeru, więc podstawowa konsekwencja założeń KMNK jest spełniona.

33

Page 34: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

34 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Rysunek 3.1: Okno podsumowania regresji. Analiza reszt dostępna w zakładce Resz-ty,założenia,predykcja.

Rysunek 3.2: Opcje zakładki Reszty,założenia,predykcja.

3.2 Badanie losowości

Weryfikacja tego założenia ma na celu zbadanie poprawności postaci analitycznej modelu.Do tego celu możemy wykorzystać zarówno wzrokową ocenę rozkładu reszt, jak i testystatystyczne. W pierwszym przypadku, jeśli reszty modelu spełniają założenie losowości,to na wykresie reszt w funkcji wartości obserwowanych (zarówno dla zmiennych obja-śniających, jak i zmiennej objaśnianej) reszty powinny układać się w miarę losowo i niewykazywać regularności (np. kolejnych serii reszt dodatnich i ujemnych). Na Rysunku3.4 pokazano wykres reszt modelu względem empirycznych wartości zmiennej objaśnia-jącej. Reszty rozkładają się nieregularnie więc możemy sądzić, że założenie losowości jestspełnione.

Podobnie sytuacja wygląda na wykresach reszt względem zmiennych objaśniających(Rysunek 3.5 i 3.6): nie widzimy żadnych regularności. Możemy zatem przyjąć losowycharakter reszt.

Test serii

Jeśli na podstawie wykresów reszt względem zmiennych obserwowanych nie potrafimyjednoznacznie stwierdzić czy ich charakter jest losowy, możemy skorzystać z testu serii.

Page 35: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

3.2. BADANIE LOSOWOŚCI 35

Rysunek 3.3: Podsumowanie analizy reszt. Pod podwójną kreską znajdują się niektórestatystyki opisowe. Średnia z reszt modelu jest równa zeru.

Procedura testowa jest następująca:

• porządkujemy reszty niemalejąco względem wybranej zmiennej objaśniającej (lubczasowej jeśli taka występuje)

• jeśli reszta ma wartość ujemną (dodatnią) oznaczamy ją symbolem A (B). W wynikutej operacji otrzymamy naprzemiennie serie znaków A i B.

• zliczamy liczbę serii dodatnich i ujemnych, a następnie z tablic testu serii dla liczbyn1 reszt dodatnich i liczby n2 reszt ujemnych odczytujemy wartości krytyczne S∗1 iS∗2 dla poziomu istotności odpowiednio α

2 i 1− α2 (test serii jest testem dwustronnym)

• stawiamy hipotezę zerową o losowym doborze jednostek do próby (o w przypadkumodelu normalnego prowadzi do hipotezy o liniowej postaci modelu)

H0 : yi = β0 + β1x1i + . . .+ βkxki + εi (3.1)

wobec hipotezy alternatywnej

H1 : yi 6= β0 + β1x1i + . . .+ βkxki + εi (3.2)

• jeżeli całkowita liczba serii (suma serii dodatnich i ujemnych) S spełnia warunekS∗1 ¬ S ¬ S∗2 to nie ma podstaw do odrzucenia hipotezy (3.1) o losowości reszt, wprzeciwnym razie hipotezę zerową należy odrzucić.

Page 36: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

36 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Rysunek 3.4: Wykres reszt modelu względem obserwowanych wartości zmiennej objaśnia-nej.

3.3 Badanie normalności rozkładu składnika losowe-go

Jak już wcześniej napisaliśmy, założenie o normalności rozkładu składnika losowego niejest konieczne do stosowania KMNK. Jego niespełnienie utrudnia jednak wnioskowaniestatystyczne. Dokładniej mówiąc, chodzi o test t Studenta i test F , których użyliśmydo sprawdzenia istotności całego modelu (test F ) i jego poszczególnych składników (testt). Testy te są tzw. testami parametrycznymi, które mają dużą moc testu, lecz testo-wana zmienna powinna mieć rozkład normalny. Co prawda testy te są odporne na małeodchylenia od normalności, lecz jeśli odchylenia są znaczne, wtedy oceny istotności współ-czynników regresji mogą być zaburzone.

Zgodność rozkładu reszt z rozkładem normalnym możemy sprawdzić na dwa sposoby:wybierając opcję Reszty, założenia predykcja→Podstawowe→Wykres normalnościreszt. Otrzymamy wykres z prostą normalności oraz resztami (Rysunek 3.7). Im bliżejprostej będą układały się punkty, tym rozkład reszt bardziej będzie zbliżony do normalne-go. W tym przypadku trudno dopatrzeć się poważnych odstępstw od rozkładu normalnego.

Drugim sposobem zbadania normalności rozkładu jest użycie testu statystycznego.Bardzo często stosowanym testem normalności (jest to tzw. test zgodności) jest testShapiro-Wilka. Jest to test nieparametryczny i może być stosowany dla małych prób, lubdla przypadków gdy wymagania testów parametrycznych nie są spełnione. W Statistica.do badania normalności możemy użyć również nieparametrycznych testów Kołmogorowa-Smirnowa (K-S) i testu Lillieforsa. Test opiera się na porównaniu rozkładu w próbie zteoretycznym rozkładem normalnym przy założeniu, że znamy średnią i odchylenie stan-dardowe w populacji. Jeśli ten warunek nie jest spełniony stosuje się test Lillieforsa (zwany

Page 37: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

3.4. BADANIE AUTOKORELACJI 37

Rysunek 3.5: Wykres reszt modelu względem obserwowanych wartości zmiennej Wydatkina reklamę.

inaczej testem K-S z poprawką Lillieforsa). Najpierw musimy jednak skopiować obliczonew procesie analizy reszt wartości reszt. Wracamy do arkusza reszt, zaznaczamy odpowied-nią kolumnę i klikając prawym przyciskiem myszy, z menu podręcznego wybieramy Kopiujz nagłówkami. Wracamy do arkusza danych i w menu Wstaw wybieramy Dodaj zmien-ne. Pojawi się okno specyfikacji zmiennej (Rysunek 3.8), w którym jako nazwę zmiennejwpisujemy Reszty, a w polu Wstaw po wpisujemy nazwę zmiennej Wydatki reklama.Test Shapiro-Wilka znajdziemy wybierając w menu Statystyka → Statystyki podstawowei tabele → Normalność.Wybieramy zmienną Reszta, zaznaczmy opcje testy normalnościK-S i Lillieforsa oraz test Shapiro-Wilka, a następnie klikamy przycisk Histogramy.W efekcie otrzymamy histogram z dopasowaną krzywą normalną (Rysunek 3.10) oraz ob-liczone wartości statystyk i p-wartości dla testów Kołmogorowa-Smirnowa, Lillieforsa iShapiro-Wilka (u góry wykresu, Rysunek 3.10). Zgodnie z definicją, ponieważ p ­ α niemamy podstaw do odrzucenia hipotezy zerowej o normalności rozkładu reszt. Czytelnikazainteresowanego pozostałymi opcjami okna Normalność odsyłamy do pozycji [5].

3.4 Badanie autokorelacji

Autokorelacja składnika losowego oznacza, że wartości reszt modelu nie są od siebie nieza-leżne. Jeśli reszta ei jest skorelowana z resztą ei±1 to mówimy o autokorelacji pierwszegorzędu. Analogicznie, korelacja pomiędzy resztami ei oraz ei±k oznacza autokorelację k-tego rzędu.Występowanie autokorelacji wynika z pewnej bezwładności zjawisk ekonomicznych, dlate-go często obserwowana jest dla danych w postaci szeregów czasowych i nie zawsze wynika

Page 38: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

38 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Rysunek 3.6: Wykres reszt modelu względem obserwowanych wartości zmiennej Indeksceny.

z błędów modelowania danego zjawiska. Autokorelacja składnika losowego może wynikaćrównież z nieuwzględnienia w modelu (jako zmiennej objaśniającej) opóźnionej zmiennejobjaśnianej, ze złej postaci funkcyjnej modelu lub ze złej jakości danych statystycznych[2].

Jako miarę autokorelacji składnika losowego wykorzystuje się współczynnik autokorela-cji. W niniejszym podręczniku ograniczymy się jedynie do autokorelacji pierwszego rzędu.Wtedy współczynnik autokorelacji z próby ρ pomiędzy resztą ei a ei−1 dany jest wzorem:

ρ =

n∑i=1

eiei−1( n∑i=1

e2i

n∑i=1

e2i−1

)1/2 . (3.3)

Współczynnik ρ przyjmuje wartości z przedziału [−1; 1].Autokorelację pierwszego rzędu składnika losowego możemy zbadać za pomocą testu

Durbina-Watsona. Test ten w programie Statistica jest dostępny w menu analizy resztw zakładce Więcej→Statystyka Durbina-Watsona. Po wybraniu tej opcji otrzymamywyliczony współczynnik autokorelacji (Rysunek 3.11) oraz wartość statystyki d D-W:

d =

∑i=1,n

(ei − ei−1)2∑i=1,n

e2i(3.4)

Wnioskowanie na podstawie tej statystyki jest dość złożone i nie zawsze daje się rozstrzy-gnąć czy autokorelacja występuje. Dodatkowo, wymagane jest aby analizowany model

Page 39: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

3.4. BADANIE AUTOKORELACJI 39

Rysunek 3.7: Wykres normalności reszt. Im punkty bardziej odległe od prostej, tym mniej-sza zgodność rozkładu reszt modelu z rozkładem normalnym.

Rysunek 3.8: Okno dodawania zmiennych do arkusza.

miał wyraz wolny, składniki resztowe miały rozkład normalny, liczba obserwacji byławiększa niż 15 oraz aby w modelu nie występowała jawna opóźniona zmienna objaśnianaw charakterze zmiennej objaśniającej.

Procedura testowania wymaga odczytania z tablic górnej dU i dolnej dL wartości kry-tycznej, a następnie porównania ich z wartością statystyki wyznaczonej z próby (3.4).

Przypadek ρ < 0

Jeśli ρ < 0, to testujemy hipotezę zerową H0:ρ = 0 wobec hipotezy alternatywnej H1:ρ <0. Jeżeli:

• d ¬ 4− dU , nie ma podstaw do odrzucenia H0 (brak autokorelacji)

• d ­ 4− dL, odrzucamy H0 (autokorelacja dodatnia)

Page 40: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

40 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Rysunek 3.9: Okno wyboru testu normalności.

• 4− du < d < dL, test D-W nie daje rozstrzygnięcia

Przypadek ρ > 0

Jeśli ρ > 0, to testujemy hipotezę zerową H0:ρ = 0 wobec hipotezy alternatywnej H1:ρ >0. Jeżeli:

• d ­ dU , nie ma podstaw do odrzucenia H0 (brak autokorelacji)

• d ¬ dL, odrzucamy H0 (autokorelacja dodatnia)

• dL < d < dU , test D-W nie daje rozstrzygnięcia

W przypadku naszego modelu liczebność próby n = 75, liczba zmiennych niezależnychk = 2. Odczytane z tablic wartości krytyczne dL = 1.57 i dU = 1.68, a współczynnikautokorelacji ρ = −0.094. Wobec powyższego, zachodzi związek d < 4 − dU i nie mapodstaw do odrzucenia hipotezy zerowej o braku autokorelacji.

3.5 Badanie homoskedastyczności

Homoskedastyczność, inaczej stałość wariancji, jest kolejnym założeniem KMNK któremusimy zweryfikować. Fakt występowania heteroskedastyczności nie zawsze oznacza zływybór modelu lub niską jakość danych statystycznych. Zdarza się, np. w medycynie przybadaniu zależności temperatury ciała od stężenia γ-globuliny, że wariancja nie jest stała[5]. Dlatego, jak już podkreśliliśmy, niezwykle istotne jest posiadanie przynajmniej pod-stawowej wiedzy na temat badanego zjawiska.

Bardzo często stosuje się w tym celu ocenę wzrokową rozkładu reszt względem war-tości przewidywanych (teoretycznych) lub kwadratów reszt względem wartości przewi-dywanych. Opcja druga, jeśli występuje heteroskedastyczność (wariancja nie jest stała)powinna dodatkowo wzmocnić efekt i ułatwić jego zaobserwowanie.

Page 41: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

3.5. BADANIE HOMOSKEDASTYCZNOŚCI 41

Rysunek 3.10: Histogram reszt modelu wraz z dopasowaną krzywą normalną. Nad wykre-sem obliczone wartości statystyk i p-wartości dla testów Kołmogorowa-Smirnowa, Lillie-forsa i Shapiro-Wilka. Nie ma podstaw do odrzucenia hipotezy o normalności rozkładureszt.

Rysunek 3.11: Wartość statystyki Durbina-Watsona (D-W) oraz wyliczony współczynnikautokorelacji.

Test Goldfelda - Quandt’a

Jest to test parametryczny, w którym przyjmuje się jako założenie, że wariancja resztwzrasta wraz ze wzrostem kwadratu zmiennej objaśniającej, która jest źródłem hetero-skedastyczności (którą podejrzewamy o jej wywołanie). Algorytm testowania jest nastę-pujący:

1. Porządkujemy niemalejąco reszty względem zmiennej objaśniającej, którą podejrze-wamy o wywołanie heteroskedastyczności.

2. Tak otrzymany wektor reszt dzielimy na trzy podgrupy, z czego dwie skraje majątaką samą liczność n = (n − c)/2, gdzie c jest licznością grupy środkowej (licznośćgrup skrajnych musi być większa niż liczba zmiennych objaśniających).

3. Dla każdej ze skrajnych podgrup l = 1, 2 oblicza się sumę kwadratów reszt S2l =1

n−k−1eli.

Page 42: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

42 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Rysunek 3.12: Opcje zakładki Wykr. rozrzutu. w analizie reszt.

Rysunek 3.13: Wykres reszt względem wartości przewidywanych (teoretycznych). Wzro-kowa ocena sugeruje stałość wariancji.

4. Obliczamy iloraz

R =S22S21, (3.5)

który ma rozkład F Snedecora z m1 = m2 = n− k − 1 stopniami swobody.

5. Testujemy prawdziwość hipotezy zerowej H0 : σ1 = σ2 wobec alternatywnej H1 :σ1 6= σ2Jeśli R < F ∗ to nie ma podstaw do odrzucenia hipotezy H0 - składnik losowy jesthomoskedastyczny, jeśli R ­ F ∗ odrzucamy H0 na rzecz H1 - występuje heteroske-dastyczność składnika losowego.

Przeprowadzenie testu Goldfelda-Quandt’a w Statistica jest bardzo proste. Zaznaczamykolumnę jednej zmiennej objaśniającej i kolumnę reszt. Następnie z menu Dane wybiera-my opcję Sortuj po czym wybieramy obie zmienne do sortowania (w oknie sortowania)

Page 43: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

3.5. BADANIE HOMOSKEDASTYCZNOŚCI 43

i opcję rosnąco. Tak posortowane reszty dzielimy na dwie grupy (opis poniżej) i wybiera-jąc Statystyka→Statystyki podstawowe i tabele wybieramy Statystyki opisowei zakładkę Więcej. Zaznaczamy opcję Wariancja (Rysunek 3.14).

Rysunek 3.14: Okno statystyk podstawowych. Do wyboru przypadków dla których chcemyobliczyć statystyki służy opcja Select Cases .

Aby wyliczyć wariancję dla poszczególnych podgrup, skorzystamy z opcji wyboru przy-padków Select Cases. Po jej wybraniu wyświetli się okno z warunkami selekcji przypad-ków (Rysunek 3.15). Selekcji możemy dokonać na dwa sposoby: albo wybierając przy-padki, dla których chcemy przeprowadzić obliczenia (Włącz przypadki) albo wybierającprzypadki, które chcemy wykluczyć z analizy (Wyłącz przypadki).

Z naszej próby wybraliśmy dwie podgrupy o liczności n = 30. Zaznaczamy więcopcję Włącz przypadki→Określone przez i w polu Numer przypadku wpisujemy za-kres pierwszej podgrupy 1− 30 (Rysunek 3.15). Wyliczona w ten sposób wariancja S21 =22.7894. Analogicznie, dla drugiej grupy wpisujemy przypadki 46 − 75 i otrzymujemywariancję S22 = 23.998 (Rysunek 3.16).

Następnie obliczamy iloraz R = S22/S21 = 1.053. Pozostaje jeszcze wyliczenie wartości

krytycznej statystyki F Snedecora. Możemy to zrobić za pomocą wbudowanego modułuStatystyka → Kalkulator prawdopodobieństwa (Rysunek 3.17). Wybieramy z listyrozkład F , następnie zaznaczamy opcję Oblicz X z p oraz ustalamy poziom istotnościna poziomie α = 0.05 (w kalkulatorze prawdopodobieństwa zaznaczamy opcję 1-p oraz wpolu p: wpisujemy 0.05 (patrz Rysunek 3.17). W polach liczby stopni swobody df 1 i df 2wpisujemy 27 (n− k − 1 = 27, Rysunek 3.17) dla obydwu podgrup i wybieramy Oblicz.

Page 44: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

44 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Rysunek 3.15: Okno selekcji przypadków uwzględnianych w analizie.

Rysunek 3.16: Obliczone wariancje podgrup

Porównując obliczoną wartość krytyczną statystyki F ∗ = 1.905 z R = 1.053 (R < F ∗)możemy stwierdzić, że nie ma podstaw do odrzucenia hipotezy H0 o homoskedastycznościskładnika losowego.

3.6 Zadania

Zadanie 1

Za pomocą testu Shapiro-Wilka zbadać normalność rozkładu zmiennych z tabeli 10.1.

Zadanie 2

Wykonaj ponownie analizę reszt rozważanego modelu. Przejdź do okna Podsumowanie→ Reszty i przewidywane. Odpowiedz na pytanie co oznaczają kolumny OdległośćMahalanobisa, Odległość Cooka (patrz np. [5, 7]) oraz Usunięte reszty. Do czegomogą przydać się te wielkości?

Page 45: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

3.6. ZADANIA 45

Rysunek 3.17: Kalkulator prawdopodobieństwa w Statistica

Page 46: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

46 ROZDZIAŁ 3. WERYFIKACJA ZAŁOŻEŃ KMNK

Page 47: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 4

Metody doboru zmiennychobjaśniających do modelu

Wprowadzenie

Wybór zmiennych objaśniających do modelu ekonometrycznego jest zadaniem niezwykleważnym. Po pierwsze, w modelu powinny znaleźć się tylko takie zmienne, które rzeczywi-ście kształtują zachowanie zmiennej objaśnianej. Ten punkt doboru zmiennych powinienbyć przeprowadzony zawsze jako pierwszy. Jeśli chcemy modelować wybrane zjawiskospołeczne, musimy dysponować odpowiednia wiedzą merytoryczną na jego temat np. nie-uzasadnionym wydaje się fakt uwzględnienia w modelowaniu zachowania rynków kursówwalut, uwzględnienie jako zmiennej objaśniającej powierzchni państwa. Wiedzy tej niemusimy zdobywać sami, często zleceniodawca dostarcza zbiór zmiennych, które uważaza potencjalnie istotne w modelowaniu danego zjawiska. Po drugie, żadna zmienna ob-jaśniające nie powinna powielać informacji wnoszonej przez inną zmienną objaśniającą(zmienne objaśniające nie powinny być ze sobą skorelowane). Po trzecie, zmienne powin-ny mieć odpowiednio duży zakres zmienności (jeśli wszystkie punkty leżą bardzo bliskosiebie, może istnieć wiele prostych, które da się dopasować do takiej chmury punktów).Jak widać, zmienna powinna spełniać wiele kryteriów aby być dobrą zmienną objaśnia-jącą. Poniżej podamy kilka metod statystycznych wyboru zmiennych objaśniających domodelu ekonometrycznego.

4.0.1 Wykresy rozrzutu

Najprostszym i szybkim sposobem wstępnej oceny jakie zmienne będą w głównej mierzekształtowały zmienność zmiennej niezależnej jest wykonanie wykresów rozrzutu zmien-nej objaśnianej względem objaśniających oraz i-tej zmiennej objaśniającej w funkcji j-tejzmiennej objaśniającej. Wykresy rozrzutu pozwalają wzrokowo ocenić czy istnieje związekpomiędzy wartościami zmiennych i czy związek ten ma charakter liniowy (przynajmniejjeśli chodzi o zmienną objaśnianą). Pamiętamy, że założeniem KMNK jest to, aby po-między zmienną objaśnianą a objaśniającymi zachodziła silna korelacja liniowa. Ponadto,zmienne objaśniające nie powinny być ze sobą skorelowane. Na Rysunkach 4.1 – 4.3 przed-stawione są wykresy rozrzutu wszystkich zmiennych względem siebie, z dopasowaną przezStatistica krzywą regresji (nie należy mylić dopasowanych do wykresu rozrzutu dwóch

47

Page 48: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

48ROZDZIAŁ 4. METODYDOBORU ZMIENNYCHOBJAŚNIAJĄCYCHDOMODELU

zmiennych krzywej regresji z wielowymiarową regresją wieloraką). Widzimy (Rysunek

Rysunek 4.1: Wykres rozrzuty zmiennej zależnej Sprzedaż od zmiennej niezależnej Indeksceny wraz z dopasowaną krzywą regresji.

4.1), że istnieje silny związek liniowy pomiędzy zmienną Sprzedaż a zmienną Indeks ceny.Możemy również stwierdzić, po znaku współczynnika dopasowanej prostej (patrz góra ry-sunku), że im niższa będzie cena, tym sprzedaż powinna rosnąć. Związek z drugą zmiennąobjaśniającą jest nieco słabszy oraz korelacja pomiędzy zmiennymi ma znak dodatni (imwięcej wydajemy na reklamę, tym większa jest sprzedaż). Ostatni z wykresów rozrzutu(Rysunek 4.3) jest równie ważny dla dalszych rozważań. Punkty na wykresie rozłożone sąprzypadkowo i trudno doszukać się związku pomiędzy tymi zmiennymi. Zatem możemyuznać (na tym etapie po dokonaniu oceny wzrokowej), że zmienne objaśniające nie są zesobą skorelowane.

4.0.2 Korelacie Pearsona

Ilościowy opis siły liniowego związku pomiędzy zmiennymi oddaje współczynnik korelacjiPearsona. Stosowanie współczynnika Pearsona do opisu korelacji ma swoje ograniczenia:

• zmienne powinny mieć rozkład normalny, lub zbliżony do normalnego,

• jest czuły na obserwacje odstające,

• wykrywa tylko liniową zależność.

Page 49: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

49

Rysunek 4.2: Wykres rozrzuty zmiennej zależnej Sprzedaż od zmiennej niezależnej Wy-datki na reklamę wraz z dopasowaną krzywą regresji.

Współczynnik Pearsona z próby (na podstawie obserwacji par zmiennych (x, y)) jestwyrażony wzorem:

rab =∑ni=1(xi − x)(yi − y)√∑n

i=1(xi − x)2√∑n

i=1(yi − y)2(4.1)

gdzie x =1n

∑ni=1 xi, y =

1n

∑ni=1 yi Wprowadzając oznaczenie na wariancję z próby S2x i

S2y oraz kowariancję covxy

S2x =1n

n∑i=1

(xi − x)2 (4.2)

S2y =1n

n∑i=1

(yi − y)2 (4.3)

covxy =1n

n∑i=1

(xi − x)(yi − y) (4.4)

otrzymujemyrxy =

covxySxSy

. (4.5)

Ponieważ covxx = Sx2 (covyy = Sy2), rxx =covxxS2x

=1.

Własności współczynnika korelacji:

Page 50: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

50ROZDZIAŁ 4. METODYDOBORU ZMIENNYCHOBJAŚNIAJĄCYCHDOMODELU

Rysunek 4.3: Wykres rozrzuty zmiennej niezależnej Indeks ceny od zmiennej niezależ-nej Wydatki na reklamę. Punkty rozłożone losowo, trudno zauważyć istnienie związkupomiędzy zmiennymi.

• rxy = ryx,

• rxy ∈ [−1, 1],

• rxx = 1.

Jeżeli |rxy| = 1 to mówimy o ścisłej zależności liniowej pomiędzy x i y, jeżeli |rxy| = 0, obraku związku liniowego.

Obliczając współczynnik korelacji, możemy na podstawie wartości korelacji określićwspółzależność zmiennych objaśnianej z objaśniającymi oraz zmiennych objaśniających zesobą. Pozwala to na wstępną eliminację z modelu zmiennych objaśniających nieskorelowa-nych ze zmienną objaśnianą, oraz na wychwycenie skorelowanych ze sobą zmiennych obja-śniających. Korelacje Pearsona w programie Statistica obliczamy wybierając Statystyka→ Statystyki podstawowe i tabele → Macierze korelacji. Otworzy się okno wy-bory zmiennych (Rysunek 4.4), w którym możemy wybrać jedną lub dwie listy zmiennych.Wybierając jedną listę zmiennych, Statistica obliczy współczynniki korelacji pomiędzywszystkimi zaznaczonymi zmiennymi (wszystkimi kombinacjami zmiennych). Wybiera-jąc drugą opcję, możemy obliczyć korelacje pomiędzy wybraną zmienną (np. zmiennąobjaśnianą) a pozostałymi zmiennymi (np. objaśniającymi) bez uwzględniania korelacjipomiędzy tymi ostatnimi.Obliczmy korelacje Pearsona pomiędzy wszystkimi zmiennymi dla rozważanego mode-lu. W oknie 4.4 wybieramy Jedna lista zmiennych, a następnie zaznaczamy wszystkie

Page 51: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

51

Rysunek 4.4: Okno korelacji programu Statistica.

zmienne i wybieramy opcję Podsumowanie w oknie 4.4. Otrzymamy okno wyników kore-lacji (Rysunek 4.5). Na podstawie obliczonych korelacji widzimy, że najsilniej ze zmiennąobjaśnianą Sprzedaż skorelowana jest zmienna Indeks ceny i jest to korelacja ujemna(im większa wartość zmiennej tym mniejsza Sprzedaż ). Możemy zatem wnioskować, żezmienna Indeks ceny w największym stopniu kształtuje zmienność zmiennej objaśnianej.Ponadto widzimy, że zmienne objaśniające (Indeks ceny i Wydatki na reklamę) są bardzo

Rysunek 4.5: Wyniki obliczeń współczynnika korelacji Pearsona. Korelacje istotne staty-stycznie (na poziomie istotności α=0.05) są automatycznie podświetlone na czerwono.

słabo skorelowane ze sobą i nie występuje pomiędzy nimi współzależność liniowa.

4.0.3 Eliminacja zmiennych kwazistałych

Jednym z najprostszych kryteriów wstępnej filtracji zmiennych jest eliminacja zmiennych,których zmienność (przedział zaobserwowanych wartości) jest mała. Zwykle, im szerszy

Page 52: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

52ROZDZIAŁ 4. METODYDOBORU ZMIENNYCHOBJAŚNIAJĄCYCHDOMODELU

zbiór wartości przyjmuje dana zmienna, tym bardziej widoczny jest charakter jej zmien-ności oraz dokładniej możemy zbadać jej związek ze zmienną objaśnianą. Wprowadza sięzatem miarę zmienności jako współczynnik zmienności

V =S

x∗ 100%, (4.6)

gdzie S jest odchyleniem standardowym z próby, a x jest średnią arytmetyczną zmiennejz próby. W odróżnieniu do odchylenia standardowego, które określa bezwzględne zróż-nicowanie cechy, V jest miarą względną. Wartości współczynnika zmienności najczęściejpodaje się w procentach. W procedurze doboru zmiennych na podstawie współczynnikazmienności, odrzuca się te cechy, których zmienność V jest mniejsza od pewnej wartościkrytycznej V ∗. Niestety nie ma uniwersalnej wartości V ∗ dla wszystkich zjawisk eko-nomicznych i wartość tą należy przyjąć arbitralnie oraz na podstawie wiedzy na tematanalizowanego zjawiska.

4.0.4 Regresja krokowa

Metoda regresji krokowej polega na sekwencyjnym doborze zmiennych do modelu, w ce-lu uzyskania najlepszego zestawu zmiennych. Istnieją dwie odmiany tej metody: regresjakrokowa postępująca oraz regresja krokowa wsteczna. W obydwu odmianach tej metodydecyzja o wprowadzeniu lub odrzuceniu zmiennej z modelu podejmowana jest na podsta-wie cząstkowego testu F Snedecora (czasami wykorzystuje się zamiast testu F Snedecorarównoważny test t-Studenta). Metoda regresji krokowej jest bardzo często stosowaną me-todą doboru zmiennych objaśniających.

Regresja krokowa postępująca

W tej odmianie regresji krokowej dobór zmiennych polega na sekwencyjnym dokładaniuzmiennych do modelu. Załóżmy, że mamy M potencjalnych zmiennych objaśniających.Wtedy procedura doboru zmiennych jest następująca:

• w pierwszym kroku tworzymy M oddzielnych modeli z jedną zmienną objaśniającąxj.

• Następnie dokonujemy sprawdzenia istotności tej zmiennej xj poprzez cząstkowytest F Snedecora. Jeśli wartość statystyki Fj jest większa od wartości progowej Fin(w programie Statistica wartość tą nazywa się F do wprowadzania, to zmienna zo-staje wprowadzona do modelu. Jeśli kilka zmiennych będzie statystycznie istotnychwprowadzana jest ta, która ma największą wartość statystyki Fin.

• W następnych krokach z pozostałych M − 1 zmiennych konstruuje się modele zdwiema zmiennymi objaśniającymi, z których jedna została wybrana w poprzed-nim korku. Analogicznie, wyznacza się statystyki Fj, a do modelu wprowadza sięzmienną, która ma największą i większą od Fin wartość statystyki F .

• Po wprowadzaniu drugiej zmiennej, ponownie bada się istotność pierwszej zmiennejw modelu z dwoma zmiennymi. Jeśli w nowym modelu ta zmienna jest nieistotna

Page 53: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

53

statystycznie lub F < Fout (Fout w programie Statistica nazywa się F do usuwa-nia), zostaje ona odrzucona, a procedurę doboru drugiej zmiennej powtarzamy zpozostałymi M − 1 zmiennymi.

• Procedurę powtarza się tak długo, aż nie wyczerpie się zbiór zmiennych lub żadnaz pozostałych zmiennych nie będzie mogła być wprowadzona ze względu na zbytmałą wartość statystyki F .

Regresja krokowa wstecz

W regresji krokowej wstecz modelem wyjściowym jest model ze wszystkimi M zmienny-mi. W kolejnych krokach usuwa się z modelu te zmienne, których wartość statystyki Fjest najmniejsza i mniejsza od wartości progowej Fout. Procedura jest powtarzana aż douzyskania najlepszego modelu.

4.0.5 Metoda Hellwiga

Metoda Hellwiga doboru zmiennych objaśniających do modelu jest metodą rodzimą i ba-zuje na sile wzajemnych korelacji liniowych, jakie istnieją pomiędzy zmienną objaśnianąi objaśniającą, oraz korelacji pomiędzy zmiennymi objaśniającymi. Spośród wszystkichmożliwych kombinacji zmiennych objaśniających wybiera się tą, w której zmienne obja-śniające są najsilniej związane ze zmienną objaśnianą a ich wzajemne korelacje są naj-słabsze.Jako miarę korelacji wykorzystuje się współczynnik korelacji Pearsona r.

Sposób doboru zmiennych do modelu jest następujący.

1. w pierwszym kroku tworzymy wszystkie możliwe kombinacje potencjalnych zmien-nych objaśniających tzn. ze zbioru wszystkich potencjalnych zmiennych x1, x2, . . . , xktworzymy L = 2k − 1 kombinacji Kl (l = 1, 2, . . . , L), zaczynając od kombinacji zjedną zmienną objaśniającą, potem z dwiema zmiennymi objaśniającymi, z trzemai tak dalej (kolejność umowna), aż do wyczerpania możliwości.

2. Dla każdej kombinacji Kl obliczamy tzw. pojemność indywidualną nośnika informa-cji :

hlj =r2j∑

i∈Kl|rij|

, (4.7)

gdzie indeks i przebiega po wszystkich numerach zmiennych należących do kom-binacji Kl, l jest numerem kombinacji, rj jest współczynnikiem korelacji Pearsonapomiędzy j-tą zmienną objaśniającą w kombinacji a zmienną objaśnianą, a rij jestwspółczynnikiem korelacji Pearsona pomiędzy i-tą i j-tą zmienną objaśniającą wdanej kombinacji.

3. Następnie, dla każdej kombinacji Kl oblicza się integralną pojemność informacyjnązdefiniowaną jako sumę pojemności indywidualnych w danej kombinacji:

Hl =∑j∈Kl

hlj, l = 1, 2, . . . , L. (4.8)

Page 54: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

54ROZDZIAŁ 4. METODYDOBORU ZMIENNYCHOBJAŚNIAJĄCYCHDOMODELU

4. Jako końcowy zestaw zmiennych objaśniających wybieramy ten, który charaktery-zuje się największą wartością integralnej pojemności informacyjnej.

Przykład

Dla danych z tabeli 10.3 dobrać zmienne do modelu za pomocą metody Hellwiga.Pierwszym krokiem jest zbadanie normalności rozkładu zmiennych, ponieważ wsp. ko-relacji Pearsona jest czuły na duże odstępstwa od rozkładu normalnego. Do tego celuużyjemy testu Shapiro–Wilka (patrz rozdział 3.3). Otrzymujemy następujące wartościp − value (tabela 4.1), na podstawie których (na poziomie istotności α=0.05) nie mapodstaw do odrzucenia hipotezy o normalności rozkładu dla każdej zmiennej. Następnie

Tabela 4.1: Obliczone p-wartości dla testu Shapiro-Wilka dla zmiennych za tabeli 10.3.zmienna p-wartość

y: poziom sportowy 0.072x1: masa ciała 0.692

x2: wytrzymałość 0.404x3: siła 0.656

obliczamy współczynniki korelacje Pearsona. Wyniki przedstawia Rysunek 4.6. Teraz mu-

Rysunek 4.6: Wyniki obliczeń współczynnika korelacji Pearsona dla danych z tabeli 10.3.

simy wypisać wszystkie możliwe kombinacje zmiennych objaśniających. Ponieważ mamytrzy potencjalne zmienne, otrzymujemy 23 − 1 = 7 kombinacji: K1 = x1, K2 = x2,K3 = x3, K4 = x1, x2, K5 = x1, x3, K6 = x2, x3, K7 = x1, x2, x3. Dla każdejkombinacji liczymy integralne pojemności informacyjne Hl.

• H1 = h11 =r21|r11|

=0.3357322

1= 0.113

• H2 = h22 =r22|r22|

=0.45568602

1= 0.21

• H3 = h33 =r23|r33|

=0.6076872

1= 0.37

• H4 = h41 + h42 =r21

|r11|+ |r12|+

r22|r22|+ |r21|

=0.113

1 + 0.202+

0.211 + 0.202

= 0.269

Page 55: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

4.1. ZADANIA 55

• H5 = h51 + h53 =r21

|r11|+ |r13|+

r23|r33|+ |r31|

=0.113

1 + 0.353+

0.371 + 0.353

= 0.357

• H6 = h62 + h63 =r22

|r22|+ |r23|+

r23|r33|+ |r32|

=0.21

1 + 0.258+

0.371 + 0.258

= 0.461

• H7 = h71 + h72 + h73

h71 =r21

|r11|+ |r21|+ |r31|=

0.1131 + 0.202 + 0.353

= 0.073

h72 =r22

|r12|+ |r22|+ |r32|=

0.210.202 + 1 + 0.258

= 0.144

h73 =r23

|r13|+ |r23|+ |r33|=

0.370.353 + 0.258 + 1

= 0.23

H7 = 0.073 + 0.144 + 0.23 = 0.447

Największą integralną pojemność informacyjną ma kombinacja K6 (H6 = 0.461), więczgodnie z ideą metody Hellwiga, w modelu powinny znaleźć się zmienne x2 i x3 (wytrzy-małość oraz siła).

4.1 Zadania

Zadanie 1

Dla danych z tabeli 10.1 dobrać zmienne do modelu stosując metodę Hellwiga.

Zadanie 2

Dla tych samych danych oszacować model stosując metodę regresji krokowej wstecz naj-pierw stosując domyślne ustawienia wartości statystyk F do wprowadzania i usuwania.Następnie zmienić wartość F do usuwania na 4 i porównać wyniki.

Page 56: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

56ROZDZIAŁ 4. METODYDOBORU ZMIENNYCHOBJAŚNIAJĄCYCHDOMODELU

Page 57: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 5

Szacowanie parametrów modeli wprzypadku autokorelacji iheteroskedastyczności

Uogólniona metoda najmniejszych kwadratów

Zgodnie z założeniami KMNK (patrz rozdział 2.4) wariancja składnika losowego jest sta-ła: D2(ε) = σ2III, gdzie III jest macierzą jednostkową. Jeśli wariancja składnika losowegonie jest stała, powyższa równość nie zachodzi. Ponadto, z uwagi na fakt, że estymatorwariancji składnika losowego S2e (XXX

TXXX)−1 staje się obciążonym estymatorem wariancjiskładnika losowego D2(ε), również macierz wariancji-kowariancji estymatorów parame-trów strukturalnych (2.46) nie jest równa DDD2(bbb) = S2e (XXX

TXXX)−1. Niespełnienie założeństałości wariancji lub braku autokorelacji składników losowych uniemożliwia stosowanieKMNK do szacowania parametrów strukturalnych modelu liniowego. Wiąże się to z utra-tą pewnych własności estymatorów: estymatory nie są już najefektywniejsze i nie mająnajmniejszej wariancji. Wariancja składników losowych, a co za tym idzie standardowebłędy szacunku, bywają niedoszacowane. Skutkuje to zawyżaniem statystyki t Studen-ta [2], na podstawie których testowana jest istotność parametrów strukturalnych modelu(w efekcie, w rzeczywistości statystycznie nieistotne parametry modelu będą wykazywałyfałszywą istotność).

W takich przypadkach należy stosować tzw. Uogólnioną Metodę Najmniejszych Kwa-dratów (UMNK), w której macierz wariancji-kowariancji składnika losowego zapisuje sięw postaci

D2(ε) = σ2ΩΩΩ, (5.1)

gdzie ΩΩΩ jest macierzą symetryczną i dodatnio określoną (UMNK można stosować jedyniew tych przypadkach, w których macierz D2(ε) da się zapisać w postaci (5.1)). Wtedyestymator parametrów strukturalnych modelu wyraża się wzorem [2]

bbb = (XXXTΩΩΩ−1XXX)−1XXXTΩΩΩ−1YYY , (5.2)

a estymator macierzy wariancji-kowariancji b jako

ΩΩΩ(bbb) = S2e (XXXTΩΩΩ−1XXX)−1, (5.3)

57

Page 58: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

58ROZDZIAŁ 5. SZACOWANIE PARAMETRÓWMODELIW PRZYPADKUAUTOKORELACJI I HETEROSKEDASTYCZNOŚCI

przy czym

S2e =eeeTΩΩΩ−1eeen− k − 1

(5.4)

jest estymatorem wariacji składnika losowego.

5.0.1 Ważona metoda najmniejszych kwadratów

Metoda ta jest szczególną postacią UMNK i stosuje się ją, gdy model jest heteroskeda-styczny i nie występują autokorelacje reszt lub w przypadkach, gdy w sposób zamierzonychcemy wzmocnić wpływ pewnych obserwacji na kształtowanie się zmiennej objaśnianej(patrz np. [5] str 82). Ideą tej metody jest zastosowanie dla każdej obserwacji nieujemnejwagi, której celem jest zrównoważenie wariacji czynnika losowego poprzez zmniejszenieznaczenia obserwacji z większą wariancją lub, w drugim przypadku, zwiększenie znacze-nia obserwacji bardziej istotnych.Ponieważ nie występują autokorelacje, macierz ΩΩΩ jest macierzą diagonalną, której elemen-ty diagonalne (w najprostszym przypadku) są równe modułom z reszt wyjściowego modeluoszacowanego KMNK (modelu z heteroskedastycznym składnikiem losowym). Macierz doniej odwrotna ΩΩΩ−1 zawiera wtedy odwrotności modułów reszt

ΩΩΩ−1 =

1|e1|

0 0 0 . . . 0 0 0

01|e2|

0 0 . . . 0 0 0

0 01|e3|

0 . . . 0 0 0

. . . . . . . . . . . . . . . . . . . . . . . .

0 0 0 0 . . . 01|en−1|

0

0 0 0 0 . . . 0 01|en|

(5.5)

Procedura ważonej MNK jest następująca: w pierwszym kroku szacujemy parametrymodelu KMNK. Następnie konstruuje się model pomocniczy, w którym rolę zmiennejobjaśniającej pełnią moduły reszt yi = |ei| wcześniej wyznaczonego modelu (zmienneobjaśniające zostawiamy takie same). Z oszacowanych wartości teoretycznych yi wyznaczasię wagi wi = 1/yi, które są diagonalnymi elementami macierzy (5.5). W kolejnym krokutworzy się model ekonometryczny

wiyi = β0wi + β1(wix1i) + . . .+ βk(wixki) + εi, (5.6)

gdzie yi są pierwotnymi obserwacjami zmiennej objaśnianej. Tak skonstruowany modelszacujemy ponownie KMNK, ponieważ estymatory parametrów strukturalnych są zgodnei asymptotycznie najefektywniejsze.

Główną zaletą tej metody jest możliwość wykorzystania regresji liniowej w sytuacjachgdy dane statystyczne są różniej jakości.

Page 59: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

59

Ważona MNK w Statistica

W programie Statistica procedurę estymacji parametrów ważoną MNK możemy przepro-wadzić albo za pomocą dołączonego do pakietu programu (modułu Statistica) napisanegow języku Visual Basic, albo ręcznie korzystając z opcji regresji.

5.0.2 Metoda Cochrane’a-Orcutta

Tą wersję UMNK stosuje się w przypadku wystąpienia autokorelacji pierwszego rzędu.Nazwa tej metody pochodzi od nazwisk dwóch statystyków: Donalda Cochrane’a i Guy’aOrcutt’a, a jej idea opiera się na transformacji autoregresyjnej pierwszego rzędu zmiennejobjaśnianej i zmiennych objaśniających, a następnie oszacowania wartości estymatorówKMNK. Załóżmy, że test Durbina-Watsona wykazał istnienie autokorelacji pierwszego rzę-du reszt modelu, oraz że współczynnik autokorelacji wynosi ρ. Transformacji pierwotnychzmiennych dokonujemy za pomocą macierzy TTT :

TyTyTy = TβXTβXTβX + TεTεTε (5.7)

gdzie macierz TTT ma postać

TTT =

√1− ρ 0 0 0 . . . 0 0 0−ρ 1 0 0 . . . 0 0 00 −ρ 1 0 . . . 0 0 0. . . . . . . . . . . . . . . . . . . . . . . .0 0 0 0 . . . −ρ 1 00 0 0 0 . . . 0 −ρ 1

(5.8)

gdzie ρ jest współczynnikiem autokorelacji wyznaczonym z próby. Po dokonaniu transfor-macji należy ponownie oszacować parametry modelu KMNK. Niestety, powyższa trans-formacja nie gwarantuje usunięcia autokorelacji reszt za pierwszym podejściem. Dlategoteż, po oszacowaniu parametrów nowego modelu, ponownie trzeba wykonać test spraw-dzający występowanie autokorelacji. W przypadku ponownego wystąpienia autokorelacjipowyższą metodę należy zastosować ponownie.

Page 60: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

60ROZDZIAŁ 5. SZACOWANIE PARAMETRÓWMODELIW PRZYPADKUAUTOKORELACJI I HETEROSKEDASTYCZNOŚCI

Page 61: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 6

Prognozowanie na podstawie modeluekonometrycznego

Wszystkie poprzednie rozdziały skryptu były poświęcone zagadnieniom związanym z two-rzeniem modelu ekonometrycznego. W tym rozdziale omówimy krótko praktyczne zasto-sowanie modelu ekonometrycznego. Najczęstszym wykorzystaniem oszacowanego i zwery-fikowanego modelu ekonometrycznego jest predykcja ekonometryczna, czyli wnioskowaniena podstawie modelu o przyszłych, nieznanych wartościach zmiennej objaśnianej. Ogra-niczymy się do jednorównaniowego liniowego modelu ekonometrycznego.

Prognoza nie zawsze musi dotyczyć zjawisk zależnych od czasu (przyszłości), chociażtakie wykorzystanie modeli jest najczęstsze. Może również dotyczyć wartości zmiennej ob-jaśnianej dla nieznanych, np. większych niż zaobserwowane w próbie, wartości zmiennychobjaśniających.

Zmienna objaśniana, dla której konstruuje się prognozę, nazywa się zmienną progno-zowaną, natomiast okres (lub przedział wartości, jeśli prognoza nie dotyczy przedziałuczasu) nazywa się horyzontem prognozy.

Założenia teorii predykcji

Podobnie, jak w przypadku modeli ekonometrycznych, aby predykcja ekonometrycznabyła formalnie (statystycznie) poprawna, muszą być spełnione pewne założenia:

• wartości estymatorów parametrów strukturalnych, w którym zmienna prognozowanajest zmienną objaśnianą, są znane (oszacowane)

• model ekonometryczny jest pozytywnie zweryfikowany

• wartości zmiennych objaśniających dla horyzontu prognozy są znane lub oszacowane

• rozkład składnika losowego jest stacjonarny

• postać analityczna modelu i jego parametry strukturalne są stabilne

61

Page 62: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

62ROZDZIAŁ 6. PROGNOZOWANIE NA PODSTAWIEMODELU EKONOMETRYCZNEGO

Prognoza punktowa

Załóżmy, że chcemy przewidzieć wartość zmiennej objaśnianej (prognozowanej) y∗, dlawartości danych wektorem zmiennych objaśnianych XXX∗. Jeśli wyjściowy model ekonome-tryczny ma postać

y = XTβββ + ε, (6.1)

to prognozowana wartość y∗ jest równa [3]

y∗ = (X∗)T βββ + ε0, (6.2)

gdzie wektor zmiennych objaśniających X∗ jest równy

X∗ =

1x1x2...xk

. (6.3)

Uwaga

W równaniu (6.2) występuje transponowany wektor X∗, wobec czego iloczyn (X∗)T βββ jestiloczynem skalarnym dwóch wektorów.Z twierdzenia Gaussa-Markowa (rozdział 2.5) wiemy, że

y = (X)T bbb (6.4)

jest najefektywniejszym, nieobciążonym estymatorem wartości oczekiwanej zmiennej ob-jaśnianej E(y|X) (lub po prostu y - z własności nieobciążoności). Podobnie, prognoza yp

yp = (X∗)T bbb (6.5)

jest najefektywniejszym, nieobciążonym estymatorem wartości oczekiwanej prognozy E(y∗|X∗)(lub y∗).

Wtedy błąd prognozy możemy wyrazić jako różnicę

ep = y∗ − yp = (βββ − bbb)TX∗ + ε0, (6.6)

a wariancja reszt jest równa [2]

D2(ep) = σ2(1 + (X∗)T (XXXTXXX)−1X∗

). (6.7)

Estymatorem wariancji (6.7) jest

S2(ep) = S2e(1 + (X∗)T (XXXTXXX)−1X∗

), (6.8)

gdzie S2e jest wariancją reszt modelu. Wtedy średni błąd predykcji ex ante dany jestjako odchylenie standardowe błędu prognozy

V ∗ =√S2(ep) = Se

√1 + (X∗)T (XXXTXXX)−1X∗ (6.9)

Błąd predykcji ex ante oznacza błąd jaki możemy popełnić stosując prognozę za-nim poznamy prawdziwą (zaobserwowaną) wartość zmiennej prognozowanej. Jeśli znamyprawdziwą wartość prognozowanej zmiennej, możemy ją porównać z wcześniejszą progno-zą i otrzymamy błąd predykcji ex post .

Page 63: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

63

Prognoza przedziałowa

W poprzednim rozdziale zajmowaliśmy się tzw. prognozą punktową, czyli predykcją do-kładnej wartości zmiennej prognozowanej. Innym rodzajem prognozy jest prognoza prze-działowa. Polega ona na wyznaczeniu przedziału ufności dla prognozowanej wartościzmiennej y∗. Wykorzystujemy w tym celu średni błąd predykcji ex ante (6.9):

(yp − t∗V ∗, yp + t∗V ∗) , (6.10)

gdzie yp jest prognozą punktową, V ∗ średnim błędem predykcji ex ante, a t∗ jest wartościąstatystyki t-Studenta dla n− k − 1 stopni swobody, dla której

P (yp − t∗V ∗ < y∗ < yp + t∗V ∗) = 1− α, (6.11)

α jest zadanym poziomem istotności. Przedział (6.10) nazywamy 1−α procentowym prze-działem predykcji (lub 1 − α procentowym przedziałem ufności dla predykcji). Mówimywtedy, że z prawdopodobieństwem 1 − α, prawdziwa wartość zmiennej prognozowanejznajduje się w tym przedziale.

Page 64: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

64ROZDZIAŁ 6. PROGNOZOWANIE NA PODSTAWIEMODELU EKONOMETRYCZNEGO

Page 65: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 7

Nieliniowe modele ekonometryczne

Wstęp

W poprzednich rozdziałach do opisu zjawisk ekonomicznych, a dokładniej do ich modelo-wania, stosowaliśmy klasyczną metodę regresji liniowej. Jednym z założeń tej metody jestistnienie liniowego związku pomiędzy zmiennymi objaśniającymi a zmienną objaśnianą.Dlatego, jak już napisaliśmy w poprzednich rozdziałach, niezwykle ważnym etapem mo-delowania ekonometrycznego jest określenie charakteru związku pomiędzy zmienną obja-śnianą i objaśniającymi. Można to zrobić wzrokowo tworząc wykresy rozrzutu zmiennych.Na etapie stosowania KMNK wystarczy nam jedynie odpowiedź na pytanie czy związekjest liniowy czy nie.Co zrobić w przypadku, gdy związek ten nie ma charakteru liniowego? Zdarza się tak np.przy opisie relacji dochody-wydatki, czy w opisie produkcji. W tych przypadkach niestetynie możemy użyć KMNK do analizy. Są jednak (dla pewnej klasy przypadków) metody,które pozwalają na sprowadzenie modelu nieliniowego do modelu liniowego. Transforma-cja, która pozwala przejść z modelu nieliniowego do liniowego nosi nazwę linearyzacji. Wnastępnym rozdziale będziemy omawiać właśnie takie modele.

7.1 Linearyzowalne modele ekonometryczne

Jak już napisaliśmy, modele linearyzowalne to takie, które przy pomocy pewnej transfor-macji da się sprowadzić do modelu liniowego. Wtedy do estymacji parametrów modelumożemy użyć KMNK. Wydaje się więc, że problem nieliniowości jest łatwo rozwiązywal-ny. Niestety praktyka wygląda nieco inaczej, ponieważ aby dokonać linearyzacji modelu,musimy najpierw określić charakter związku nieliniowego tzn. określić jakiego typu funk-cja (np. wielomianowa, wykładnicza czy logarytmiczna) najlepiej pasuje opisuje zależnośćpomiędzy zmiennymi. Po raz kolejny, bardzo pomocny jest wykres rozrzutu, z któregomożemy z grubsza oszacować charakter związku. Jeśli nie ma pewności co do postacianalitycznej np. mamy dwie lub trzy możliwości, wtedy najlepiej oszacować model dlawszystkich przypadków i wybrać ten, który charakteryzuje się najlepszym dopasowaniemdo danych empirycznych.

W Tabeli 7.1 podaliśmy kilka typów związków nieliniowych wraz z odpowiednią trans-formacją i modelem po transformacji.

65

Page 66: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

66 ROZDZIAŁ 7. NIELINIOWE MODELE EKONOMETRYCZNE

Tabela 7.1: Tabela transformacji modeli nieliniowych do modeli liniowych. Źródło [5].Postać matematyczna Transformacja Model po transformacji

Y = aXb a′ = log a,Y ′ = log Y ,X ′ = logX Y ′ = a′ + bX ′

Y = abX Y ′ = log Y , a′ = log a, b′ = log b Y ′ = a′ +Xb′

Y = a+ bX + cX2 X1 = X,X2 = X2 Y = a+ bX1 + c+X2Y = a0 + a1X + a2X

2 . . . anXn X1 = X,X2 = X2, . . . Xn = Xn Y = a0 + a1X1 + . . . anXn

Y = a+ bX

X ′ = 1/X Y = a+ bX ′

Y =aX

b+XY ′ = 1/Y,X ′ = 1/X Y = 1

a+ b

aX ′

Y = a+ b lnX X ′ = lnX Y = a+ bX ′

Program Statistica dostarcza szereg narzędzi wspomagających pracę z nieliniowymimodelami ekonometrycznymi począwszy od możliwości dopasowania różnego typu krzy-wych do danych empirycznych (co ułatwia określenie postaci związku funkcyjnego) ponarzędzia do transformacji zmiennych i linearyzowania modelu. Zobrazujmy to przykła-dem. Dane do przykładu znajdują się w Tabeli 10.2 w rozdziale 10.Zaczynamy od wykresu rozrzutu zmiennych. Z menu Wykresy wybieramy Wykres rozrzutu

Rysunek 7.1: Wykres rozrzutu zmiennych z Tabeli 10.2. Na pierwszy rzut oka widać, żenie jest to funkcja liniowa.

2W, po czym wybieramy zmienne do wykresu. W głównym menu wykresów rozrzutu odzna-czamy opcję Dopasuj: liniowa (aby samodzielnie spróbować określić rodzaj zależności).Otrzymujemy wykres przedstawiony na Rysunku 7.1.

Page 67: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

7.1. LINEARYZOWALNE MODELE EKONOMETRYCZNE 67

Rysunek 7.2: Zaawansowane opcje wykresów rozrzutu pozwalają wybrać funkcję anali-tyczną, która ma być dopasowana do danych z wykresu.

Skorzystajmy teraz z zaawansowanych opcji wykresów rozrzutu. W głównym oknieWykres rozrzutu 2W wybieramy zakładkę Więcej i z okna Dopasuj wybieramy jedną zfunkcji (Rysunek 7.2), które Statistica ma dopasować do danych empirycznych. Wynikitej operacji dla kilku różnych funkcji zamieszczone są na rysunkach poniżej (Rysunki7.3,7.4,7.5,7.6).

Widać, że funkcja wielomianowa pasuje do danych najlepiej. W oknie wykresu może-my zobaczyć wzór analityczny dopasowanej funkcji. Ma on ogólną postać Y = aX + bX2.Odpowiada to funkcji Funkcja kwadratowa z Tabeli 7.1. Dokonamy więc podanej w tejtabeli transformacji zmiennej X a następnie przeprowadzimy estymację parametrów mo-delu.Z menu Statystyka wybieramy Zaawansowane modele liniowe i nieliniowe → Linearyzowanaregresja nieliniowa, a następnie wybieramy zmienne do modelu (zmienną X oraz Y )i klikamy OK. Na ekranie pojawi się okno wyboru transformacji nieliniowych, w które-go zaznaczamy opcję X**2. Następnie przechodzimy do wyboru zmiennych objaśnianeji objaśniających, gdzie zaznaczamy jako objaśnianą Y , a jako zmienne objaśniające Xoraz V 1 ∗ ∗2 (Rysunek 7.7). Jak widać, po zaznaczeniu odpowiedniego typu transforma-cji, Statistica stworzyła nowe zmienne (przetransformowane), których kolejność jest takasama jak kolejność oryginalnych zmiennych (V 5 ∗ ∗2 to przetransformowana zmienne X,V 6 ∗ ∗2 to przetransformowana zmienna Y ). W kolejnym kroku wybieramy opcję OK woknie regresji, w wyniku czego otrzymujemy wynikowy model (Rysunek 7.8).

Jak widać zarówno cały model (statystyka F) jak i wszystkie parametry modelu sąistotne, model jest bardzo dobrze dopasowany (Poprawione R2 = 0.95). Przetransformo-wany model możemy zapisać w postaci

Y = 4.67 + 0.05X − 0.000036X2 ± 1.17 (7.1)

Page 68: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

68 ROZDZIAŁ 7. NIELINIOWE MODELE EKONOMETRYCZNE

Rysunek 7.3: Wykres rozrzutu z dopasowaną funkcją liniową.

Model trzeba jeszcze zweryfikować pod względem normalności rozkładu reszt. W tymprzypadku reszty mają rozkład normalny. a ich wartość średnia jest równa 0 (sprawdzeniepozostawiamy Czytelnikowi).

Page 69: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

7.1. LINEARYZOWALNE MODELE EKONOMETRYCZNE 69

Rysunek 7.4: Wykres rozrzutu z dopasowaną funkcją logarytmiczną.

Rysunek 7.5: Wykres rozrzutu z dopasowaną funkcją wykładniczą.

Page 70: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

70 ROZDZIAŁ 7. NIELINIOWE MODELE EKONOMETRYCZNE

Rysunek 7.6: Wykres rozrzutu z dopasowaną funkcją wielomianową.

Rysunek 7.7: Okno wyboru zmiennych do modelu zlinearyzowanego.

Rysunek 7.8: Okno wynikowe regresji liniowej dla modelu zlinearyzowanego.

Page 71: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

7.1. LINEARYZOWALNE MODELE EKONOMETRYCZNE 71

Rysunek 7.9: Okno podsumowania regresji liniowej dla modelu zlinearyzowanego.

Page 72: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

72 ROZDZIAŁ 7. NIELINIOWE MODELE EKONOMETRYCZNE

Page 73: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 8

Funkcja produkcji

8.1 Wstęp

Jednym z zadań ekonometrii jest analiza i modelowanie procesu produkcyjnego. W szcze-gólności dotyczy to analizy zależności pomiędzy nakładami i zasobami produkcyjnymi aefektami (wielkością) produkcji. Głównym narzędziem ekonometrycznym stosowanym wtej analizie jest funkcja produkcji. Funkcja produkcji jest modelem ekonometrycznym (naj-częściej nieliniowym), w którym zmienną objaśnianą jest wielkość produkcji, a zmiennymiobjaśniającymi są nakłady poszczególnych czynników produkcji. Dwoma najważniejszymiczynnikami produkcji są:

• praca L - rozumiana jako siła robocza (w tym również kapitał ludzki od któregozależy jakość pracy)

• kapitał K - np. pieniądz, budynki, samochód itp..

Innym czynnikiem produkcji (w zależności od typu produkcji) są surowce, z których pro-dukowane są dobra. Surowce można również klasyfikować jako kapitał produkcyjny. Wekonomii klasycznej (do początków XXw) podstawowym czynnikiem produkcji była rów-nież ziemia, lecz dziś traktowana jest jako składowa kapitału produkcyjnego.

Czynniki produkcji charakteryzują się tym, że mogą być (do pewnego stopnia) wza-jemnie zastępowane, oraz że w procesie produkcji wytwarzają nową wartość. Ponadto, sąone wyczerpywalne tzn. w procesie produkcji następuje ich zużycie i muszą być odnawiane.Proces odnawiania czynników produkcji nazywa się inwestowaniem.

W ogólnym zapisie matematycznym funkcję produkcji możemy wyrazić jako

y = f(L,K), (8.1)

gdzie y jest wielkością produkcji.

8.1.1 Zastosowanie funkcji produkcji

Badanie funkcji produkcji sprowadza się do wyznaczenia jej charakterystyk:

73

Page 74: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

74 ROZDZIAŁ 8. FUNKCJA PRODUKCJI

• produktu całkowitego PC,Produkt całkowity jest to teoretyczna wartość produkcji przy ustalonych lub pro-gnozowanych nakładach K i L

PC = y (8.2)

• produktu przeciętnego PPiProdukt przeciętny to przeciętna wielkość produkcji przypadająca na jednostkę i-tego czynnika produkcji przy ustalonych pozostałych czynnikach produkcji:

PPi =y

xi, (8.3)

gdzie PPi jest produktem przeciętnym względem i-tego czynnika produkcji, y -produkt całkowity, xi - i-ty czynnik produkcji.

• produktu krańcowego PKi

Produkt krańcowy (marginalny) to przyrost wielkości produkcji spowodowany przy-rostem i-tego czynnika produkcji, przy niezmienionych pozostałych czynnikach pro-dukcji.

PKi =∆y∆xi

(8.4)

• elastyczności produkcji Ei,Elastyczność produkcji względem i-tego czynnika produkcji to względna zmianawielkości produkcji na skutek zmiany i-tego czynnika produkcji o jeden procent,przy stałych pozostałych czynnikach produkcji

Ei =∆yy

:∆xixi

=xiy

∆y∆xi

=PKi

PPi(8.5)

• efektu skali produkcji ESP ,Efekt skali produkcji informuje o ile procent wzrośnie wielkość produkcji, jeżeli war-tość wszystkich czynników produkcji wzrośnie jednocześnie o 1%

ESP =k∑i=1

Ei. (8.6)

– Jeżeli ESP < 1 to mówimy o malejącej wydajności czynników produkcji(produkcja wzrasta wolniej niż nakłady),

– jeżeli EPS = 1 to mówimy o stałej wydajności czynników produkcji(produkcja wzrasta w tym samym tempie co nakłady)

– jeżeli EPS > 1 to mówimy o rosnącej wydajności czynników produkcji(produkcja wzrasta szybciej niż nakłady)

Page 75: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

8.2. FUNKCJA PRODUKCJI COBBA-DOUGLASA 75

8.2 Funkcja produkcji Cobba-Douglasa

Jedną z ważniejszych funkcji produkcji jest funkcja Cobba-Douglasa. Sformułowana przezszwedzkiego ekonomistę Knuta Wicksel’a została zweryfikowana na danych empirycznychprzez Paula Douglasa i Charlesa Cobba. Oryginalna postać funkcji uwzględniała dwagłówne czynniki produkcji : pracę i kapitał:

y = f(K,L) = β0Kβ1Lβ2eε, (8.7)

gdzie K,L ­ 0 oznaczają odpowiednio kapitał i pracę, a parametry β0, β1, β2 mają war-tości dodatnie, ε oznacza czynnik losowy.

Funkcję Cobba-Douglasa możemy uogólnić na większą liczbę czynników kształtującychprodukcję. Zapisujemy ją wtedy w postaci:

f(x1, x2, . . . , xk) = β0xβ11 x

β22 . . . x

βkk e

ε = β0eεk∏j=1xβjj (8.8)

Własności funkcji Cobba-Douglasa

• jest nieujemna,

• jest rosnąca ze względu na każdy xi

Dalsza cześć rozdziału będzie poświęcona oryginalnej wersji (8.7) funkcji Cobba-Douglasa,tzn. funkcji z dwoma czynnikami produkcji.

8.2.1 Linearyzacja funkcji Cobba-Douglasa

Funkcję Cobba-Douglasa można przetransformować do postaci liniowej i szacować jejparametry KMNK. Logarytmując obustronnie równanie (8.7) otrzymamy jego liniowąwersję

ln y = ln b0 + b1 lnK + b2 lnL, (8.9)

gdzie bi są estymatorami parametrów βi.

Dla zlinearyzowanej funkcji Cobba-Douglasa (np. dla 8.9) elastyczność produkcji Ei =bi, wobec czego efekt skali produkcji można zapisać jako ESP = b1 + b2 + . . .+ bk.

Izokwanta

Jeżeli funkcja produkcji jest funkcją dwóch czynników produkcji, to relację pomiędzy wiel-kością produkcji a tymi czynnikami możemy przedstawić na płaszczyźnie za pomocą tzw.izokwanty. Jak już napisaliśmy, czynniki produkcji mogą się do pewnego stopnia zastępo-wać. Z tego powodu, tę samą ilość produkcji możemy otrzymać dla różnych kombinacjipracy i kapitału. Zbiór wszystkich kombinacji pracy i kapitału, które dają taką samąwielkość produkcji jest właśnie izokwantą (Rysunek 8.1). Im dalej znajduje się krzywaod początku układu współrzędnych, tym większa jest produkcja. Izokwantę nazywa sięrównież krzywą jednakowej produkcji.

Page 76: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

76 ROZDZIAŁ 8. FUNKCJA PRODUKCJI

Rysunek 8.1: Przykłady izokwant. Na osiach znajdują się czynniki produkcji, każda krzywareprezentuje stałą wielkość produkcji dla różnych kombinacji nakładów.

Page 77: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 9

Ekonometryczna analiza rynku ipopytu konsumpcyjnego

Ekonometryczna analiza rynku jest jedną z głównych analiz ekonometrycznych i jednąz ważniejszych. Pojęcie to jest bardzo szerokie. Może dotyczyć np. analizy rynków pra-cy, popytu i podaży, analizy rynków finansowych lub walutowych. Niniejszy rozdział jestkrótkim wprowadzeniem do szerokiego tematu, jakim jest zastosowanie modeli ekonome-trycznych do badania rynków. Zainteresowanym szczególnie rynkami finansowymi poleca-my dwie prace dostępne na stronie www.ekonofizyka.pl w zakładce Skrypty dla studentów :”Wprowadzenie do funkcjonowania rynków finansowych”, ”Wybrane zagadnienia anali-zy rynków finansowych”, a także pracę ”Komputerowe modelowanie zjawisk rynkowych”(również na www.ekonofizyka.pl).

9.1 Podstawowe pojęcia

Popyt to skłonność nabywcy do zakupu określonej ilości dobra lub usługi. Określa on, jakdużo danego dobra lub usługi nabywca (rynek) jest skłonny kupić po określonej cenie.Poziom popytu na dany towar wyznaczany jest zarówno przez czynniki rynkowe, takiejak cena towaru lub usługi, poziom dochodu nabywców oraz ich oczekiwania, ceny innychtowarów, jak również przez czynniki pozarynkowe np. upodobania nabywców, poziomwykształcenia lub płeć. Matematyczny opis omawianej zależności nazywa się funkcją(krzywą) popytu.

Funkcje popytu są niezwykle przydatne. Pozwalają zobrazować, i w dużym stopniuprzewidzieć, jak rynek reaguje na zmianę cen i przychodów. Załóżmy, że przychód konsu-menta rośnie. Czy będzie on nabywał więcej czy mniej dobra x1? Jeśli będzie nabywał gowięcej, wtedy dobro x1 nazywa się dobrem normalnym (Rysunek 9.1, panel lewy). Jeślibędzie nabywał go mniej, wtedy takie dobro nazywamy dobrem podrzędnym (Rysunek 9.1,panel prawy).

Jak zmieni się sytuacja jeśli zamiast przychodu konsumenta wzrośnie cena produktu?Musimy tu rozważyć dwa przypadki: gdy zmieni się cena dobra, które chcemy nabyć(x1), oraz przypadek gdy zmieni się cena innego dobra (x2). W przypadku pierwszym,gdy cena dobra x1 rośnie a popyt na to dobro spada, to dobro takie nazywamy dobremzwyczajnym, a gdy popyt na dobro x1 rośnie (wraz z rosnącą ceną), dobro takie nazywamy

77

Page 78: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

78ROZDZIAŁ 9. EKONOMETRYCZNA ANALIZA RYNKU I POPYTUKONSUMPCYJNEGO

Rysunek 9.1: Wykres zależności popytu od dochodu. Lewy panel: popyt na dobra nor-malne, prawy panel: popyt na dobra podrzędne.

Rysunek 9.2: Wykres zależności popytu od dochodu. Zależność przedstawia popyt nadobra normalne.

dobrem Giffena (Rysunek 9.2).W przypadku drugim, jeśli popyt na dobro x1 rośnie wraz ze wzrostem ceny innego

dobra x2, to dobra takie nazywamy substytucyjnymi. Jeśli cena jednego z nich rośnie,zastępujemy dobro x1 je innym, tańszym (x2).

Badanie związków popytu z czynnikami kształtującymi popyt nazywa się badaniemelastyczności popytu, a siłę związku współczynnikiem elastyczności popytu. Ze względu naczynnik kształtujący popyt, możemy wyróżnić dwa rodzaje elastyczności popytu: docho-dową i cenową.

Cenowa elastyczność popytu

Ed(p) =∆Q/Q∆P/P

(9.1)

gdzie ∆Q/Q jest procentową zmianą zapotrzebowania na dane dobro, a ∆P/P jest pro-centową zmianą ceny dobra. ∆Q (∆P )- przyrost zapotrzebowania (ceny) na produkt, Q(P ) - zapotrzebowanie (cena produktu) na produkt przed zmianą.

Współczynnik elastyczności Ed(p) interpretujemy następująco: np. jeśli cena produk-tu wzrośnie o 5% a popyt na produkt zmaleje o 5%, wtedy elastyczność popytu dlapoczątkowej ceny i popytu Ed(p) = −1; jeśli cena produktu wzrośnie o 5% a popyt na pro-dukt również wzrośnie o 5%, wtedy elastyczność popytu dla początkowej ceny i popytuEd(p) = 1.

Page 79: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

9.1. PODSTAWOWE POJĘCIA 79

Wartość Interpretacja|Ed()| = 0 popyt doskonale nieelastyczny (sztywny)

0 < |Ed()| < 1 popyt relatywnie nieelastyczny (słabo elastyczny)|Ed()| = 1 popyt proporcjonalny|Ed()| > 1 popyt elastyczny

Tabela 9.1: Zestawienie wartości bezwzględnych współczynników elastyczności popytuoraz ich interpretacja.

Rysunek 9.3: Graficzne przedstawienie prawa Engla. Źródło:www.wikipedia.org

Dochodowa elastyczność popytu

Ed(i) =∆Q/Q∆I/I

(9.2)

gdzie ∆Q/Q jest procentową zmianą zapotrzebowania na dane dobro, a ∆I/I jest pro-centową zmianą dochodu nabywców, ∆I- przyrost dochodu, I - wielkość dochodu przedzmianą.

Elastyczność popytu klasyfikuje się na podstawie bezwzględnej wartości współczynni-ków elastyczności. Ich zestawienie, wraz z interpretacją przedstawia Tabela 9.1.

9.1.1 Ekonometryczne modele popytu dochodowego

W XIX wieku, niemiecki ekonomista i statystyk Ernst Engel prowadził badania dotyczącezmian wydatków na żywność pod wpływem zmian dochodów. Doszedł on do wniosku, żewraz ze zwiększaniem się dochodu, względny udział wydatków na żywność w ogólnychwydatkach maleje. Prawo to jest prawem empirycznym i nosi nazwę Prawa Engla.

Krzywe stosowane do opisu zależności pomiędzy dochodem a popytem (wydatkami)nazywane są krzywymi Engla. Poniżej prezentujemy postacie funkcyjne najczęściej stoso-wanych krzywych [2]:

• postać liniowayi = b0 + b1xi + . . .+ bkxki, (9.3)

• postać potęgowayi = b0x

b11ix

b22i . . . x

bkki , (9.4)

Page 80: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

80ROZDZIAŁ 9. EKONOMETRYCZNA ANALIZA RYNKU I POPYTUKONSUMPCYJNEGO

które można sprowadzić do postaci liniowej przez obustronne logarytmowanie.

• funkcja Workinga (postać wykładnicza z odwrotnością)

yi = exp(b0 + b1

1x1i

+ . . .+ bk1xki

), (9.5)

którą można sprowadzić do postaci liniowej przez obustronne logarytmowanie i pod-stawienie x = 1/x. Przetransformowany model ma postać yi = b0+b1x1i+. . .+bkxki.

Dysponując liniową wersją modelu, możemy oszacować jego parametry klasyczną me-todą najmniejszych kwadratów. Metoda ta jest dostępna w Statistica w menu Statystyka→Regresjawieloraka. Możemy również skorzystać z opcji linearyzowalnych modeli regresji, lub sa-modzielnie wybrać specyfikację modelu.

Page 81: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Rozdział 10

Dodatek

81

Page 82: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

82 ROZDZIAŁ 10. DODATEK

Tabela 10.1: Tabela z danymi wykorzystanymi do konstrukcji modelu w rozdziale 2.8.Oznaczenia: Y - Sprzedaż [tys. $], X1 - Indeks ceny [tys. $], X2 - wydatki na reklamę[tys.$]. Źródło: dane przykładowe z programu Gretl.

Y X1 X2 Y X1 X2 Y X1 X286.1 4.83 2.9 76.5 5.35 2.3 73.7 6 2.984.1 4.86 2.9 82.1 5.37 2.8 73.7 6.02 2.284.7 4.89 3.1 86.1 5.41 2.4 75 6.05 2.283.8 4.94 0.9 81.3 5.45 2 82.2 6.14 2.783.9 4.96 1.1 67.6 5.46 1 84.3 6.16 1.583.3 4.98 0.6 76.6 5.48 2.8 76.4 6.2 380.6 5.02 2 69.9 5.54 0.5 67.4 6.22 0.789.3 5.02 1.5 73.7 5.56 1 74.4 6.22 1.387.6 5.04 2.1 75.7 5.59 2.1 79.2 6.22 1.280.4 5.05 2.9 79.5 5.62 1.2 78.1 6.24 1.973.1 5.08 1.3 62.4 5.63 0.8 81 6.24 0.784.2 5.08 2.8 73.7 5.68 0.9 73.2 6.25 1.788.1 5.1 2.1 73.2 5.69 1.3 69 6.33 3.191.2 5.1 1.6 78.8 5.69 3 73.7 6.35 1.474.2 5.11 0.7 78.1 5.7 0.7 71.2 6.37 0.586.5 5.11 2.5 75.4 5.71 0.7 73.6 6.39 3.184.3 5.2 2.3 82.2 5.73 1.7 68.7 6.41 1.175 5.21 0.8 79.7 5.76 2.3 70.3 6.41 1.3

80.3 5.22 1.7 81.2 5.83 1.8 80.2 6.41 3.188 5.22 1.6 73.2 5.85 1.8 68.6 6.45 2.8

73.6 5.23 0.8 75.2 5.86 3.1 69.1 6.47 2.781 5.23 1.1 73.7 5.88 1.1 69.7 6.47 1.9

80.2 5.28 3.1 70.7 5.89 1.5 75.7 6.47 2.584.7 5.33 2.1 66 5.93 2.8 64.5 6.49 0.585.9 5.34 1.8 71.8 5.98 1.5 71.8 6.49 2.9

Page 83: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

83

Tabela 10.2: Dane do modelu przykłady z modelem zlinearyzowanym, Źródło: opracowaniewłasne.

X Y X Y X Y235 14.870 264 16.411 470 23.197274 15.063 413 20.932 292 18.968206 14.066 355 19.972 136 12.012164 13.959 304 17.261 403 22.283153 13.730 191 13.682 109 9.709391 18.192 387 20.459 362 17.314399 19.376 227 16.272 250 13.914247 17.445 64 8.240 181 14.126213 13.427 49 7.840 328 16.119434 18.333 382 18.958 466 18.997297 16.027 491 23.045 118 9.777273 17.845 200 14.001 325 20.011440 19.088 29 5.224 49 7.420426 21.053 219 13.911 491 23.045215 13.343 258 15.259 345 18.01737 5.839 375 19.171 279 18.708396 20.099 298 17.608 56 7.70822 4.128 472 21.943 97 9.947235 15.176 80 9.928 257 16.35287 8.301 424 22.239 134 12.386442 21.655 271 14.980 483 23.076189 13.335 160 13.788 292 18.113296 17.377 187 13.265 212 15.143146 11.237 286 17.081 200 13.859130 12.086 438 20.091 389 21.301159 12.105 68 7.751 371 18.491

99 10.945

Page 84: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

84 ROZDZIAŁ 10. DODATEK

Tabela 10.3: Dane do użyte do wyznaczenia zmiennych modelu metodą Hellwiga. Źródło:opracowanie własne.

poziom sportowy masa ciała wytrzymałość siła5 76.6 52.5 285 63.7 45 40

4.75 60.5 25 374.75 70.7 30 35

5 63.8 40 384.25 69.2 20 334.5 66.2 40 214 69.8 40 29

4.5 74.7 30 294.25 67.8 50 244.25 72.5 30 293.75 65.9 40 26.54.25 67.2 32.5 18

4 65.5 20 204.25 62.9 40 294.25 71.7 40 214.25 67.8 15 273.75 72.6 42.5 33

4 75.8 22.5 123.75 80.3 253.75 82.4 20 213.5 74.8 12.5 333.25 77.2 25 173.25 78.5 20 15

3 66.8 28 193 73.3 30 30

3.25 76.7 35 173 66.7 15.5 193 68 27.5 11

Page 85: Wybrane zagadnienia ekonometrii z wykorzystaniem programu ...

Bibliografia

[1] S. Bartosiewicz, M. Czekała, J. Dziechciarz, K. Jajuga, E. Nowak, Z. Panasiewicz, W.Pluta, C. Szmigiel ”Estymacja modeli ekonometrycznych”, Wydawnictwo NaukowePWN 1989

[2] B. Borkowski, H, Dudek, W. Szczesny ”Ekonometria wybrane zagadnienia”, Wydaw-nictwo Naukowe PWN 2003

[3] W. H. Greene, ”Econometric analisys”, Prentice Hall, New Jersey 2002

[4] M. Gruszczyński, T. Kuszewski, M. Podgórska ”Ekonometria I Badania Operacyjne.Podręcznik Dla Studiów Licencjackich”, Wydawnictwo Naukowe PWN 2009

[5] Andrzej Stanisz ”Przystępny kurs statystyki z zastosowaniem STATISTICA PL naprzykładach z medycyny”, Tom 1 i 2, StatSoft Polska 2006

[6] J. Syska, Metoda najwiekszej wiarygodnosci i informacja Fisher’a w fizyce i ekonofi-zyce

[7] J. Syska, Współczesne metody analizy regresji wspomagane komputerowo

85