Download - PROGNOZOWANIE GOSPODARCZE

Natalia Iwaszczuk, Piotr Drygaś, Piotr Pusz, Radosław Pusz

PROGNOZOWANIE

GOSPODARCZE

Wyd-wo, Rzeszów 2013

2

dr hab., prof. nadzw. Natalia Iwaszczuk, AGH Akademia Górniczo-Hutnicza

im. Stanisława Staszica w Krakowie

dr Piotr Drygaś, Uniwersytet Rzeszowski

dr Piotr Pusz, Uniwersytet Rzeszowski

mgr Radosław Pusz, Bank Pekao SA

Recenzenci:

prof. dr hab. Wladimir Mitiuszew, Uniwersytet Pedagogiczny

im. Komisji Edukacji Narodowej w Krakowie

dr hab., prof. nadzw. Mariusz Kudełko, AGH Akademia Górniczo-Hutnicza

im. Stanisława Staszica w Krakowie

3

Spis treści Wstęp …………………………………………………………………………………………7 ROZDZIAŁ I Modele ekonometryczne podstawowym instrumentem prognozowania gospodarczego……...9

1.1. Ekonometria jako dyscyplina naukowa ........................................................................... 9

1.2. Rola i rodzaje danych statystycznych wykorzystywanych w ekonometrii ................... 10

1.3. Modele ekonometryczne i ich klasyfikacja ................................................................... 12

1.3.1. Modele jedno- i wielorównaniowe ......................................................................... 13

1.3.2. Modele statyczne i dynamiczne .............................................................................. 14

1.3.3. Modele stochastyczne i deterministyczne ............................................................... 14

1.3.4. Modele liniowe i nieliniowe ................................................................................... 15

1.3.5. Modele przyczynowo-skutkowe, symptomatyczne i modele tendencji rozwojowej ......................................................................................... 16

1.3.6. Etapy budowania modelu ........................................................................................ 17

1.4. Modele liniowe .............................................................................................................. 19

1.4.1. Postać modelu regresji liniowej .............................................................................. 20

1.4.2. Wybór zmiennych objaśniających do modelu ekonometrycznego ......................... 21

Metoda pojemności informacyjnej Hellwiga ............................................................. 22

Metoda analizy grafów .............................................................................................. 26

1.4.3. Estymacja modelu ................................................................................................... 30

Założenia klasycznego modelu regresji liniowej ....................................................... 30

Klasyczna metoda najmniejszych kwadratów ........................................................... 31

Klasyczna metoda najmniejszych kwadratów w zapisie macierzowym .................... 32

Twierdzenie Gaussa-Markowa .................................................................................. 32

Macierz wariancji i kowariancji ocen parametrów strukturalnych ............................ 33

Współczynniki dopasowania modelu do danych obserwacji ..................................... 34

Przedział ufności dla parametrów strukturalnych modelu ......................................... 35

1.4.4. Weryfikacja modelu ................................................................................................ 41

Ogólne zasady weryfikacji statystycznej ................................................................... 42

Ocena jakości ocen parametrów strukturalnych ........................................................ 43

Badanie założeń o składnikach losowych .................................................................. 48

4

1.4.5. Merytoryczna interpretacja parametrów strukturalnych oszacowanych modeli .... 57

1.5. Modele nieliniowe ......................................................................................................... 58

1.5.1. Rodzaje modeli nieliniowych .................................................................................. 59

1.5.2. Charakterystyka wybranych modeli nieliniowych .................................................. 59

Funkcja wykładnicza ................................................................................................. 59

Funkcja potęgowa ...................................................................................................... 61

Funkcja logarytmiczna ............................................................................................... 62

Wielomiany ................................................................................................................ 63

Funkcja hiperboliczna ................................................................................................ 64

Funkcja wykładnicza z odwrotnością ........................................................................ 65

Funkcja logistyczna ................................................................................................... 66

Pierwsza funkcja Tornquista ...................................................................................... 67

Druga i trzecia funkcje Tornquista ............................................................................ 67

1.5.3. Estymacja metodą najmniejszych kwadratów modeli transformowalnych do postaci liniowej ............................................................................ 69

Modele transformowalne do postaci liniowej ............................................................ 69

Modele ściśle nieliniowe ............................................................................................ 80

ROZDZIAŁ II

Prognozowanie na podstawie modeli szeregów czasowych …………………………………81

Wstęp .................................................................................................................................... 81

2.1. Teoretyczne podstawy prognozowania ......................................................................... 82

2.2. Organizacja procesu prognostycznego .......................................................................... 84

2.3. Zasady i metody prognozowania ................................................................................... 86

2.3.1. Zasady prognozowania ........................................................................................... 86

2.3.2. Metody prognozowania .......................................................................................... 89

2.4. Rodzaje błędów prognoz i rodzaje jakości prognoz ...................................................... 91

2.4.1. Rodzaje błędów prognoz ......................................................................................... 91

2.4.2. Rodzaje jakości prognoz ......................................................................................... 94

2.5. Prognozowanie na podstawie klasycznych modeli trendu ............................................ 95

2.5.1 Klasyczny model regresji liniowej ........................................................................... 96

2.5.2. Metoda harmoniki ................................................................................................... 99

2.5.3. Metoda Kleina ....................................................................................................... 107

2.6. Prognozowanie na podstawie modeli adaptacyjnych szeregów czasowych ............... 107

2.7. Modele naiwne ............................................................................................................ 109

5

2.8. Modele średniej ruchomej ........................................................................................... 110

2.9. Modele wygładzania wykładniczego .......................................................................... 115

2.9.1. Modele wygładzania wykładniczego Browna ...................................................... 116

2.9.2. Modele wygładzania wykładniczego Holta .......................................................... 119

2.9.3. Modele wygładzania wykładniczego Wintersa .................................................... 122

2.10. Trend pełzający ......................................................................................................... 125

ROZDZIAŁ III

Budowa i prognozowanie na podstawie modeli autoregresji i średniej ruchomej ................. 130

3.1. Proces stochastyczny ................................................................................................... 130

3.2. Filtrowanie szeregów .................................................................................................. 133

3.3. Stacjonarność procesu stochastycznego ...................................................................... 135

3.4. Biały szum ................................................................................................................... 136

3.5. Proces średniej ruchomej ............................................................................................ 140

3.6. Proces autoregresyjny ................................................................................................. 142

3.7. Proces ARMA ............................................................................................................. 146

3.8. Stopień zintegrowania modelu .................................................................................... 147

3.9. Procedura Boxa – Jenkinsa ......................................................................................... 149

3.10. Model SARIMA ........................................................................................................ 153

3.11. Prognozy w modelach ARIMA ................................................................................. 154

Podsumowanie ....................................................................................................................... 161

Tablice statystyczne ............................................................................................................... 173

Bibliografia ............................................................................................................................. 173

1. Spis rysunków ................................................................................................................. 176

2. Spis Tabel ........................................................................................................................ 178

7

WSTĘP

Prognozowanie procesów gospodarczych jest ważną częścią planowania działalności

zarówno na poziomie mikro jak i makroekonomicznym. Na podstawie sporządzonych

prognoz podejmuje się wiele decyzji w finansach, bankowości, handlu, marketingu,

ubezpieczeniach etc. Opracowanie zatytułowane „Prognozowanie gospodarcze” jest

wynikiem skorelowania rozważań teoretycznych z praktycznym zastosowaniem

oprogramowania komputerowego w tworzeniu modeli prognostycznych. Modele te mogą być

budowane na potrzeby zarówno instytucji międzynarodowych, rządów i ministerstw (w

gospodarkach krajowych), jak i poszczególnych przedsiębiorstw. Metody omawiane tutaj są

nadal z powodzeniem stosowane w badaniach dotyczących skali mikro, makro, mezo i

megaekonomicznej.

W niniejszym opracowaniu przedstawiono te metody prognozowania, które

najczęściej stosuje się w praktyce. W celu wyznaczenia prognozy zjawisk zmieniających się

w czasie bardzo istotną rolą jest znalezienie odpowiedniego modelu matematycznego

opisującego przebieg danego procesu. Nie zagłębiając się w metodologię możemy wyróżnić

dwa typy modeli: czyste – przedstawiamy równanie lub układ równań najczęściej

różniczkowych opisujących dane zjawisko, lub statystyczne – metodami statystyki

matematycznej dobieramy właściwe współczynniki modelu.

Autorzy podzielili prezentowany materiał na trzy rozdziały.

8

Rozdział pierwszy zatytułowany „Modele ekonometryczne podstawowym

instrumentem prognozowania gospodarczego” przedstawia nam sposób budowy i weryfikacji

modelu ekonometrycznego. Wszelkie prognozy powinny być oparte na dobrze zbudowanym i

dopasowanym modelu. W rozdziale tym poruszono zagadnienia dotyczące budowy modeli

ekonometrycznych ze szczególnym uwzględnieniem modeli liniowych. Najważniejszą

częścią budowy modelu jest jego weryfikacja oraz merytoryczna interpretacja uzyskanych

wyników. Przedstawiono zatem sposoby testowania hipotez dotyczących parametrów

strukturalnych i istotności współczynników, a także badanie składnika losowego.

Kolejny rozdział pt. „Prognozowanie na podstawie modeli szeregów czasowych”

dotyczy tematyki związanej przede wszystkim z organizacją i zasadami procesu

prognostycznego. Wprowadzono matematyczne wzory na wyznaczanie błędów prognoz.

W rozdziale omówiono metody prognozowania na podstawie klasycznych modeli trendu,

modeli adaptacyjnych szeregów czasowych.

Rozdział trzeci niniejszego opracowania zatytułowany „Budowa i prognozowanie na

podstawie modeli autoregresji i średniej ruchomej” dotyczy modeli zaproponowanych przez

Boxa i Jenkina a nazywanych modelami autoregresyjnymi i średniej ruchomej. Modele te są

dzisiaj coraz bardziej rozwijane, wprowadzane są do nich informacje o trendzie czy

sezonowości. Są one wykorzystywane obecnie przez instytucje finansowe nie tylko do

tworzenia prognoz ale również analizy przeszłości.

Praca w jasny i wyczerpujący sposób definiuje i przedstawia zagadnienie dotyczące

budowy modeli prognostycznych oraz ich praktycznego zastosowania. W niniejszym

opracowaniu wykorzystano najnowsze materiały i zaktualizowane dane. W opracowaniu tym

zawarto również informacje o możliwości skorzystania z dostępnego oprogramowania jak

podstawowy arkusz MS Excel, ale też zaawansowane Statistica czy Gretl. Opracowanie to

podaje nie tylko informacje teoretyczne, ale umożliwia również czytelnikowi samodzielne

zastosowanie poprzez dokładne omówienie i prezentację możliwości wykorzystania

oprogramowania statystycznego.

9

ROZDZIAŁ I

MODELE EKONOMETRYCZNE PODSTAWOWYM

INSTRUMENTEM PROGNOZOWANIA GOSPODARCZEGO

1.1. Ekonometria jako dyscyplina naukowa

Ekonometria jako nauka powstała stosunkowo niedawno, bo w drugiej połowie ubiegłego

wieku. Jednak jej dynamiczny rozwój nastąpił w ostatnich trzech dekadach, co wiążę się

zarówno z globalną komputeryzacją i informatyzacją współczesnego społeczeństwa, jak i

rozwojem globalnej sieci Internet. Jeśli chodzi o zakres badań, to ogólnie można powiedzieć,

że ekonometria bada ilościowe zależności występujące między zjawiskami ekonomicznymi

wykorzystując przy tym różne metody i narzędzia matematyczne. Jednak najczęściej w

ekonometrii wykorzystywane są metody statystyczne. Dlatego niektórzy naukowcy traktują

ekonometrię jako pochodną statystyki matematycznej, która powstała znacznie wcześniej niż

ekonometria. Ten związek powstał na skutek tego, że w zjawiskach ekonomicznych bardzo

często mamy do czynienia z losowością zdarzeń, których badanie wymaga stosowania

sprawdzonych metod statystycznych.

Ekonometria jest również dyscypliną ściśle związaną z różnymi dziedzinami nauk

ekonomicznych, dostarczających wiedzy teoretycznej nt. badanych zjawisk gospodarczych.

Ponadto obserwuje się wzmocnienie związku między ekonometrią a informatyką, która

dostarcza narzędzi ułatwiających wykonanie różnego rodzaju, dość skomplikowanych

obliczeń liczbowych oraz ilustrowania otrzymanych wyników.

Termin ekonometria powstał ze złożenia dwóch słów pochodzących z języka

greckiego: „oeconomia”, czyli gospodarka, oraz „metreo”, czyli mierzyć. Razem wzięte

10

pozwalają interpretować ekonometrię jako naukę podejmującą zadanie pomiaru zależności

zachodzących w gospodarce. Zatem nie chodzi tu o mierzenie bezpośrednio, np. wielkości

produkcji, sprzedaży czy innych kategorii ekonomicznych, lecz o uchwycenie relacji, jakie

zachodzą między zjawiskami ekonomicznymi oraz o ich wykorzystanie w analizie i

przewidywaniu, a niekiedy w symulacji [17, s. 13]. Po raz pierwszy termin „ekonometria”

pojawił się w 1910 roku w tytule pracy Pawła Ciompy Przegląd ekonometrii i rzeczywistej

teorii buchalterii wydanej we Lwowie [20, s. 9].

Przytoczymy kilka definicji ekonometrii. „Ekonometria to nauka zajmująca się

ustalaniem za pomocą metod statystycznych konkretnych, ilościowych prawidłowości

zachodzących w życiu gospodarczym” [29, s. 11].

„Ekonometria jest nauką o metodach badania ilościowych prawidłowości

występujących w zjawiskach ekonomicznych za pomocą odpowiednio wyspecjalizowanego

aparatu matematyczno–statystycznego” [35, s.15].

Zatem ekonometria jako nauką koncentruje się na następujących zadaniach [4]:

• ilościowej ocenie relacji pomiędzy zjawiskami ekonomicznymi,

• konfrontacji teorii ekonomii z praktyką gospodarczą,

• prognozowaniu wyników działalności gospodarczej.

Badania ekonometryczne składają się z wielu etapów, które najogólniej możemy

określić jako [36]:

1. Sformułowanie modelu ekonometrycznego.

2. Zgromadzenie danych empirycznych.

3. Estymacja parametrów modelu.

4. Weryfikacja merytoryczna i statystyczna modelu.

5. Interpretacja ekonomiczna uzyskanych wyników.

1.2. Rola i rodzaje danych statystycznych wykorzystywanych w ekonometrii

Podstawę badań ekonometrycznych stanowią dane statystyczne, które po ich opracowaniu za

pomocą metod ekonometrycznych dostarczają badaczom informacji niezbędnych do

wyciągnięcia odpowiednich wniosków w stosunku do badanego zjawiska ekonomicznego.

Dane statystyczne dotyczą głównie pewnych zbiorowości (populacji), których elementami są

obiekty materialne, zjawiska gospodarcze, technologiczne i inne. Zbiory dowolnych obiektów

11

(osób, przedmiotów, faktów) podobnych pod względem określonych cech nazywa się

zbiorowościami statystycznymi lub populacjami.

Próba jest to podzbiór populacji generalnej, obejmujący część jej elementów –

wybranych w określony sposób. Próba dostatecznie liczna, wybrana w sposób losowy, jest

próbą reprezentatywną. Wyniki badań próby reprezentatywnej można uogólnić na całą

populację (z dużym prawdopodobieństwem można sądzić, że struktura próby będzie zbliżona

do struktury populacji) [4].

Elementy populacji (obiekty) mogą mieć różne właściwości (cechy), które podlegają

obserwacji statystycznej. Dane statystyczne mają najczęściej postać szeregów czasowych,

danych przekrojowych lub danych przekrojowo-czasowych [25; 5].

Szeregi czasowe składają się z liczb odpowiadających wartościom, jakie przybrała

dana cecha (zmienna) w kolejnych, jednakowo odległych momentach czasu (np. latach,

kwartałach, miesiącach). Przykład szeregu czasowego jest podany w tabeli 1.1 [4]. Z kolei

dane przekrojowe dotyczą wielkości obiektów w tym samym momencie (por. tabela 1.2) [4].

Tabela 0.1. Miesięczne wydatki na żywność wybranego gospodarstwa domowego w 2012 r.

Miesiąc Wydatki na żywność (zł) styczeń luty marzec kwiecień maj czerwic lipiec sierpień wrzesień październik listopad grudzień

1400 1500 1460 1550 1470 1520 1450 1380 1340 1450 1580 1600

Źródło: dane umowne

Tabela 0.2. Wydatki na żywność 10 gospodarstw domowych w marcu 2012 r.

Gospodarstwo domowe

1 2 3 4 5 6 7 8 9 10

Wydatki (zł) 1460 1500 1580 1630 1300 1290 1310 1400 1545 1960


12

Dane przekrojowo-czasowe stanowią połączenie dwóch poprzednich rodzajów

danych. Szczególnym rodzajem danych przekrojowo-czasowych są dane panelowe. Dotyczą

one szeregów czasowych zawierających wartości pomiarów tej samej zmiennej (cechy)

zaobserwowanych przekrojowo w przypadku wielu obiektów (tabela 1.3) [4].

Tabela 0.3. Wydatki na żywność 10 gospodarstw domowych w kolejnych miesiącach 2012 r.

Miesiąc Gospodarstwa domowe

1 2 3 4 5 6 7 8 9 10

styczeń

luty

marzec

kwiecień

maj

czerwiec

lipiec

sierpień

wrzesień

październik

listopad

grudzień

1400

1500

1460

1550

1470

1520

1450

1380

1340

1450

1580

1600

1480

1590

1500

1390

1400

1280

1345

1400

1450

1525

1600

1580

1610

1700

1580

1510

1460

1380

1370

1390

1380

1600

1570

1680

1570

1690

1630

1450

1495

1380

1400

1390

1390

1450

1550

1700

1280

1150

1300

1260

1200

1205

1170

1200

1240

1280

1340

1450

1200

1260

1290

1350

1320

1200

1130

1100

1200

1370

1350

1475

1300

1200

1310

1425

1310

1390

1435

1510

1400

1370

1450

1620

1580

1450

1400

1500

1400

1365

1400

1420

1510

1490

1520

1910

1690

1500

1545

1600

1550

1580

1490

1440

1375

1400

1525

1700

1800

1720

1690

1765

1700

1650

1590

1540

1600

1680

1740

1800


1.3. Modele ekonometryczne i ich klasyfikacja

Podstawowym narzędziem ekonometrii jest model ekonometryczny. Według Zbigniewa

Pawłowskiego „Model ekonometryczny jest to konstrukcja formalna, która za pomocą

pewnego równania lub układu równań przedstawia zasadnicze powiązania występujące

pomiędzy rozpatrywanymi zjawiskami ekonomicznymi” [35].

Wiadomo, że na badane zjawisko ekonomiczne oddziaływać może wiele różnych

czynników, zarówno pochodzenie zewnętrznego, jak i tkwiących w badanym obiekcie. Przy

czym działanie to jest bardzo zróżnicowane, tzn. niektóre czynniki wpływają na dane

zjawisko w sposób decydujący (jest to działanie silne i trwałe), natomiast działanie innych

jest znikome (czyli słabe i nietrwałe). Poza tym na badane zjawisko wpływ mogą mieć

również czynniki nieprzewidywalne nazywane czynnikami losowymi. Ich działanie bywa

13

sporadyczne i nieregularne. Jednak w modelu ekonometrycznym uwzględnia się tylko

czynniki główne, pomijając czynniki słabo oddziałujące oraz czynniki losowe.

Ze względu na różne kryteria klasyfikacji modele ekonometryczne można podzielić na

takie grupy (por. rys. 1.1):

Rys. 0.1. Klasyfikacja modeli ekonometrycznych Źródło: opracowanie własne

1.3.1. Modele jedno- i wielorównaniowe

W zależności od tego ile równań zawiera model ekonometryczny rozróżniamy:

� modele jednorównaniowe,

� modele wielorównaniowe.

Modele jednorównaniowe służą do opisu konkretnych zjawisk bądź fragmentów

rzeczywistości gospodarczej (np. model produkcji, model popytu na konkretne dobro, model

kształtowania się kosztów, wydajności, pracochłonności).

Z kolei modele wielorównaniowe wykorzystywane są zazwyczaj w przypadku

modelowania bardziej złożonych zjawisk gospodarczych (np. mikroekonomiczny model

Modele ekonometryczne

Kryterium: ilość równań

w modelu

Kryterium: postać anali

tyczna modelu

Kryterium: udział czyn

nika losowego

Kryterium: okres badań

jednorów naniowe

liniowe stocha styczne

staty czne

nie liniowe

wielorów naniowe

determini styczne

dynamicz czne

Kryterium: walory

poznawcze

tendencji rozwojowej

sympto matyczne

przyczynowo-opisowe

modele trendu modele autoregresyjne

modele autoregresyjne

modele trendu

modele autoregresyjne

14

funkcjonowania podmiotu gospodarczego lub makroekonomiczny model funkcjonowania

gospodarki krajowej).

1.3.2. Modele statyczne i dynamiczne

Ze względu na to czy zjawisko jest badane w pewnym okresie czy też w jednym konkretnym

momencie czasu rozróżniamy:

• modele dynamiczne,

• modele statyczne.

Modele dynamiczne opisują zmiany parametrów obserwowanego zjawiska w czasie.

Dlatego w modelach tego typu pojawia się subskrypt t , który wyznacza określone przedziały

czasowe podlegające badaniu. Upraszczając zagadnienie, można stwierdzić, że w modelach

dynamicznych zmienna czasowa t występuje albo jako zmienna objaśniająca w modelach

tendencji rozwojowej, albo jako subskrypt przy wszystkich zmiennych objaśniających

( 1 2, ,...,t t KtX X X ) oraz przy zmiennej objaśnianej ( tY ) w innych modelach.

Z kolei modele statyczne opisują współzależności między różnymi zjawiskami

ekonomicznymi występującymi w gospodarce jednocześnie. Dlatego w tych modelach

najczęściej wykorzystywane są subskrypty i lub j .

1.3.3. Modele stochastyczne i deterministyczne

W postaci ogólnej jednorównaniowy model ekonometryczny można zapisać za pomocą

następującego wzoru:

( )1,..., ;KY f X X ε= , (1.1)

gdzie:

Y – zmienna objaśniana (endogeniczna) reprezentująca zjawisko modelowane;

1,..., KX X – zmienne objaśniające (egzogeniczne);

ε – zmienna losowa (tzw. zakłócenie losowe);

f – postać analityczna modelu;

K – liczba zmiennych objaśniających ( 1,...,j K= ).

15

Ponieważ równanie (1.1) zawiera składnik losowy, model ekonometryczny ma cechy

modelu stochastycznego. Oznacza to, iż wnioskowanie na podstawie oszacowanych

parametrów będzie miało charakter przybliżony.

Natomiast pominięcie składnika losowego w modelu pozwala go zapisać w tak zwanej

postaci deterministycznej:

( )1,..., KY f X X= , (1.2)

gdzie Y – zmienna zależna,

1,..., KX X – zmienne niezależne.

Otóż ze względu na udział czynnika losowego w modelach ekonometrycznych

możemy je podzielić na:

� modele stochastyczne,

� modele deterministyczne.

Modele stochastyczne najczęściej wykorzystywane są do opisu zjawisk sfery

ekonomicznej i społecznej. Natomiast modele deterministyczne występują zwykle w

modelach opisujących współzależności zjawisk fizycznych i chemicznych.

1.3.4. Modele liniowe i nieliniowe

Uwzględniając postać analityczną opisującą badane zjawisko, modele ekonometryczne można

podzielić na kolejne dwie grupy:

� modele liniowe,

� modele nieliniowe.

Liniowy model ekonometryczny możemy zapisać w takiej ogólnej postaci:

0 0 1 1 2 2 ... K KY X X X Xα α α α ε= + + + + + , (1.3)

gdzie: 0 1 2, , ,..., Kα α α α – parametry strukturalne modelu, które należy oszacować;

Y – zmienna objaśniana;

1,..., KX X – zmienne objaśniające;

ε – zmienna losowa;

K – liczba zmiennych objaśniających ( 1,...,j K= ).

Natomiast nieliniowych postaci modeli ekonometrycznych jest nieskończenie wiele.

Bardzo często dla przykładu modelu nieliniowego posługuje się postacią potęgową typu:

16

1 20 1 2 ... tK

KY X X X eεα α αα= ⋅ ⋅ ⋅ ⋅ ⋅ , (1.4)

gdzie: e – stała (liczba Eulera).

Wybór postaci modelu ekonometrycznego odgrywa bardzo ważną rolę, gdyż

przesądza on skuteczność wykorzystania zbudowanego modelu w przyszłości do celów

praktycznych, między innymi do budowania prognoz badanego zjawiska ekonomicznego.

Wśród modeli nieliniowych wyróżniamy dwie podgrupy:

� modele, które można transformować do postaci liniowej (czyli linearyzować),

� modele, których linearyzować się nie da.

1.3.5. Modele przyczynowo-skutkowe, symptomatyczne i modele tendencji rozwojowej

Z punktu widzenia ogólnopoznawczych właściwości modeli ekonometrycznych możemy je

podzielić na [17]:

o modele przyczynowo-opisowe,

o modele tendencji rozwojowej,

o modele symptomatyczne.

Modele przyczynowo-opisowe stanowią grupę odgrywającą zasadniczą rolę wśród

wszystkich modeli ekonometrycznych. W modelach tych rolę przyczyn pełnią zmienne

objaśniające, które opisują zmienną objaśnianą Y . Zatem zmienna objaśniana odgrywa rolę

skutku. Wśród tej klasy spotykamy zarówno modele statyczne, jak i dynamiczne.

Drugą co do ważności grupę modeli podzielonych według kryterium walorów

poznawczych stanowią modele tendencji rozwojowej. Modele te opisują ilościowe zmiany

zmiennej objaśnianej ( tY ) zachodzące w czasie. Stąd jedyną zmienną objaśniającą jest w tym

przypadku zmienna czasowa t . Zmienna ta przybiera kolejne wartości liczb całkowitych

zwiększające sie o jeden w miarę następowania kolejnych okresów czasu (lat, kwartałów,

miesięcy, dni, godzin etc.). Zatem w modelach tych nie występują żadne więzi przyczynowo-

skutkowe, właściwe modelom przyczynowo-opisowym. W opisie wahań zmiennej

objaśnianej za pomocą modelu tendencji rozwojowej można wyodrębnić trzy elementy [4]:

1) trend – ( )f t ,

2) wahania regularne (cykliczne) – ( )g t ,

3) wahania losowe – tε .

17

Zatem model tendencji rozwojowej można zapisać w następującej ogólnej postaci:

( ) ( ), , tY F f t g t ε = (1.5)

Pomijając klasę modeli tendencji rozwojowej, we wszystkich pozostałych

przypadkach – przy budowie modelu – zawsze staramy się o to, by między zmienną

objaśnianą a zmiennymi objaśniającymi zachodził związek przyczynowy. Są jednak sytuacje,

kiedy nie można spełnić tego postulatu. Na przykład może się zdarzyć, iż brak jest

odpowiednich danych o wytypowanych zmiennych objaśniających do modelu przyczynowo-

opisowego. Wówczas można wykorzystać przypadek, w którym interesująca nas zmienna

endogeniczna jest silnie skorelowana z inną lub innymi zmiennymi bez zaistnienia związku

przyczynowego. Zatem model, w którym zmienne objaśniające nie pozostają w związku

przyczynowym ze zmienną objaśnianą, są jedynie silnie z nią skorelowane, jest modelem

symptomatycznym. Modele symptomatyczne spełniają marginalną rolę wśród modeli

ekonometrycznych ze względu na rzadkość ich stosowania. Stanowią rezerwę na przypadek

braku możliwości budowania modeli przyczynowo-opisowych; mogą być wykorzystywane

do celów predykcji [4, s. 19].

1.3.6. Etapy budowania modelu

Według wielu autorów proces modelowania ekonometrycznego składa się z następujących

etapów (por. rys. 1.2):

� ustalenie celu i zakresu badań ekonometrycznych;

� zbieranie danych statystycznych;

� specyfikacja modelu (ustalenie zmiennych objaśniających

i postaci matematycznej modelu);

� estymacja (szacowanie parametrów modelu);

� weryfikacja modelu (sprawdzanie), praktyczne wykorzystanie modelu.

Celem modelowania ekonometrycznego jest zwykle badane zjawisko gospodarcze,

opisywane przez zmienną objaśnianą Y . W modelach wielorównaniowych natomiast mamy

szereg takich zmiennych (np. 1,..., nY Y ) opisujących kilka zjawisk jednocześnie.

Zakres badań z kolei wyznacza granicy czasowe obserwacji (w modelach

dynamicznych) lub jeden konkretny moment czasu, w którym badane będzie zjawisko

gospodarcze (w modelach statycznych), a także ustala obiekty przestrzenne, w których

dokonuje się obserwacji (np. przedsiębiorstwa, regiony, państwa).

18

Na drugim etapie dokonuje się zbierania danych statystycznych, które posłużą

szacowaniu parametrów modelu. Dane powinny być w miarę rzetelne, kompletne i liczne,

gdyż im większa liczba obserwacji tym większa dokładność szacowania parametrów modelu.

Rys. 0.2 Etapy budowania modelu ekonometrycznego Źródło: opracowanie własne na podstawie [17]

Specyfikacja modelu wymaga ustalenia optymalnej ilości zmiennych objaśniających

oraz doboru odpowiedniej postaci analitycznej modelu. W celu ustalenia zbioru zmiennych

objaśniających należy najpierw uwzględnić wiedzę płynącą z osiągnięć teorii ekonomii. Przy

potrzebie można także wykorzystać statystyczne metody wyboru zmiennych objaśniających.

Następnie wybiera się postać analityczna modelu (liniowa, nieliniowa, o jednej lub o wielu

zmiennych).

Estymacja modelu przewiduje szacowanie parametrów strukturalnych modelu oraz

szacowanie parametrów jego struktury stochastycznej. Szacowania parametrów równania

Czy weryfikacja modelu przeszła

pomyślnie?

ustalenie celu i zakresu badań

zbieranie danych

specyfikacja modelu

estymacja modelu

wykorzystanie modelu

tak

nie

weryfikacja modelu

19

opisującego zjawisko gospodarcze dokonuje się na podstawie zebranych danych

statystycznych w drodze porównania modelowanego zjawiska z rzeczywistym procesem

ekonomicznych. Z kolei szacowanie parametrów struktury stochastycznej jest sprawdzaniem

jakości zbudowanego modelu.

Weryfikacja modelu sprowadza się do merytorycznego sprawdzania parametrów

strukturalnych tzn. czy parametry strukturalne przyjmują rozsądne wartości i czy znaki przy

ocenach są zgodne ze wskazaniami teorii ekonomii. Na tym etapie również dokonuje się

kontroli dokładności oszacowania, która to kontrola obejmuje analizę kilku parametrów

struktury stochastycznej, co pozwala ustalić, czy błędy estymacji nie przekraczają ustalonego

poziomu, a także czy oceny parametrów strukturalnych są statystycznie istotne. Jeśli

stwierdzimy na tym etapie istotne nieprawidłowości, to należy powrócić do etapu czwartego

(estymacji modelu).

W praktyce model ekonometryczny może być wykorzystany w celu analizy relacji

zachodzących w przeszłości i formułowania płynących stąd wniosków, do prognozowania

wielkości opisanego przez model zjawiska oraz do symulacji różnych sytuacji zarówno w

przedsiębiorstwie, jak i na rynku.

1.4. Modele liniowe

Podstawowym i zarazem najprostszym modelem ekonometrycznym jest jednorównaniowy

model liniowy postaci:

0 0 1 1 2 2 ... K KY X X X Xα α α α ε= + + + + + , (1.6)

gdzie Y – zmienna objaśniana,

0,..., KX X – zmienne objaśniające,

0,..., Kα α – współczynniki regresji liniowej,

ε – zmienna losowa.

Należy zaznaczyć, że w modelu tym zależność zmiennej objaśnianej Y od zmiennych

objaśniających 0,..., KX X ma charakter liniowy, tzn. funkcja Y jest liniową.

Współczynniki jα ( 0,...,j K= ) nazywane także parametrami strukturalnymi modelu

charakteryzują ilościowy i jakościowy wpływ zmiennych objaśniających na zmienną

objaśnianą. Przy czym pierwsza ze zmiennych objaśniających 0α (nazywana wyrazem

wolnym modelu lub stałą regresji) jest definiowana jako tożsamościowo równa jedności

20

( 0 1X ≡ ). Podstawowym zadaniem w modelowaniu ekonometrycznym jest oszacowanie

parametrów 0,..., Kα α na podstawie danych statystycznych charakteryzujących zmienną

objaśnianą i zmienne objaśniające.

1.4.1. Postać modelu regresji liniowej

Dysponując n-elementowymi ciągami obserwacji na wszystkich tych zmiennych (objaśnianej

i objaśniających), a więc ciągiem wektorów ( 1, ,...,t t tKy x x ) ( 1,...,t n= ), każdą realizację ty

zmiennej objaśnianej Y możemy, zgodnie z założonym modelem, przedstawić jako sumę:

kombinacji liniowej 0 1 1 ...t K tKx xα α α+ + + odpowiednich realizacji zmiennych objaśniających

oraz nieobserwowalnej realizacji tε składnika losowego ε [17].

Zatem dla wszystkich obserwacji otrzymujemy układ:

1 0 1 11 2 12 1 1

2 0 1 21 2 22 2 2

0 1 1 2 2

...

...

............................................................

...

K K

K K

n n n K nK n

y x x x

y x x x

y x x x

α α α α εα α α α ε

α α α α ε

= + + + + += + + + + +

= + + + + +

.

Układ ten w symbolice macierzowo-wektorowej można zapisać jako:

= +y Xα ε , (1.7)

gdzie:

1

2

n

y

y

y

=

yM

,

11 1

21 2

1

1

1

1

K

K

n nK

x x

x x

x x

=

X

L

L

M M M M

L

,

0

1

K

αα

α

=

α

M,

1

2

n

εε

ε

=

ε

M.

wektor obserwacji na macierz obserwacji na wektor parametrów wektor składników

zmiennej objaśnianej zmiennych objaśniających strukturalnych losowych

Zapis (1.6) możemy nazwać postacią strukturalną jednorównaniowego liniowego

modelu ekonometrycznego, natomiast zapis (1.7) nazywamy postacią strukturalno-

statystyczną tegoż modelu.

21

1.4.2. Wybór zmiennych objaśniających do modelu ekonometrycznego

Wybór zmiennych objaśniających do modelu ekonometrycznego opiera się zarówno na

wiedzy ekonomicznej, jak i matematyczno-statystycznej.

Przed wyborem potencjalnych zmiennych objaśniających należy wytypować

wszystkie zmienne objaśniające, które mogą mieć wpływ na badane zjawisko gospodarcze. W

tym procesie może być pomocna wiedza z zakresu teorii ekonomii, finansów, marketingu etc.

dotycząca badanego zjawiska. Ze zbioru wytypowanych zmiennych objaśniających należy

wyeliminować te zmienne, które mają charakter niemierzalny, których brak jest danych lub

kompletnych danych i te, które charakteryzują się małą zmiennością, a więc w niewielkim

stopniu oddziałują na badane zjawisko, a tym samym na zmienną objaśnianą.

Następnym etapem będzie wybór właściwych zmiennych objaśniających przy

wykorzystaniu metod statystycznych, które opierają się na założeniu, że zmienne objaśniające

uwzględnione w modelu powinny być stosunkowo silnie skorelowane ze zmienną objaśnianą

oraz nieskorelowane lub słabo skorelowane z pozostałymi zmiennymi objaśniającymi

uwzględnionymi w modelu. W tym celu należy obliczyć współczynniki korelacji między

zmienną objaśnianą i potencjalnymi zmiennymi objaśniającymi, a także współczynniki

korelacji między parami potencjalnych zmiennych objaśniających.

Obliczone współczynniki korelacji zestawia się zwykle w postaci wektora 0R

(wektora współczynników korelacji zmiennej endogenicznej z potencjalnymi zmiennymi

objaśniającymi) i macierzy R (macierz współczynników korelacji pomiędzy parami

zmiennych objaśniających; macierz R jest symetryczna):

01

020

0L

r

r

r

=

RM

,

12 1

21 2

1 2

1

1

1

L

L

L L

r r

r r

r r

=

R

L

L

M M M M

L

, (1.8)

gdzie 0 jr – współczynniki korelacji między zmienną objaśnianą i zmiennymi objaśniającymi

( 1,2,...,j L= ),

L – liczbą potencjalnych zmiennych objaśniających,

ijr – współczynniki korelacji między zmiennymi objaśniającymi ( 1,2,...,j L= ).

Przy czym współczynnik korelacji zmiennej z nią samą jest równy 1 ( 1iir = ) oraz

występuje symetria współczynników typu ij jir r= .

22

Spośród wielu metod statystycznych wykorzystywanych w celu wyboru właściwych

zmiennych objaśniających omówimy metodę Hellwiga oraz metodę analizy grafów.

Metoda pojemności informacyjnej Hellwiga

Metoda ta jest zwana metodą pojemności informacyjnej bądź metodą pojemności nośników

informacji, w której to metodzie potencjalne zmienne objaśniające są nośnikami informacji.

Na początku ze wstępnie wytypowanych L zmiennych objaśniających tworzy się

kombinacje jedno-, dwu-, L -elementowe. Liczba wszystkich możliwych kombinacji jest

równa 2 1L − . Potem dla każdej zmiennej w każdej kombinacji oblicza się indywidualną

pojemność nośnika informacji ( kjh ) według wzoru [17]:

20

k

jkj

iji I

rh

r∈

=∑

, (1.9)

gdzie: kjh – indywidualna pojemność j -tej zmiennej w k -tej kombinacji,

0 jr – współczynnik korelacji j -tej potencjalnej zmiennej objaśniającej

ze zmienną objaśnianą,

{ };k i kI i X K= ∈ – zbiór indeksów (numerów) zmiennych wchodzących

w skład k -tej kombinacji, tj. kombinacji kK ,

k

iji I

r∈∑ – suma wartości bezwzględnych współczynników korelacji j -tej

zmiennej z pozostałymi zmiennymi występującymi z nią w danej kombinacji.

Dla każdej kombinacji zmiennych objaśniających oblicza się integralną (łączną)

pojemność nośników informacji kH jako sumę pojemności indywidualnych zmiennych

objaśniających występujących w danej kombinacji:

k kjj

H h=∑ . (1.10)

Jako zmienne objaśniające do modelu wybiera się tę ich kombinację, dla której

pojemność integralna H przyjmuje wartość największą (przy czym kjh ; [ ]0,1kH ∈ , tzn.

zarówno pojemności indywidualne, jak i integralne przyjmują wartości z przedziału [ ]0,1 ).

23

Przykład 1.1.

Badanych jest 8 przedsiębiorstw wytwarzających jogurty. Budowany będzie model

kosztów całkowitych przedsiębiorstwa (Y ) w zależności od wielkości jego produkcji ( 1X )

oraz zawartości wsadu owocowego w jogurcie (2X ).

Przedsiębiorstwo ( t )

Y [mln zł] 1X [mln ton] 2X [%]

1 9.89 1.67 48.3 2 10.78 2.78 47.2 3 12.44 3.33 43.3 4 15.39 6.11 40.6 5 15.72 6.67 46.1 6 17.06 6.66 45.0 7 19.06 8.33 40.5 8 19.44 8.89 44.4 ∑ 119.78 44.44 355.4

Źródło: obliczenia własne

Obliczymy współczynnik korelacji zmiennych objaśniających ze zmienną objaśnianą:

( ) ( )

( ) ( )

8

1 11

01 8 82 2

1 11 1

t tt

t tt t

y y x xr

y y x x

=

= =

− ⋅ −=

− ⋅ −

∑

∑ ∑

; ( ) ( )

( ) ( )

8

2 21

02 8 82 2

2 21 1

t tt

t tt t

y y x xr

y y x x

=

= =

− ⋅ −=

− ⋅ −

∑

∑ ∑

;

( ) ( )

( ) ( )

8

1 1 2 21

12 8 82 2

1 1 2 21 1

t tt

t tt t

x x x xr

x x x x

=

= =

− ⋅ −=

− ⋅ −

∑

∑ ∑

;

Dla ułatwienia poszczególnych obliczeń obliczymy oddzielnie elementy ze wzorów na

01r oraz 02r i zapiszemy je w postaci tabelek. Wartości średnie obliczyć można za pomocą

wzorów:

8

1 119.7814.97

8 8

tt

yy == = =

∑;

8

11

1

44.445.55

8 8

tt

xx == = =

∑;

8

21

2

355.444.43

8 8

tt

xx == = =

∑;

24

ty y− 1 1tx x− ( ) ( )1 1t ty y x x− ⋅ − ( )2

ty y− ( )2

1 1tx x−

-5.08 -3.88 19.71 25.81 15.05 -4.19 -2.77 11.61 17.56 7.67 -2.53 -2.22 5.62 6.40 4.93 0.42 0.56 0.24 0.18 0.31 0.75 1.12 0.84 0.56 1.25 2.09 1.11 2.32 4.37 1.23 4.09 2.78 11.37 16.73 7.73 4.47 3.34 14.93 19.98 11.16 Suma 66.64 91.59 49.33 Źródło: obliczenia własne

( ) ( )

( ) ( )

8

1 11

01 8 82 2

1 11 1

66.64 66.64 66.640.99

67.2291.59 49.33 4518.14

t tt

t tt t

y y x xr

y y x x

=

= =

− ⋅ −= = = = ≈

⋅− ⋅ −

∑

∑ ∑

;

ty y− 2 2tx x− ( ) ( )2 2t ty y x x− ⋅ − ( )2

ty y− ( )2

2 2tx x−

-5.08 3.87 -19.66 25.81 14.98 -4.19 2.77 -11.61 17.56 7.67 -2.53 -1.13 2.52 6.40 1.28 0.42 -3.83 -1.61 0.18 14.67 0.75 1.67 1.25 0.56 2.79 2.09 0.57 1.19 4.37 0.33 4.09 -3.93 -16.07 16.73 15.44 4.47 0.01 0.04 19.98 0.00 Suma -43.95 91.59 57.16 Źródło: obliczenia własne

( ) ( )

( ) ( )

8

2 21

02 8 82 2

2 21 1

43.95 43.95 43.950.61

72.3691.59 57.16 5235.28

t tt

t tt t

y y x xr

y y x x

=

= =

− ⋅ −− − −= = = = ≈ −

⋅− ⋅ −

∑

∑ ∑

.

Korzystając z poprzedniej metody obliczymy również współczynnik korelacji między

zmiennymi objaśniającymi.

25

1 1tx x− 2 2tx x− ( ) ( )1 1 2 2t tx x x x− ⋅ − ( )2

1 1tx x− ( )2

2 2tx x−

-3.88 3.87 -15.02 15.05 14.98 -2.77 2.77 -7.67 7.67 7.67 -2.22 -1.13 2.51 4.93 1.28 0.56 -3.83 -2.14 0.31 14.67 1.12 1.67 1.87 1.25 2.79 1.11 0.57 0.63 1.23 0.33 2.78 -3.93 -10.93 7.73 15.44 3.34 0.01 0.03 11.16 0.00 Suma -30.72 49.33 57.16

Źródło: obliczenia własne

( ) ( )

( ) ( )

8

1 1 2 21

12 8 82 2

1 1 2 21 1

30.72 30.72 30.720.58

53.1049.33 57.16 2819.70

t tt

t tt t

x x x xr

x x x x

=

= =

− ⋅ −− − −= = = = ≈ −

⋅− ⋅ −

∑

∑ ∑

.

Otóż mamy trzy współczynniki korelacji: 01 0.99r = , 02 0.61r = − , 12 21 0.58r r= = − .

Można to zapisać również w takiej postaci:

010

02

0.99

0.61

r

r

= = −

R ; 12

21

1 1 0.58

1 0.58 1

r

r

− = = −

R .

Teraz możemy przystąpić do wyboru optymalnej kombinacji zmiennych

objaśniających w modelu. W tym celu zastosujemy metodę Hellwiga.

Mając dwie zmienne objaśniające możemy utworzyć ( )2 1L − kombinacji, gdzie L –

liczba potencjalnych zmiennych objaśniających. Dla 2L = liczba kombinacji wynosi

( )22 1 4 1 3− = − = . Będą to następujące kombinacje:

1) { }1 1K X= ,

2) { }2 2K X= ,

3) { }3 1 2,K X X= .

Dla każdej z tych kombinacji obliczymy integralne pojemności nośników informacji:

1) dla kombinacji 1K :

2 201

11

0.990.9801

1 1

rh = = = ,

1 11 0.9801H h= = ,

26


( )2202

22

0.610.3721

1 1

rh

−= = = ,

2 22 0.3721H h= = ,


2 201

3112

0.990.6203

1 1 0.58

rh

r= = =

+ + −,

( )2202

3221

0.610.2355

1 1 0.58

rh

r

−= = =

+ + −,

3 31 32 0.6203 0.2355 0.8558H h h= + = + = .

Z obliczeń wynika, że największą integralną pojemność informacji ma kombinacja

pierwsza, co oznacza, że do wyjaśnienia zmienności kosztów całkowitych produkcji jogurtów

wystarczy uwzględnić tylko wielkość produkcji (zmienną 1X ).

Metoda analizy grafów

Metoda analizy grafów, jak i poprzednia metoda, opiera się na założeniu, że zmienne

objaśniające powinny być silnie skorelowane ze zmienną objaśnianą i słabo skorelowane

między sobą. W metodzie tej na początku dokonuje się weryfikacji statystycznej istotności

współczynników korelacji między potencjalnymi zmiennymi objaśniającymi ijr . Dla każdego

ze współczynników należy zweryfikować hipotezę [17]:

0 : 0ijH r = dla i j≠ wobec hipotezy alternatywnej 1 : 0ijH r ≠ .

W tym celu obliczana jest wartość statystyki:

2

2

1

ij

ij

r nt

r

−=

−, (1.11)

którą porównuje się z wartością krytyczną tα . Wartości krytyczne można odczytać z tablic

rozkładu t Studenta (Aneks A) dla przyjętego poziomu istotności α oraz 2n− stopni

swobody, przy czym n oznacza liczbę obserwacji, na podstawie których obliczono

współczynniki korelacji. Stwierdzenie, że t tα≤ nie daje podstaw do odrzucenia hipotezy

27

zerowej, a więc świadczy, że współczynnik korelacji między zmiennymi jest statystycznie

nieistotny.

Często w praktyce obliczany jest modyfikowany współczynnik korelacji r ∗ :

( )( ) 2

2

1 2 2

t n tr

t n n tα α

α α

∗ −= =

+ − − + , (1.12)

którego wartość porównuje się z rzeczywistą wartością współczynnika korelacji ijr . W

przypadku, gdy ijr r ∗≤ uznaje się, że związek pomiędzy zmiennymi jest statystycznie

nieistotny i w macierzy R wartości ijr zastępuje zerami. W ten sposób otrzymuje się macierz

′R , której elementami są zera i statystycznie istotne współczynniki korelacji.

Otrzymana macierz ′R jest podstawą budowy grafu powiązań między zmiennymi.

Wierzchołkami grafu są potencjalne zmienne objaśniające, a łączącymi je krawędziami –

statystycznie istotne współczynniki korelacji.

W rezultacie można otrzymać graf spójny lub graf składający się z podgrafów

spójnych i tzw. wierzchołków izolowanych, czyli wierzchołków (zmiennych), które nie

połączyły się z innymi.

Zasadą jest, że do modelu wybiera się tyle zmiennych, w ile grup połączyły się

potencjalne zmienne objaśniające. Będą to wszystkie wierzchołki izolowane oraz jedna

zmienna z każdego podgrafu spójnego, która ma najwyższy rząd wierzchołka (czyli jest

powiązana – istotnie skorelowana – z największą liczbą potencjalnych zmiennych

objaśniających, a więc będzie reprezentować je wszystkie). Jeżeli więcej niż jeden

wierzchołek ma ten sam, najwyższy rząd, to wybiera się tę zmienną, która jest najsilniej

skorelowana ze zmienną endogeniczną (objaśnianą) i dopiero wówczas korzystamy z

informacji zawartych w wektorze 0R [17].

Przykład 1.2.

Na podstawie danych z 30 obserwacji (30n = ) zmiennej objaśnianej Y i 8

potencjalnych zmiennych objaśniających ( 1 2 3 4 5 6 7 8, , , , , , ,X X X X X X X X) obliczono

następujące współczynniki korelacji:

28

0

0.47

0.54

0.66

0.78

0.50

0.69

0.74

0.58

− − − = − −

R ,

1 0.33 0.40 0.28 0.17 0.26 0.36 0.34

1 0.19 0.35 0.23 0.62 0.29 0.31

1 0.32 0.24 0.32 0.19 0.51

1 0.38 0.18 0.22 0.18

1 0.31 0.34 0.28

1 0.35 0.26

1 0.20

1

− − − − − − − − − = −

−

R .

Wykorzystując metodę grafów, wybierzemy optymalną kombinację zmiennych

objaśniających do modelu ekonometrycznego. W tym celu zbadamy statystyczną istotność

otrzymanych współczynników korelacji korzystając ze wzoru (12).

Na początku musimy odczytać wartość krytyczną statystyki t z tablic rozkładu t

Studenta (Aneks A) dla poziomu istotności 0.05α = oraz 2 30 2 28n− = − = stopni swobody.

Wartość ta wynosi 2.0484 (0,05;28 2.0484t = ). Zatem

2

2

2.0484 4.200.13 0.36

30 2 2.0484 28 4.20r ∗ = = = ≈

− + +.

To znaczy, że współczynniki korelacji, których wartość absolutna jest mniejsza lub

równa r ∗ ( 0.36ijr ≤ ) uznajemy za statystycznie nieistotnie różniące się od zera i w macierzy

R zastępujemy zerami. W rezultacie otrzymujemy macierz:

1 0 0.40 0 0 0 0 0

1 0 0 0 0.62 0 0

1 0 0 0 0 0.51

1 0.38 0 0 0

1 0 0 0

1 0 0

1 0

1

− − ′ =

R .

Na podstawie danej macierzy możemy zbudować graf powiązań między zmiennymi

objaśniającymi (rys. 1.3).

29

Rys. 0.3. Graf powiązań między zmiennymi objaśniającymi

Potencjalne zmienne połączyły się w cztery grupy, co oznacza, że do naszego modelu

wystarczy wybrać cztery zmienne objaśniające.

Z pierwszego podgrafu (1 3 8, ,X X X ) wybieramy zmienną 3X ze względu na to, że ona

wniesie do modelu także informacje o zmiennych 1X i 8X . Wierzchołek 3X ma najwyższy

rząd.

Z drugiego podgrafu ( 2 6,X X ) widać, że obydwa wierzchołki mają taki sam rząd. W

tej sytuacji należy wybrać tą zmienną objaśniającą, która jest silniej skorelowana ze zmienną

Y . Jest to zmienna 6X .

Na podobnych zasadach dokonujemy wyboru właściwej zmiennej z podgrafu

trzeciego, czyli ( 4 5,X X ). Ze względu na to, że 04 05r r> wybieramy 4X .

Czwartą zmienną objaśniającą będzie 7X , która nie jest w sposób istotny skorelowana

z żadną inną zmienną objaśniającą, tzn. informacje, które ona niesie w sobie nie zostaną

wniesione do modelu przez inne zmienne objaśniające.

Podsumowując nasze rozważania możemy zaproponować uwzględnienie w modelu

ekonometrycznym następujących zmiennych: 3X , 4X , 6X i 7X , czyli będzie to model

( )3 4 6 7, , ,Y f X X X X= .

X1 X3

X8 X6

X2

X5

X4 X7

30

1.4.3. Estymacja modelu

Założenia klasycznego modelu regresji liniowej Wiadomo, że każdy model jest uproszczeniem rzeczywistości. Dlatego zawiera on pewny

zestaw założeń. Model liniowy w zapisie macierzowo-wektorowym wraz z założeniami

można zapisać następująco [15, s. 215-216]:

1. 1 11 n k k nn × × ××

= ⋅ +y X α ε (każda obserwacja ty jest liniową funkcją obserwacji tjx oraz składnika

losowego tε , czyli model, którego parametry szacujemy, jest modelem liniowym).

2. X jest macierzą nielosową, zatem zmienne objaśniające są zmiennymi nielosowymi

(ustalonymi w powtarzalnych próbach; dla każdego 1,...,t n= na poziomie 1,...,t tKx x ).

3. ( )rz 1K n= + <X (tzn. macierz X ma pełny rząd kolumnowy); wektory wartości

poszczególnych zmiennych objaśniających (kolumny macierzy X ) są liniowo

niezależne (nie występuje współliniowość zmiennych objaśniających); liczba

zmiennych objaśniających (ze stałą 1) jest mniejsza od liczby obserwacji.

4. ( )1n×

=E ε 0 – składnik losowy ma wartość oczekiwaną równą zeru (czyli zakłócenia

różnokierunkowe kompensują się).

5. Macierz wariancji i kowariancji składników losowych jest równa:

( ) ( )T 2nσ= =V ε E εε I , gdzie 20 σ≤ < +∞ ,

co oznacza, że:

• 2 2tEε σ= – wariancja składnika losowego jest stała dla wszystkich obserwacji

(dla każdego t ); własność ta nazywana jest jednorodnością, stałością lub homo-

skedatycznością wariancji,

• 0t sEε ε = dla wszystkich s t≠ – składniki losowe poszczególnych obserwacji są

nieskorelowane (nie występuje autokorelacja składników losowych).

Zestaw założeń 1-5 nazywamy klasycznym modelem regresji liniowej (KMRL).

Jeśli dodamy założenie:

6. nNε ∼ (składnik losowy ε ma n -wymiarowy rozkład normalny),

to otrzymamy zestaw założeń 1-6, nazywany klasycznym modelem normalnej regresji

liniowej (KMNRL).

31

Klasyczna metoda najmniejszych kwadratów

Jak już wspominaliśmy, estymacja modelu polega na oszacowaniu parametrów

strukturalnych, parametrów rozkładu składnika losowego i innych miar dopasowania modelu

do obserwacji.

Dla obserwacji zmiennej objaśnianej Y ( ; 1,...,ty t n= ) i K zmiennych objaśniających

1,..., KX X ( 1,..., ; 1,...,t tKx x t n= ) należy ustalić model typu (1.6), dla którego suma kwadratów

odchyleń danych obserwacji od danych, obliczonych zgodnie z modelem, jest najmniejsza.

Wówczas model taki będą wyznaczały wartości teoretyczne ˆty , w których nieznane

parametry ( 0,..., Kα α ) zastąpiono ich ocenami (0,..., Ka a ) [17]:

0 1 1 2 2ˆ ...t t t K tKy a a x a x a x= + + + + , (1.13)

a odchylenia wartości teoretycznych od danych obserwacji stanowią reszty ( te ):

ˆt t te y y= − . (1.14)

Zatem funkcję kryterium Metody Najmniejszych kwadratów (MNK) można zapisać

skalarnie [17]:

( ) ( )

( )

0 0

0

20 ,..., ,...,

1 1

2

0 1 1 2 2,...,1

ˆ,..., min min

min ...

K K

K

n n

K t t ta a a a

t t

n

t t t K tKa at

S a a e y y

y a a x a x a x

= =

=

= = − =

= − − − − −

∑ ∑

∑

(1.15)

Po obliczeniu pochodnych cząstkowych funkcji ( )0,..., KS a a względem szukanych

ocen parametrów, przyrównania tych pochodnych do zera (warunek konieczny istnienia

ekstremum) i pewnych przekształceniach, otrzymamy (znany ze statystyki) układ równań

normalnych:

1 1 2 2

21 0 1 1 1 2 1 2 1

22 0 2 1 1 2 2 2 2

...

...

...

...............................................................................

t t t K tK

t t t t t t K t tK

t t t t t t K t tK

y na a x a x a x

y x a x a x a x x a x x

y x a x a x x a x a x x

= + + + +

= + + + +

= + + + +

∑ ∑ ∑ ∑

∑ ∑ ∑ ∑ ∑

∑ ∑ ∑ ∑ ∑

20 1 1 2 2

.............

...t tK tK t tK t tK K tKy x a x a x x a x x a x= + + + +∑ ∑ ∑ ∑ ∑

, (1.16)

którego rozwiązaniem są szukane oceny parametrów.

32

Klasyczna metoda najmniejszych kwadratów w zapisie macierzowym

W zapisie macierzowym – dla modelu (7) – = +y Xa ε wektor wartości teoretycznych

można zapisać jako ˆ =y Xa , a wektor reszt jako ˆ= −e y y , gdzie:

1

2

ˆ

ˆˆ

ˆn

y

y

y

=

yM

,

0

1

K

a

a

a

=

aM

,

1

2

n

e

e

e

=

eM

,

przy czym a jest szukanym wektorem ocen parametrów strukturalnych.

Kryterium MNK – minimalizacja sumy kwadratów reszt ma postać [17]:

( ) ( ) ( )TTmin minS = = −a a

a e e y - Xa y Xa (1.17)

i po dalszych przekształceniach:

( ) T T T T T2S = − +a y y a X y a X Xa .

Pochodną funkcji kryterium ( )S a względem szukanego wektora a przyrównujemy do zera:

( ) T T2 2S∂

= − + =∂

aX y X Xa 0

a.

Przekształcając dalej, otrzymujemy układ równań normalnych (w zapisie macierzowym):

T T T T2 2= ⇔ =X Xa X y X Xa X y ,

którego rozwiązaniem jest szukany wektor ocen parametrów strukturalnych:

( ) 1T T−=a X X X y . (1.18)

( )2T

22

S∂=

∂a

X Xa

jest macierzą określoną dodatnio, zatem spełniony jest też warunek

dostateczny istnienia minimum funkcji ( )S a , a także istnieje ( ) 1T −X X .

Twierdzenie Gaussa-Markowa

W klasycznym modelu regresji liniowej najlepszym, nieobciążonym estymatorem liniowym

wektora a jest wektor otrzymany metodą najmniejszych kwadratów [17]:

( ) 1T T−=a X X X y

o macierzy wariancji i kowariancji ( ) ( ) 12 Tσ−

=V a X X .

33

W KMNRL estymator MNK ma k -wymiarowy rozkład normalny, tj.

( )( )12 T,kN σ−

a α X X∼ .

Nieobciążonym estymatorem wariancji składnika losowego 2σ jest wariancja

resztowa 2eS . Wzór dla 2

eS można zapisać w takiej postaci macierzowej:

( ) ( ) ( ) ( )

( )

T T2 T

T T T

1 1 1ˆ ˆ

1

eSn k n k n k

n k

= = − − = − − =− − −

= −−

ε ε y y y y y Xa y Xa

y y a X y (1.19)

gdzie:

n – liczba obserwacji,

k – liczba szacowanych parametrów strukturalnych ( 1k K= + ),

n k− – liczba stopni swobody,

y Xa= – wektor wartości teoretycznych,

ˆe y y= − – wektor reszt.

Natomiast w postaci skalarnej 2eS można obliczyć za pomocą wzoru:

2 2

1

1 K

e tt

S en k =

=− ∑ . (1.20)

Pierwiastek kwadratowy z wariancji resztowej nazywamy odchyleniem

standardowym resztowym. Obliczamy go za pomocą prostego wzoru:

2e eS S= (1.21)

Odchylenie standardowe resztowe informuje nas o ile średnio wartości teoretyczne zmiennej

objaśnianej ˆty różnią się od jej wartości empirycznych ty .

Macierz wariancji i kowariancji ocen parametrów strukturalnych

Nieobciążonym estymatorem macierzy wariancji i kowariancji estymatora MNK, tj. macierzy

( ) ( ) 12 Tσ−

=V a X X jest macierz wariancji i kowariancji ocen parametrów

strukturalnych [17]:

( ) ( ) 12 2 TeS

−= ⋅D a X X . (1.22)

34

Pierwiastek kwadratowy z j -tego elementu diagonalnego macierzy ( )2D a

(oznaczamy go symbolem ( )jD a ) nazywamy błędem średnim szacunku oceny ja .

Informuje on o ile średnio wyznaczona metodą najmniejszych kwadratów ocena ja może

różnić sie od rzeczywistej wartości parametru jα . Innymi słowy, błąd średni szacunku oceny

ja jest indykatorem precyzji oszacowania danego współczynnika regresji.

Oznaczmy elementy macierzy ( ) 1T −X X przez ijd . Wówczas przez

( ) 2j jjV a dσ=

będziemy oznaczać wariancję j -tego parametru regresji, przez

( )2 2j e jjD a S d=

będziemy oznaczać ocenę wariancji j -tego parametru regresji, natomiast przez

( ) 2 2j e jj e jjD a S d S d= ⋅ =

będziemy oznaczać ocenę błędu średniego szacunku j -tego parametru regresji.

Współczynniki dopasowania modelu do danych obserwacji

W celu dokonania oceny dokładności dopasowania opracowanego modelu do danych

obserwacji oblicza się szereg współczynników. Mianowicie, należy obliczyć współczynnik

zmienności resztowej eV , współczynnik zbieżności 2ϕ oraz współczynnik determinacji 2R .

Do obliczenia w/w współczynników służą wzory [17]:

100ee

SV

y= ⋅ , (1.23)

( )( )

( )

22

2 1

2 2

1 1

n

tet

n n

t tt t

en k S

y y y yϕ =

= =

−= =

− −

∑

∑ ∑

, (1.24)

gdzie ( ) ( )22 2 1t t ty y y y

n− = −∑ ∑ ∑ , (1.25)

2 21R ϕ= − . (1.26)

Współczynnik zmienności resztowej wyjaśnia, jaką część wartości średniej zmiennej

endogenicznej stanowią odchylenia losowe.

35

Z kolei współczynnik determinacji informuje, jaka część całkowitej zaobserwowanej

zmienności zmiennej endogenicznej jest wyjaśniona przez model.

Natomiast współczynnik zbieżności informuje nas o tym, jaka część całkowitej

zaobserwowanej zmienności zmiennej endogenicznej nie została wyjaśniona przez model.

Dwa ostatnie współczynniki przyjmują wartości z przedziału [0;1].

Przedział ufności dla parametrów strukturalnych modelu

Należy zwrócić uwagę na ten fakt, iż otrzymane oceny parametrów strukturalnych (wektor a )

mają charakter ocen punktowych. Natomiast nas interesują prawdziwe wartości parametrów

odpowiadające założonemu poziomowi prawdopodobieństwa P , który może przyjmować

wartości 0.90 (90%), 0.95 (95%) lub 0.99 (99%). Najczęściej wybierany jest 95% poziom

prawdopodobieństwa.

W tym celu dla każdego parametru jα budujemy przedziały ufności zgodnie z

formułą [17]:

( ) ( ){ } 1j j j j jP a t D a a t D aα αα α− ⋅ < < + ⋅ = − . (1.27)

Rozpiętość przedziału ufności zależy od założonego prawdopodobieństwa 1P α= − , a

więc założonego poziomu istotności α (bowiem tα odczytuje się z tablic rozkładu t Studenta

(Aneks A) dla przyjętego α oraz dla n k− stopni swobody), a także od wielkości błędu

średniego szacunku parametru.

Przykład 1.3.

W przykładzie 1 ustaliliśmy, że koszty całkowite przedsiębiorstw wytwarzających

jogurty zależą do wielkości ich produkcji. Teraz spróbujemy oszacować parametry modelu

ekonometrycznego opisującego tę zależność.

Na początku dane obserwacji naniesiemy na układ współrzędnych (rys. 1.4).

36

Rys. 0.4. Zależność kosztów całkowitych od wielkości produkcji Źródło: dane umowne

Jak widać z powyższego rysunku może to być zależność liniowa. Zatem nasz model w

postaci ogólnej możemy zapisać:

1 1t tY Xα α ε= + + . (1.28)

Dalej sporządzimy tabelę, która umożliwi nam oszacowanie parametrów modelu:

Przedsiębiorstwo ty tx 2

tx t tx y⋅

1 9.89 1.67 2.79 16.52

2 10.78 2.78 7.73 29.97

3 12.44 3.33 11.09 41.43

4 15.39 6.11 37.33 94.03

5 15.72 6.67 44.49 104.85

6 17.06 6.66 44.36 113.62

7 19.06 8.33 69.39 158.77

8 19.44 8.89 79.03 172.82

∑ 119.78 44.44 296.21 732.01


Parametry strukturalne modelu możemy oszacować korzystając ze wzoru (1.18):

( ) 1T T−=a X X X y ,

gdzie:

5

7

9

11

13

15

17

19

21

1,67 2,78 3,33 6,11 6,67 6,66 8,33 8,89

37

1

2

3

4

5

6

7

8

1 1 1.67

1 1 2.78

1 1 3.33

1 1 6.11

1 1 6.67

1 1 6.66

1 1 8.33

1 1 8.89

x

x

x

x

x

x

x

x

= =

X ,

1

2

3

4

5

6

7

8

9.89

10.78

12.44

15.39

15.72

17.06

19.06

19.44

y

y

y

y

y

y

y

y

= =

y ,

zatem

1

2

3

14T

1 2 3 4 5 6 5 2

1 16

1

1

1

1 1 1 1 1 1 1 1

1

1

1

n

tt

n nn

t tt t

n

x

x

xn x

x

x x x x x x x xx x

x

x

=

= =

= ⋅ =

∑

∑ ∑

X XL

L

M M

,

1

2

3

14T

1 2 3 4 5 6 5

16

1 1 1 1 1 1 1

n

tt

nn

t tt

n

y

y

yy

y

x x x x x x x yx y

y

y

=

=

= ⋅ =

∑

∑

X yL

L

M

.

Teraz podstawimy nasze dane do powyższych wzorów:

8

1T

8 82

1 1

88 44.44

44.44 296.21

tt

t tt t

x

x x

=

= =

= =

∑

∑ ∑

X X ,

8

1T

8

1

119.78

732.01

tt

t tt

y

x y

=

=

= =

∑

∑

X y .

Otrzymane macierze podstawimy do wzoru (1.18) i otrzymamy:

( )1

1T T 8 44.44 119.78

44.44 296.21 732.01

−−

= = ⋅

a X X X y .

38

Najpierw obliczymy macierz odwrotną do TX X za pomocą wzoru

( ) ( )1T

T

1

det

−= ⋅ TX X A

X X,

gdzie A jest macierzą algebraicznych dopełnień składającą się z elementów

( )1i j

ij ija d+= − ⋅ ,

przy czym ijd – podwyznacznik macierzy TX X po wykreśleniu i-tego wiersza

i j-tej kolumny.

Obliczymy wyznacznik macierzy TX X :

( )Tdet 8 296.21 44.44 44.44 2369.68 1974.9136 394.7664= ⋅ − ⋅ = − =X X .

Podwyznacznik macierzy TX X składa się z elementów:

11 296.21d = , 12 44.44d = ,

21 44.44d = , 22 8.00d = .

Dalej wyznaczymy elementy macierzy A :

( )1 1

11 1 296.21 296.21a+= − ⋅ = ,

( )1 2

12 1 44.44 44.44a+= − ⋅ = − ,

( )2 1

21 1 44.44 44.44a+= − ⋅ = − ,

( )2 2

22 1 8.00 8.00a+= − ⋅ = .

Zatem otrzymujemy

296.21 44.44

44.44 8.00

− = −

A oraz 296.21 44.44

44.44 8.00

− = −

TA ,

gdyż macierz A jest symetryczną odnośnie głównej przekątnej.

Teraz możemy wyznaczyć macierz odwrotną do macierzy TX X :

( ) 1T 296.21 44.44 0.75 0.1126144.44 8.00 0.1126 0.0203394.7664

− − − = ⋅ = − −

X X ,

co umożliwi nam obliczenie parametrów strukturalnych modelu ekonometrycznego

0a oraz 1a .

Podstawimy otrzymane rezultaty do wzoru (1.18):

0

1

0.75 0.1126 119.78 0.75 119.78 0.1126 732.01

0.1126 0.0203 732.01 0.1126 119.78 0.0203 732.01

a

a

− ⋅ − ⋅ = = ⋅ = − − ⋅ + ⋅

a

39

89.83 82.42 7.41

13.49 14.86 1.37

− = = − +

Otóż mamy oszacowany model, który przyjmuje postać:

ˆ 7.41 1.37t ty x= + ⋅ .

Obliczymy teraz wartości teoretyczne dla zmiennej objaśnianej:

1ˆ 7.41 1.37 1.67 9.70y = + ⋅ = ,

2ˆ 7.41 1.37 2.78 1.22y = + ⋅ = ,

3ˆ 7.41 1.37 3.33 11.97y = + ⋅ = ,

4ˆ 7.41 1.37 6.11 15.78y = + ⋅ = ,

5ˆ 7.41 1.37 6.67 16.55y = + ⋅ = ,

6ˆ 7.41 1.37 6.66 16.53y = + ⋅ = ,

7ˆ 7.41 1.37 8.33 18.82y = + ⋅ = ,

8ˆ 7.41 1.37 8.89 19.59y = + ⋅ = .

Po oszacowaniu parametrów strukturalnych modelu obliczymy parametry struktury

stochastycznej. Najpierw obliczymy odchylenia danych teoretycznych zmiennej objaśnianej

od danych faktycznych, tzn. obliczymy reszty według wzoru:

ˆt t te y y= − .

Obliczenia pomocnicze wpiszemy do poniższej tabeli:

P-wo ty 2

ty ˆty te 2te ty y− ( )2

ty y−

1 9.89 97.81 9.70 0.19 0.0361 -5.08 25.81 2 10.78 116.21 11.22 -0.44 0.1936 -4.19 17.56 3 12.44 154.75 11.97 0.47 0.2209 -2.53 6.40 4 15.39 236.85 15,78 -0.39 0.1521 0.42 0.18 5 15.72 247.12 16.55 -0.83 0.6889 0.75 0.56 6 17.06 291.04 16.53 0.53 0.2809 2.09 4.37 7 19.06 363.28 18.82 0.24 0.0576 4.09 16.73 8 19.44 377.91 19.59 -0.15 0.0225 4.47 19.98

Σ 119.78 1884.97 120.16 1.6526 91.59 Źródło: obliczenia własne

Wariancję resztową można obliczyć na podstawie wzoru (1.19) lub (1.20). Według

ostatniego wzoru otrzymamy:

40

82 2

1

1 11.6526 0.275

8 8 2e tt

S ek =

= ⋅ = ⋅ =− −∑ .

Ze wzoru (1.21) otrzymamy odchylenie standardowe:

2 0.275 0.524e eS S= = = ± .

To znaczy, że wartości teoretyczne kosztów całkowitych przedsiębiorstw

wytwarzających jogurty różnią się średnio o 0.524± mln zł od wartości zaobserwowanych w

rzeczywistości.

Na podstawie wzoru (1.22) obliczymy macierz wariancji i kowariancji ocen

parametrów strukturalnych:

( ) ( ) 12 2 T 0.75 0.1126 0.2063 0.03100.275

0.1126 0.0203 0.0310 0.0056eS− − −

= ⋅ = ⋅ = − − D a X X .

Pierwiastki z elementów diagonalnych macierzy (przekątna główna) dają możliwość

obliczenia błędów średnich szacunku parametrów:

( )0 0.2063 0.454D a = = ,

( )1 0.0056 0.075D a = = .

Na podstawie wzoru (1.23) obliczymy współczynnik zmienności resztowej:

0.524100% 100% 3.5%

14.97e

e

SV

y= ⋅ = ⋅ = ,

co oznacza, że odchylenia losowe stanowią 3.5% średniego poziomu zmiennej objaśnianej.

Ze wzoru (1.24) otrzymamy współczynnik zbieżności:

( )

82

2 18

2

1

1.65260.018

91.59

tt

tt

e

y yϕ =

=

= = =−

∑

∑

.

Wartość tego współczynnika informuje nas o tym, że tylko 1.8% całkowitej

zaobserwowanej zmienności zmiennej objaśnianej nie zostało wyjaśnione przez model

ekonometryczny, innymi słowy jest to wynikiem wpływu czynników losowych.

Na podstawie wzoru (1.26) możemy obliczyć współczynnik determinacji:

2 21 1 0.018 0.982R ϕ= − = − = ,

który informuje nas o tym, że 98.2% całkowitej zmienności zmiennej objaśnianej zostało

wyjaśnione przez model.

Uwzględniając parametry struktury stochastycznej, oszacowany model przyjmuje postać:

41

ˆ 7.41 1.37t ty x= + ⋅ , 0.524eS = , 3.5%eV = , 2 0.018ϕ = .

(0.454) (0.075)

Z naszego modelu widać, że koszt całkowity składa się z kosztu stałego (7.41) oraz

iloczynu jednostkowego kosztu zmiennego (1.37) i wielkości produkcji ( tx ), co potwierdza

nasza wiedza ekonomiczna.

Poza oszacowaniem parametrów modelu należy jeszcze wyznaczyć przedziały ufności

dla takich parametrów modelu jak koszt stały (0α ) oraz jednostkowy koszt zmienny (1α ).

W ekonometrii najczęściej ustala się 95%-owy przedział ufności dla parametrów

modelu. Oznacza to, że z tablic t Studenta (Aneks A) należy odczytać t statystyki dla

95%1 0.05

100%α = − = oraz 8 2 6n k− = − = stopni swobody. Jest to wartość 0.05;6 2.447t = .

Otóż dla parametru 0α otrzymujemy:

{ }07.41 2.447 0.454 7.41 2.447 0.454 1 0.05P α− ⋅ < < + ⋅ = − .

Natomiast dla 1α otrzymujemy:

{ }17.41 2.447 0.075 7.41 2.447 0.075 1 0.05P α− ⋅ < < + ⋅ = −

Otrzymane wyniki możemy skomentować w sposób następujący: z

prawdopodobieństwem 0.95 koszty stałe produkcji jogurtów mieszczą się w przedziale

(6.30;8.52) mln zł, a jednostkowy koszt zmienny – w przedziale (1.19;1.55) mln zł/mln ton.

1.4.4. Weryfikacja modelu

Następnym etapem jest weryfikacja zbudowanego modelu, tzn. sprawdzenie tego jak dobrze

model opisuje badane zjawisko. Na tym etapie dokonuje się dwóch rodzajów weryfikacji w

takiej kolejności: najpierw weryfikacja merytoryczna, później weryfikacja statystyczna. Jeśli

weryfikacja merytoryczna się powiodła, to można przejść do weryfikacji statystycznej. W

przeciwnym przypadku model należy dopracować.

Weryfikacja merytoryczna opiera się przede wszystkim na wiedzy ekonomicznej i

doświadczeniu. Należy tu ocenić czy otrzymane wyniki mają sens ekonomiczny i mogą

przyjmować takie wartości w rzeczywistości. Przy tym należy zwrócić uwagę na znaki „plus”

lub „minus” ocen parametrów strukturalnych, które to znaki wskazują nam charakter

zależności zmiennej objaśnianej od danej zmiennej objaśniającej.

42

Natomiast weryfikacja statystyczna jest weryfikacją formalną, która opiera się na

wiedzy matematycznej, tzn. należy przede wszystkim ocenić stopień zgodności modelu z

danymi empirycznymi, potem ocenić jakość ocen parametrów strukturalnych (statystyczną

istotność ocen parametrów strukturalnych) oraz sprawdzić spełnienie założeń o składnikach

losowych.

Ogólne zasady weryfikacji statystycznej

Na pierwszym etapie weryfikacji statystycznej należy sprawdzić, czy model w wystarczająco

wysokim stopniu wyjaśnia kształtowanie się zmiennej objaśnianej. W tym celu obliczamy

takie współczynniki, jak odchylenie standardowe resztowe eS , współczynnik zmienności

resztowej eV , współczynnik determinacji 2R lub współczynnik zbieżności 2ϕ . Dopasowanie

modelu do obserwacji jest tym lepsze, im wartości współczynnika zmienności resztowej są

niższe, wartości współczynnika determinacji bliższe 1, a wartości współczynnika zbieżności

są bliższe zeru.

Z kolei drugi etap statystycznej weryfikacji modelu obejmuje między innymi badanie

istotności ocen parametrów strukturalnych i/lub weryfikację istotności układu

współczynników regresji. W praktyce można także testować inne hipotezy dotyczące

parametrów strukturalnych.

Natomiast na etapie trzecim weryfikuje się czwarte i piąte założenia klasycznej

metody najmniejszych kwadratów, mianowicie, że: wartość oczekiwana składnika losowego

jest równa zeru ( ) 0E ε = , oraz macierz wariancji i kowariancji składników losowych jest

równa ( ) ( ) 2TnV E σ= =ε ε ε Ι , czyli wariancja składnika losowego 2 2

tσ σ= (jest stała i równa

2σ dla wszystkich obserwacji), a kowariancje składników losowych są równe zeru, czyli nie

występuje autokorelacja składników losowych.

Założenie czwarte można sprawdzić po oszacowaniu parametrów strukturalnych

modelu i obliczeniu reszt te , które traktowane są jako przybliżone realizacje składnika

losowego (przypomnijmy, że suma reszt jest równa zeru, a więc średnia reszt jest równa

zeru). Natomiast weryfikacja spełnienia założenia piątego wymaga zastosowania

odpowiednich testów statystycznych. Często sprawdza się także takie własności składnika

losowego, jak normalność i losowość.

43

Ocena jakości ocen parametrów strukturalnych

Weryfikacja statystycznej istotności ocen parametrów strukturalnych

Weryfikacja statystycznej istotności ocen 0 1, ,..., Ka a a parametrów strukturalnych liniowego

modelu ekonometrycznego ma na celu sprawdzenie czy parametry strukturalne 0 1, ,..., Kα α α

zostały oszacowane z dostateczną precyzją oraz czy zmienne objaśniające, przy których stoją

te parametry, istotnie wpływają na zmienną objaśnianą. Dla każdego parametru jα

( 0,1,...,j K= ) weryfikuje się hipotezę zerową

0 : 0jH α = wobec hipotezy alternatywnej 1 : 0jH α ≠ .

Sprawdzianem w tym teście jest statystyka [17]:

( ) ( )1j j

j

at a

D a

α−= , (1.29)

gdzie

ja – ocena j -tego parametru,

jα – prawdziwa, założona w 0H wartość parametru 0jα = ,

( )jD α – błąd średni szacunku j -tego parametru.

Przy prawdziwości hipotezy 0H statystyka ( )jt α będzie miała rozkład t Studenta o

n k− stopniach swobody. Dlatego po obliczeniu dla każdego z parametrów wartości

empirycznej statystyki Studenta – ( )jt α z tablic rozkładu t Studenta (Aneks A) dla

przyjętego poziomu istotności α ( 0.05α = , co odpowiada poziomowi prawdopodobieństwa

0.95) oraz dla n k− stopni swobody, odczytujemy wartość krytyczną tα .

W przypadku, gdy ( )jt tαα ≤ przyjmujemy hipotezę 0H , co oznacza, że ocena ja

statystycznie nieistotnie różni się od zera (jest nieistotna), a wobec tego zmienna objaśniająca

jX nie wywiera istotnego wpływu na zmienną objaśnianą Y . Natomiast, jeśli ( )jt tαα > , to

hipotezę 0H należy odrzucić i przyjąć hipotezę 1H , która oznacza, że ocena ja statystycznie

istotnie różni się od zera (jest istotna), a wobec tego zmienna objaśniająca jX oddziałuje w

sposób istotny na zmienną objaśnianą Y .

44

Hipotezy dotyczące układu współczynników regresji

Oprócz badania statystycznej istotności pojedynczych parametrów można także testować

hipotezę o istotnym wpływie na zmienną objaśnianą wszystkich uwzględnionych w modelu

zmiennych objaśniających (badanie istotności układu współczynników regresji, bez wyrazu

wolnego) lub wybranej ich grupy.

W przypadku testowania wpływu na zmienną objaśnianą wszystkich zmiennych

objaśniających hipoteza zerowa ma postać:

0 1 2: ... 0KH α α α= = = = .

Wówczas hipoteza alternatywna

1 1 2: ... 0KH α α α+ + + ≠

zakłada, że przynajmniej jeden ze współczynników regresji jest statystycznie istotny (nie

równy zeru), tzn. co najmniej jedna zmienna objaśniająca istotnie wpływa na zmienną

objaśnianą.

Sprawdzianem hipotezy zerowej jest w tym przypadku statystyka F:

2

21 1

n k RF

k R

−= ⋅− −

, (1.30)

która przy założeniu prawdziwości hipotezy zerowej ma rozkład F Fishera–Snedecora z

1 1n k= − oraz 2n n k= − stopniami swobody (n – liczbą obserwacji, k – liczbą parametrów

strukturalnych modelu włącznie z wyrazem wolnym) (Aneks B).

Obliczoną wartość statystyki F należy więc porównać z wartością krytyczną Fα ,

odczytaną z tablic rozkładu Fishera-Snedecora dla przyjętego poziomu istotności α oraz 1n i

2n stopni swobody.

Jeśli F Fα> , to hipotezę zerową należy odrzucić i przyjąć hipotezę 1H o tym, że co

najmniej jedna zmienna objaśniająca istotnie wpływa na zmienną endogeniczną. Natomiast w

przypadku, gdy F Fα< , hipoteza zerowa jest prawdziwa, a więc żadna z uwzględnionych w

modelu zmiennych nie oddziałuje istotnie na zmienną objaśnianą.

W praktyce jednak częściej weryfikuje się hipotezę dotyczącą podukładu

współczynników regresji (patrz. [17, s. 55]).

45

Testowanie innych hipotez dotyczących pojedynczych parametrów strukturalnych

Wśród innych hipotez najczęściej weryfikuje się hipotezę o tym, że wybrany parametr

przyjmuje pewną konkretną wartość jα ∗ , czyli hipotezę

0 : j jH α α ∗=

wobec hipotezy alternatywnej

1 : j jH α α ∗≠ (lub j jα α ∗> , lub j jα α ∗< )

W celu sprawdzenia hipotezy zerowej stosuje się t statystyka Studenta, tzn.

obliczamy wartość

( ) ( )j j

j

j

tD

α αα

α

∗−= , (1.31)

którą porównujemy z wartością krytyczną tα , odczytaną z tablic rozkładu t Studenta (Aneks

A) dla przyjętego poziomu istotności α oraz n k− stopni swobody.

W przypadku, gdy obliczona wartość t statystyki nie przekracza wartości krytycznej

tα (czyli ( )jt tαα ≤ ), przyjmujemy hipotezę 0H . Natomiast wartości t statystyki większe od

wartości krytycznej (tzn. ( )jt tαα > ) sugerują przyjęcie hipotezy 1H .

Wnioskowanie o liniowej funkcji wektora parametrów α

Załóżmy, że interesuje nas parametr γ , będący liniową kombinacją elementów wektora α , co

można zapisać [17]

Tγ = c α ,

gdzie c jest wektorem współczynników kombinacji liniowej [ ]T0... Kc c=c , czyli

T

0

K

j jj

cγ α=

= =∑c α . (1.32)

W klasycznym modelu regresji liniowej najefektywniejszym estymatorem liniowych

funkcji Tγ = c α jest estymator uzyskany metodą najmniejszych kwadratów:

( ) 1T T Tγ−

= c X X X y , (1.33)

którego wariancja jest równa:

( ) ( ) ( ){ }12 T 2 2 T TˆeD Sγ

−= =c D a c c X X c . (1.34)

46

Zatem błąd średni szacunku, można obliczyć ze wzoru:

( ) ( ) ( )1 1T 2 T T Tˆe eD S Sγ

− −= ⋅ ⋅ = ⋅ ⋅c X X c c X X c (1.35)

Mając błąd średni szacunku, można zbudować przedział ufności dla parametru γ

według wzoru:

( ) ( ){ }ˆ ˆ ˆ ˆ 1P t D t Dα αγ γ γ γ γ α− ⋅ ≤ ≤ + ⋅ = − . (1.36)

Można także weryfikować hipotezy dotyczące omówionej kombinacji liniowej

wektora parametrów (np., że jest ona równa pewnej liczbie 0c , gdzie 0c jest wyrazem

wolnym tej kombinacji). Hipoteza zerowa ma w tym przypadku postać 0 0:H cγ = , a hipoteza

alternatywna 1 0:H cγ ≠ . Przy prawdziwości 0H statystyka:

( )0ˆ

ˆc

tD

γγ

−= (1.37)

ma rozkład Studenta o n k− stopniach swobody. Obliczoną wartość statystyki t należy zatem

porównać z wartością krytyczną tα (Aneks A). 0H odrzuca się, jeżeli t tα> , natomiast nie

ma podstaw do jej odrzucenia, jeżeli t tα≤ .

Przykład 1.4.

Załóżmy, że model ekonometryczny ma postać:

1 2ˆ 54.4 12.7 8.2t t ty x x= − + ,

(2.23) (1.71) (0.92)

1.017eS = ± , 1.95%eV = , 2 0.977R = , 2k = , 14n = .

Zweryfikujmy najpierw hipotezę o tym, że każdy ze współczynników regresji jest

statystycznie istotny. Oznacza to, że dla każdego z parametrów należy zweryfikować hipotezę

0 : 0jH α = wobec hipotezy alternatywnej 1 : 0jH α ≠ ( 0,1,2j = ).

W tym celu dla każdego z parametrów obliczamy za pomocą wzoru (1.29) wartości:

( )0

54.4 024.39

2.23t a

−= = ,

( )1

12.7 07.43

1.71t a

− −= = − ,

( )2

8.2 08.91

0.92t a

−= = .

47

Dla porównania odczytujemy wartość krytyczną t statystyki z tablic rozkładu t

Studenta (Aneks A) dla 0.05α = i 14 2 12n k− = − = stopni swobody.

Jest to wartość

; 0.05;12 2.1788n kt tα − = = .

Porównujemy otrzymane wartości z wartością krytyczną, tzn. czy spełnione są

nierówności ( ) ;n kt tαα −> , czyli

24.39 2.1788> ,

7.43 2.1788− > ,

8.91 2.1788> .

Ten fakt, iż zostały spełnione wszystkie trzy nierówności upoważnia nas do

odrzucenia hipotezy zerowej na korzyść hipotezy alternatywnej. Oznacza to, że wszystkie

parametry strukturalne modelu są statystycznie istotne.

A teraz zweryfikujemy hipotezę o tym, że przynajmniej jedna ze zmiennych

objaśniających z naszego modelu wywiera istotny wpływ na zmienną objaśnianą, tzn.

przynajmniej jeden ze współczynników regresji jest statystycznie istotny. Innymi słowy

należy zweryfikować hipotezę

0 1 2: 0H α α= = wobec hipotezy 1 1 2: 0H α α+ ≠ ( 0,1,2j = ).

W tym celu wykorzystamy wzór:

2

2

14 2 0.977509.74

1 1 2 1 1 0.977

n k RF

k R

− −= ⋅ = ⋅ =− − − −

.

Dla porównania należy odczytać wartość krytyczną z tablic rozkładu F Fishera–

Snedecora (Aneks B) dla 0.05α = ; 1 1 2 1 1m k= − = − = ; 2 14 2 12m n k= − = − = stopni

swobody. Jest to wartość

1 2; ; 0.05;1;12 4.75m mF Fα = = .

Ponieważ 1 2; ;m mF Fα> (gdyż 509.74 4.75> ), to hipotezę zerową możemy odrzucić, co

jest równoznaczne z przyjęciem hipotezy alternatywnej. Oznacza to, iż przynajmniej jeden ze

współczynników regresji jest statystycznie istotny.

48

Badanie założeń o składnikach losowych

Badanie stałości wariancji składników losowych

Ponieważ w praktyce może występować sytuacja, gdy wariancja składnika losowego nie jest

stała (mamy wówczas do czynienia z niejednorodnością lub homoskedatycznością składnika

losowego), co niekorzystnie wpływa na zbudowany model, należy przeprowadzić badanie

stałości wariancji tego składnika za pomocą testu Goldfelda i Quandta.

Zastosowanie w/w testu polega na zweryfikowaniu hipotezy o równości wariancji

dwóch skrajnych grup obserwacji. W tym celu formujemy uporządkowane próby. W

przypadku danych zależnych od czasu sortujemy je według jednostek czasu, natomiast w

przypadku danych przekrojowych – według rosnących wartości jednej ze zmiennych

objaśniających. Badaniu poddaje się dwa podzbiory danych o liczebnościach 1n i 2n , co do

których istnieje przypuszczenie, że ich wariancja jest najmniejsza i największa. Przy czym

dopuszczalne jest pominięcie kilku środkowych obserwacji.

Weryfikacji podlega hipoteza o równości wariancji składników losowych w obu

podzbiorach 2 20 1 2:H σ σ= . Alternatywną do hipotezy zerowej jest hipoteza 2 2

1 1 2:H σ σ< , co

oznacza, że wariancja składnika losowego w drugiej podpróbie jest statystycznie istotnie

większa od wariancji w pierwszym podzbiorze. Do sprawdzania hipotez służy F statystyka

Fishera–Snedecora (Aneks B), przy założeniu normalności składników losowych. W tym celu

obliczamy wartość statystyki:

2221

SF

S= , (1.38)

gdzie:

21S – wariancja resztowa regresji w pierwszym podzbiorze,

22S – wariancja resztowa regresji w drugim podzbiorze.

Otrzymaną wartość statystyki F porównujemy z wartościami krytycznymi Fα

odczytanymi z tablic rozkładu Fishera–Snedecora dla przyjętego poziomu istotności α oraz

dla 2n k− i 1n k− stopni swobody (Aneks B). Jeśli F Fα≤ , to nie ma podstaw do odrzucenia

0H o jednorodności wariancji. Natomiast, gdy F Fα> , należy przyjąć hipotezę 1H .

49

Badanie autokorelacji składników losowych

Autokorelacja oznacza, że składniki losowe poszczególnych obserwacji są skorelowane ze

sobą. To zjawisko najczęściej występuje wtedy, gdy model jest budowany na podstawie

danych zależnych od czasu (tzn. przedstawionych w postaci szeregów czasowych). Do

mierzenia autokorelacji służy współczynnik τ , który mierzy zależność między zmiennymi

losowymi tε o wskaźnikach t różniących się od siebie (odległych od siebie) o τ jednostek.

Współczynnik autokorelacji z próby (ˆτρ ) oblicza się jako współczynnik korelacji

między resztami odległymi o τ jednostek (czyli między te i te τ− ; przy czym e i e τ− są,

odpowiednio, średnia reszt i reszt opóźnionych) [17]:

( ) ( )( ) ( )2 2

ˆ t tt

t t

e e e e

e e e e

τ τ

τ τ

ρ − −

− −

− ⋅ −=

− ⋅ −

∑

∑, 1,2,...τ = (1.39)

Jeśli mamy dane w postaci szeregów czasowych i dodatkowo założymy, że składniki

losowe tworzą proces autoregresyjny rzędu pierwszego, tzn.

1 1t t tε ρ ε ξ−= + , (1.40)

gdzie 1ρ jest współczynnikiem autokorelacji rzędu pierwszego, to można pokazać, że

współczynnik autokorelacji rzędu τ jest równy 1τρ . Zatem wystarczy zbadać, czy występuje

autokorelacja rzędu pierwszego.

W celu zweryfikowania hipotezy o nieistotności współczynnika autokorelacji (braku

autokorelacji) najczęściej korzysta się z testu Durbina–Watsona, przy czym hipotezę

alternatywną (występuje autokorelacja dodatnia lub ujemna) można doprecyzować dopiero po

obliczeniu statystyki:

( )2

12

2

1

n

t tt

n

tt

e ed

e

−=

=

−=∑

∑

. (1.41)

Statystyka d przyjmuje wartości z przedziału [0;4].

50

Jeżeli hipoteza zerowa jest prawdziwa (autokorelacja nie występuje), 2d = , wartości

2d < świadczą o autokorelacji dodatniej, natomiast wartości 2d > świadczą o autokorelacji

ujemnej.

Dalej należy sprawdzić, czy autokorelacja ta jest statystycznie istotną. Zatem w

zależności od otrzymanej wartości d można doprecyzować hipotezę alternatywną.

Weryfikujemy zatem hipotezę zerową o braku autokorelacji rzędu pierwszego

składników losowych:

0 1: 0H ρ =

wobec hipotezy konkurencyjnej:

1 1: 0H ρ > , gdy 2d < (występuje dodatnia korelacja rzędu pierwszego)

lub 1 1: 0H ρ < , gdy 2d > (występuje ujemna korelacja rzędu pierwszego).

W przypadku autokorelacji ujemnej dla porównania z wartościami krytycznymi należy

obliczyć 4d d′ = − .

Obliczoną wartość statystyki d (lub d′ w przypadku autokorelacji ujemnej)

porównuje się z wartościami krytycznymi Ld i Ud odczytanymi z tablic Durbina–Watsona

(Aneks E) dla przyjętego poziomu istotności α oraz n i K stopni swobody (n – liczba

obserwacji, K – liczba zmiennych objaśniających w modelu, bez zmiennej tożsamościowo

równej 1).

Jeśli Ud d> ( Ud d′ > ), nie ma podstaw do odrzucenia hipotezy o braku autokorelacji

dodatniej (ujemnej) rzędu pierwszego (a zatem i wyższych rzędów) na poziomie istotności

α . Przyjmujemy więc, że nie występuje dodatnia (ujemna) autokorelacja rzędu pierwszego.

Jeśli Ld d< ( Ld d′ < ), to 0H odrzucamy na rzecz 1H , a więc na poziomie istotności

α przyjmujemy, że występuje dodatnia (ujemna) autokorelacja rzędu pierwszego.

Jeśli L Ud d d≤ ≤ ( L Ud d d′≤ ≤ ), wpadamy w obszar nierozstrzygalności testu – nie

możemy przesądzić o występowaniu lub braku autokorelacji rzędu pierwszego. Należy

wówczas stosować testy alternatywne.

Warto dodać, że mając obliczoną statystykę d , można obliczyć zgodne oszacowanie

współczynnika autokorelacji rzędu pierwszego:

1ˆ 12

dρ = − . (1.42)

51

Badanie normalności rozkładu składników losowych

Mimo tego, że założenie normalności składników losowych nie występuje w klasycznym

modelu regresji liniowej, powinno być ono spełnione w przypadku stosowania testów

opartych na statystyce F Fishera–Snedecora (Aneks B). Należy zaznaczyć, że założenie

normalności składników losowych jest jednym z założeń klasycznego modelu normalnej

regresji liniowej.

Do badania normalności odchyleń losowych można wykorzystać np. test Shapiro–

Wilka, test Hellwiga etc. Jednak warunkiem koniecznym zastosowania wyżej wymienionych

testów jest uporządkowanie reszt niemalejąco. W tym przypadku weryfikacji podlega

hipoteza zerowa o tym, że składniki losowe mają rozkład normalny, co można zapisać jak

0 :H Nε ∼ .

Hipotezą alternatywną do niej będzie hipoteza o tym, że rozkład składników losowych

nie jest rozkładem normalnym, tzn.

( )1 :H Nε¬ ∼ .

Jeśli do sprawdzania hipotezy zerowej wykorzystamy test Shapiro–Wilka, to należy

obliczyć wartość statystyki W według wzoru:

( )[ ]

( )

22

1 11

2

1

n

n t n t tt

n

tt

a e e

We e

− + − +=

=

−

=−

∑

∑ , (1.43)

gdzie 1n ta − + są najlepszymi nieobciążonymi współczynnikami obliczonymi i stablicowanymi

przez S.S. Shapiro i M.B. Wilka (Aneks F). Przy czym [ ]2n (entier) jest częścią całkowitą

2n , a jeśli w modelu występuje wyraz wolny, to 0e = .

Otrzymaną wartość statystyki W porównujemy z wartością krytyczną Wα dla

poziomu istotności α (Aneks G). Jeśli W Wα≥ , nie ma podstaw do odrzucenia hipotezy 0H ,

natomiast jeśli W Wα< , należy przyjąć hipotezę alternatywną.

Natomiast w przypadku, gdy zdecydujemy się na zastosowanie testu Hellwiga, należy

przeprowadzić standaryzację reszt według wzoru [12, s. 154]:

tt

e

e ee

S

−′ = , 1,2,...,t n= , (1.44)

( )2

1

1 n

e tt

S e en =

= −∑ . (1.45)

52

gdzie

e – średnia arytmetyczna reszt,

eS – odchylenie standardowe reszt.

Po uporządkowaniu reszt niemalejąco, z tablic dystrybuanty rozkładu normalnego

odczytujemy wartości dystrybuant ( ) ( ) ( )1 2, ,..., nF e F e F e′ ′ ′ , a następnie wyznaczamy tak

zwane cele tI . Cele te są przedziałami liczbowymi o rozpiętości 1 n , powstałymi z

podzielenia odcinka [ ]0;1 na równe części, co można zapisać jak

[ ) [ ) ( )0;1 1 ;2 ... 1 ;1n n n n n ∪ ∪ ∪ − .

Wartości dystrybuanty ( )tF e′ przyporządkowuje się odpowiednim celom i określa

liczbę cel pustych (K ), tj. takich, do których nie trafia żadna wartość ( )tF e′ .

Z tablic testu zgodności Hellwiga dla liczby obserwacji n oraz przyjętego poziomu

istotności α odczytuje się wartości krytyczne 1K i 2K .

Jeśli 1 2K K K< < , nie ma podstaw do odrzucenia hipotezy zerowej, natomiast jeśli

1K K< lub 2K K> , to należy przyjąć hipotezę alternatywną (czyli odchylenia losowe nie

mają rozkładu normalnego).

Badanie losowości reszt

Badanie losowości reszt jest związane z prawidłowym wyborem postaci analitycznej modelu.

Jeśli model jest prawidłowy, oznacza to, że reszty będą miały charakter losowy. W celu

przeprowadzenia badania tego rodzaju należy zweryfikować hipotezę zerową

0H o tym, że reszty te mają rozkład losowy,

wobec hipotezy alternatywnej 1H , która przewiduje, że rozkład reszt nie ma charakteru

losowego. Do sprawdzenia w/w hipotez można wykorzystać test serii.

W teście serii dla danego ciągu reszt 1 2, ,..., ne e e resztom dodatnim ( 0te > )

przyporządkowuje się symbol a , z kolei resztom ujemnym ( 0te < ) – symbol b , natomiast

reszty równe zeru ( 0te = ) pomija się [12]. Potem należy ustalić liczbę serii S , która oznacza

liczbę podciągów jednakowych symboli a lub b , czyli podciągów złożonych z reszt

dodatnich lub ujemnych.

53

W przypadku testu jednostronnego empiryczną liczbę serii S porównuje się z

wartością krytyczną Sα dla przyjętego poziomu istotności α oraz 1n i 2n stopni swobody

(Aneks C, D). Przypomnijmy, że 1n jest liczbą reszt dodatnich (liczbą elementów a ), a 2n –

liczbą reszt ujemnych (liczbą elementów b ).

Zauważmy, że test jednostronny stosuje się w przypadku niewielkiej liczby

obserwacji. Jeśli S Sα> , nie ma podstaw do odrzucenia hipotezy zerowej, a więc postać

analityczna modelu jest dobrana prawidłowo. Natomiast jeżeli S Sα≤ , przyjmujemy hipotezę

alternatywną, co oznacza, że postać analityczna modelu jest źle dobrana, a więc należy

powrócić do etapu wyboru postaci analitycznej modelu ekonometrycznego.

W przypadku gdy korzystamy z testu dwustronnego, z tablic liczby serii odczytuje się

dwie wartości krytyczne 1S i 2S dla przyjętego poziomu istotności α (tj. dla 2α i 1 2α− )

oraz 1n i 2n stopni swobody. Podstawą do odrzucenia hipotezy zerowej jest 1S S< (zbyt

mała liczba serii) lub 2S S≥ (zbyt duża liczba serii). Zatem reszty mają rozkład losowy ( 0H

jest prawdziwa), jeżeli 1 2S S S< < .

Przykład 1.5.

Zweryfikujemy własności reszt modelu oszacowanego w przykładzie 1.3.

Najpierw uporządkujemy nasze dane statystyczne według rosnących wartości

zmiennej objaśniającej X, a także obliczymy wartości reszt:

t tx ty ˆty te

1 1.67 9.89 9.70 0.19 2 2.78 10.78 11.22 -0.44 3 3.33 12.44 11.97 0.47 4 6.11 15.39 15.78 -0.39 5 6.67 15.72 16.55 -0.83 6 6.66 17.06 16.53 0.53 7 8.33 19.06 18.82 0.24 8 8.89 19.44 18.59 -0.15

Σ 44.44 119.78 120.16 Źródło: dane umowne

Obliczone wartości reszt przedstawimy na wykresie (rys. 1.5).

54

Rys. 0.5. Rozrzut reszt Źródło: dane umowne

Jak widać na powyższym rysunku wartości reszt oscylują wokół zera. Dlatego

pominiemy badanie stałości wariancji. Gdyby reszty wykazywały tendencję wzrostową lub

spadkową należałoby takie badanie przeprowadzić.

Zbadamy autokorelację składników losowych.

Do obliczenia statystyki d Durbina–Watsona wykorzystamy wzór (1.41):

( )8

2

12

82

1

t tt

tt

e ed

e

−=

=

−=∑

∑

.

W celu ułatwienia obliczeń przeprowadzimy dodatkowe obliczenia, które

przedstawimy w postaci:

t te 1te− 1t te e−− ( )2

1t te e−− 2te

1 0.19 – – – 0.0361 2 -0.44 0.19 -0.63 0.3969 0.1936 3 0.47 -0.44 0.91 0.8281 0.2209 4 -0.39 0.47 -0.86 0.7396 0.1521 5 -0.83 -0.39 -0.44 0.1936 0.6889 6 0.53 -0.83 1.36 1.8496 0.2809 7 0.24 0.53 -0.29 0.0841 0.0576 8 -0.15 0.24 -0.39 0.1521 0.0225

Σ 4.244 1.6526 Źródło: obliczenia własne

-1

-0,8

-0,6

-0,4

-0,2

0

0,2

0,4

0,6

1 2 3 4 5 6 7 8

55

Na podstawie danych z powyższej tabeli otrzymujemy

4.2442.568

1.6526d = = .

Ponieważ 2.568 2d = > , więc mamy autokorelację ujemną. Zatem należy

zweryfikować hipotezę:

0 1: 0H ρ = wobec hipotezy alternatywnej 1 1: 0H ρ < .

Z wartościami krytycznymi odczytanymi z tablic Durbina–Watsona (Aneks E)

będziemy porównywać wartość

4 4 2.568 1.432d d′ = − = − = .

Wartości krytyczne dla 0.05α = ; 8n = i 1K = (jedna zmienna objaśniająca)

wynoszą:

0.73Ld = , 1.33Ud = .

Ponieważ Ud d′ > (1.432 1.33> ), więc nie ma podstaw do odrzucenia hipotezy o

braku autokorelacji ujemnej rzędu pierwszego (a zatem i wyższych rzędów).

Wykorzystując test Shapiro–Wilka zweryfikujemy hipotezę o normalności rozkładu

reszt, czyli hipotezę:

( )0 :H Nε ∼ wobec hipotezy ( )1 :H Nε¬ ∼ .

Hipoteza alternatywna mówi o tym, że reszty nie mają rozkładu normalnego. Na

podstawie wzoru (1.43) dla 10n = (10 obserwacji) obliczymy

( )

( )

25

10 1 10 11

102

1

t t tt

tt

a e e

We e

− + − +=

=

− =

−

∑

∑

.

Potrzebne będą nam obliczenia pomocnicze, które przedstawimy w postaci tabeli

(poniżej). Przy czym wartość średnią dla reszt obliczymy według wzoru:

10

1 1.010.10

10 10

tt

ee == = ≈∑

.

Zauważmy, że współczynniki 1n ta − + odczytujemy z tablic Shapiro–Wilka (Aneks F)

dla 10n = . Są to dane z kolumny 3.

56

t te

uporządkowane 10 1ta − + 10 1t te e− + − ( )10 1 10 1t t ta e e− + − +⋅ − te e− ( )2

te e−

1 2 3 4 5 6 7

1 -0.83 0.5739 1.54 0.8838 -0.93 0.8649 2 -0.44 0.3291 1.12 0.3686 -0.54 0.2916 3 -0.39 0.2141 0.92 0.1970 -0.49 0.2401 4 -0.15 0.1224 0.62 0.0759 -0.25 0.0625 5 0.19 0.0399 0.05 0.0020 0.09 0.0081 6 0.24 0.14 0.0196 7 0.47 0.37 0.1369 8 0.53 0.43 0.1849 9 0.68 0.58 0.3364 10 0.71 0.61 0.3721

Σ 1.01 1.5273 2.5171 Źródło: obliczenia własne

Zatem 21.5273 2.3326

0.92672.5171 2.5171

W = = = .

Wartość krytyczna W odczytana z tablic Shapiro–Wilka (Aneks G) dla poziomu

istotności 0.05α = i 10 obserwacji ( 10n = ) wynosi 0.842Wα = .

Porównujemy tą wartość z obliczoną wartością W . Ponieważ W Wα> (gdyż

0.9267 0.842> ), więc nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, że reszty

mają rozkład normalny.

Za pomocą testu serii zweryfikujemy hipotezę zerową o tym, że reszty mają

charakter losowy, wobec hipotezy alternatywnej. Dla przykładu weźmiemy taki ciąg reszt:

0.19; -0.44; 0.47; -0.39; -0.83; 0.53; -0.24; -0.15.

Resztą o wartościach dodatnich przypiszemy symbol a, natomiast resztą o wartościach

ujemnych – symbol b. W rezultacie otrzymamy taki ciąg symboli:

a b a bb a bb.

Zatem w powyższym ciągu mamy 6 serii ( 6S = ).

Policzymy ilość wartości dodatnich i tą liczbę oznaczymy 1 3n = . To samo zrobimy i

dla wartości ujemnych, tzn. 2 5n = .

Zakładamy, że wystarczającym jest poziom istotności 0.05α = . Zatem należy

obliczyć:

0.05 0.0252 2α = = ,

57

0.051 1 0.9752 2α− = − = .

Wartości krytyczne z testu serii dla powyższych danych wynoszą (Aneks C, D):

1 2S = , 2 7S = .

Ponieważ 2 7S< < , więc nie ma podstaw do odrzucenia hipotezy zerowej, czyli

hipotezy o losowości reszt. Oznacza to, że oszacowany model prawidłowo opisuje

modelowane zjawisko (proces) ekonomiczne.

1.4.5. Merytoryczna interpretacja parametrów strukturalnych

oszacowanych modeli

Merytoryczna interpretacja parametrów zbudowanego modelu jest nieodłączną częścią

badania ekonometrycznego, która to interpretacja pomaga w zrozumieniu charakteru związku

przyczynowo–skutkowego zachodzącego pomiędzy zmienną objaśnianą a poszczególnymi

zmiennymi objaśniającymi.

Na przykład w funkcji jednej zmiennej

0 1Y Xα α= + (1.46)

ocenę parametru 0α można interpretować jako średni poziom zmiennej objaśnianej Y przy

zerowym poziomie zmiennej objaśniającej X . Jeśli ocena tego parametru jest ujemna, co

często jest uzasadnione, interpretację się pomija. Natomiast wzrost wartości zmiennej

objaśniającej X o jednostkę powoduje zmianę (wzrost lub spadek) wartości zmiennej

objaśnianej przeciętnie o 1α jednostek.

Z kolei w funkcji liniowej wielu zmiennych

0 1 1 2 2 ... K KY X X Xα α α α= + + + + (1.47)

ocenę parametru 0α interpretuje się jako przeciętny poziom zmiennej objaśnianej Y , gdy

wszystkie zmienne objaśniające przyjmą wartość zerową ( 1 2 ... 0KX X X= = = = ). Jeśli ocena

tego parametru jest ujemna, wtedy trudno mówić o jego sensownej interpretacji

ekonomicznej. Natomiast wzrost wartości j -tej zmiennej objaśniającej ( jX ) o jednostkę

powoduje zmianę wartości zmiennej objaśnianej Y średnio o jα jednostek, przy

niezmienionych pozostałych zmiennych.

58

1.5. Modele nieliniowe

Rozpatrzyliśmy przypadek liniowej zależności między zmienną objaśnianą a zmiennymi

objaśniającymi. W rzeczywistości zależność ta może mieć również charakter nieliniowy.

Zatem po dokonaniu wyboru zmiennych objaśniających modelu należy dobrać odpowiednią

do tej zależności funkcję matematyczną. Wśród najczęściej spotykanych funkcji nieliniowych

należy wymienić funkcję wykładniczą, potęgową, logarytmiczną, hiperboliczną, logistyczną,

wielomiany i inne.

Postać analityczną modelu można dobrać kilkoma sposobami [17, s. 120]:

1. W przypadku modelu z jedną zmienną objaśniającą najłatwiej jest zastosować analizę

graficzną rozrzutu punktów empirycznych na układzie współrzędnych (taki wykres może

być łatwo wykonany w Excelu). Jeżeli w modelu występuje kilka zmiennych

objaśniających, można analizować graficznie zależność między zmienną objaśnianą

a każdą zmienną objaśniającą.

2. Bardzo często korzysta się z apriorycznej wiedzy o typie związku, który może

podpowiadać bądź teoria ekonomii, bądź też dogłębna znajomość prawidłowości

kształtujące badane związki.

3. Metodą prób i błędów, polegającą na tym, że do zebranych danych empirycznych

dopasowuje się kilka funkcji o różnych postaciach analitycznych, a następnie wybiera

najlepszą w oparciu o wnioski z weryfikacji wszystkich modeli.

4. W przypadku modeli tendencji rozwojowej (trendu) do wyboru postaci analitycznej

można wykorzystać analizę przyrostów – analizuje się przyrosty zmiennej objaśnianej

przypadające na jednostkę przyrostu zmiennej objaśniającej. Mianowicie, jeżeli

jednostkowym przyrostom zmiennej objaśnianej odpowiadają statystycznie stałe (nie

wykazujące tendencji do wzrostu lub spadku):

• pierwsze przyrosty absolutne 1 1t t ty y y−∆ = − , to właściwa jest funkcja liniowa;

• drugie przyrosty absolutne 2 1 1 1t t ty y y−∆ = ∆ − ∆ (czyli przyrosty pierwszych

przyrostów), to odpowiedni jest wielomian stopnia 2, trzecie przyrosty absolutne –

wielomian stopnia 3 itd.;

• przyrosty względne 1t t t

t t

y y y

y y+ − ∆= lub stopy zmian 1t

t

y

y+ , to właściwa jest funkcja

wykładnicza.

59

1.5.1. Rodzaje modeli nieliniowych

Wszystkie modele nieliniowe można podzielić na dwie podstawowe grupy:

I. Modele transformowalne do postaci liniowej, czyli takie, które za pomocą pewnych

przekształceń można doprowadzić do postaci liniowej, której parametry szacuje się za

pomocą metody najmniejszych kwadratów. Modele z tej grupy z kolei można

podzielić na dwie podgrupy, mianowicie:

a) modele nieliniowe względem zmiennych, liniowe względem parametrów,

b) modele nieliniowe względem zmiennych i parametrów.

II. Modele ściśle nieliniowe, do estymacji których należy stosować techniki estymacji

nieliniowej.

1.5.2. Charakterystyka wybranych modeli nieliniowych

Funkcja wykładnicza Funkcja wykładnicza często jest wykorzystywana w modelach tendencji rozwojowej lub jako

czynnik wykładniczy w innej funkcji, na przykład potęgowej. Może ona przyjmować różne

postaci, np. [17]:

0 1XY α α= ⋅ , 1 0α > . (1.48)

Przy czym ocena parametru 0α interpretowana jest jako poziom zmiennej objaśnianej

Y , gdy 0X = . Natomiast 1 1α − jest charakterystyczną dla tej funkcji stałą stopą zmian

zmiennej objaśnianej; wzrost ( )X t o jednostkę powoduje zmiany zmiennej objaśnianej o

( )1 1 100%α − ⋅ .

Wartości parametru 1 1α > świadczą, że wraz ze wzrostem zmiennej objaśniającej X

zmienna objaśniana Y rośnie, natomiast wartości 10 1α< < świadczą, że wzrostowi zmiennej

objaśniającej towarzyszy spadek wartości zmiennej objaśnianej (rys. 1.6).

60

Rys. 0.6. Wykres funkcji wykładniczej 0 1XY α α= ⋅

W praktyce stosowane także funkcje wykładnicze o innych postaciach, jak na przykład

przedstawione na rysunkach 1.7 i 1.8 funkcje:

0 1XY eα α+= , (1.49)

10

XY eαα= ⋅ . (1.50)

Rys. 0.7. Wykres funkcji wykładniczej 0 1XY eα α+=

61

Rys. 0.8. Wykres funkcji wykładniczej 10

XY eαα= ⋅

W przypadku funkcji (1.49), gdy zmienna objaśniająca 0X = , wartość zmiennej

objaśnianej wynosi 0Y eα= . Przy czym stała stopa zmian Y jest równa ( )1 1 100%eα − ⋅ .

Zauważmy, że w tym przypadku wzrostowi X towarzyszy wzrost Y , jeżeli 1 0α > ,

natomiast Y wykazuje tendencję spadkową, jeżeli 1 0α < . Natomiast w funkcji (1.50) poziom

1 0α > , gdy 0X = , jest równy 0α , a stopa zmian jest równa ( )1 1 100%eα − ⋅ .

Funkcja potęgowa

Funkcja potęgowa jest bardzo często wykorzystywana w modelach ekonometrycznych,

opisujących zarówno zależności o charakterze nieliniowym, jak i liniowym. Funkcja

potęgowa o jednej zmiennej objaśniającej ma postać:

10Y Xαα= ⋅ (1.51)

W przypadku tej funkcji ocenę parametru 0α interpretuje się jako poziom zmiennej

objaśnianej Y , gdy zmienna objaśniająca X przyjmuje wartość 1 (rys. 1.9).

Z kolei od parametru 1α zależy przebieg funkcji, bowiem parametr ten jest stałą

elastycznością zmiennej objaśnianej Y względem zmiennej objaśniającej X i oznacza w

przybliżeniu procentową zmianę Y spowodowaną zmianą X o 1%.

62

Rys. 0.9. Wykres funkcji potęgowych

Natomiast funkcja potęgowa o wielu zmiennych objaśniających ma postać:

1 20 1 2 ... K

KY X X Xα α αα= ⋅ ⋅ ⋅ ⋅ . (1.52)

W tym przypadku ocena parametru 0α jest poziomem zmiennej objaśnianej Y , gdy

wszystkie zmienne objaśniające przyjmą wartość równą 1 ( 1 2 ... 1KX X X= = = = ).

Z kolei oceny parametrów jα ( 1,...,j K= ) interpretuje się jako stałe elastyczności

zmiennej objaśnianej Y względem poszczególnych zmiennych objaśniających jX . Oznacza

to, że wzrost jX o 1% powoduje zmianę Y o około %jα , przy niezmienionych pozostałych

zmiennych.

Funkcja logarytmiczna

Funkcję logarytmiczną można zapisać w takiej ogólnej postaci:

0 1 logY Xα α= + , 0X > . (1.53)

W przypadku tej funkcji ocenę 0α interpretuje się jako poziom zmiennej objaśnianej

Y , gdy zmienna objaśniająca 1X = . Funkcję tę stosuje się wtedy, gdy jednostkowym

63

przyrostom zmiennej objaśniającej towarzyszą coraz mniejsze przyrosty zmiennej objaśnianej

(por. rys. 1.10)

Rys. 0.10. Wykres funkcji logarytmicznej 0 1 logY Xα α= +

Wielomiany

W modelowaniu ekonometrycznych oprócz wielomianu stopnia 1, który jest funkcją liniową,

najczęściej stosowane są wielomiany stopnia 2 i 3.

Wielomian stopnia 2 (nazywany też parabolą) można zapisać w postaci:

20 1 2Y X Xα α α= + + . (1.54)

Jego parametry nie mają interpretacji ekonomicznej. Funkcja ta znajduje najczęściej

zastosowanie w ekonomicznej analizie kosztów, a także wykorzystywana jest jako model

tendencji rozwojowej.

Z kolei wielomian stopnia 3 można zapisać w takiej postaci:

2 30 1 2 3Y X X Xα α α α= + + + . (1.55)

Może on przyjmować różne kształty, w zależności od wartości parametrów. Jedną z

najczęściej stosowanych w praktyce postaci wielomianu stopnia 3 (rys. 1.11) jest funkcja

64

zależności kosztów całkowitych od wielkości produkcji. W tym przypadku na parametry

nakłada się następujące warunki: 0 1 3, , 0α α α > ; 2 0α < ; 22 1 33α α α< ⋅ ⋅ .

Rys. 0.11. Wykres wielomianu stopnia 3 przy podanych warunkach dla parametrów

Funkcja hiperboliczna

Kolejną funkcją, która znalazła zastosowanie w modelowaniu ekonometrycznym jest funkcja

hiperboliczna. Funkcję tą można zapisać w takiej ogólnej postaci:

0 1

1Y

Xα α= + . (1.56)

Najczęściej jest ona stosowana, albo jako funkcja wyrażająca zależność

jednostkowego kosztu produkcji od wielkości produkcji, albo jako funkcja zależności popytu

na jakieś dobro od jego ceny. Wówczas ocena parametru 1α powinna przyjmować wartości

dodatnie ( 1 0α > ). Na rysunku 1.12 przedstawiono możliwe przebiegi funkcji hiperbolicznej

w zależności od parametru wartości oceny parametru 1α .

W przypadku tej funkcji interpretujemy tylko wyraz wolny (na rysunku jest to

asymptota pozioma). Wraz ze wzrostem zmiennej objaśniającej X , zmienna objaśniana Y

zbliża się do asymptoty poziomej w taki sposób: rośnie, gdy 1 0α < , i maleje, gdy 1 0α > ).

65

Rys. 0.12. Wykres funkcji hiperbolicznej

Funkcja wykładnicza z odwrotnością

Oddzielną grupę wśród funkcji nieliniowych stanowią funkcje sigmoidalne albo „S-

kształtne”. Do tej grupy należą między innymi: funkcja wykładnicza z odwrotnością, funkcja

logistyczna oraz krzywe Gompertza.

Funkcję wykładniczą z odwrotnością można zapisać w takiej postaci ogólnej:

1expY

Xα β = + ⋅

, 0α > , 0β < . (57)

Funkcja ta ma asymptotę poziomą (poziom nasycenia) Y eα= , natomiast 2

Xβ= −

jest współrzędną punktu przegięcia: przy 2

Xβ= − , 2Y eα −= (rys. 1.13).

66

Rys. 0.13. Funkcja wykładnicza z odwrotnością

Funkcja logistyczna

Funkcja logistyczna często jest stosowana jako funkcja trendu, czyli jedną ze zmiennych

objaśniających jest czas t [10]. Należy zaznaczyć, że trend logistyczny bardzo dobrze opisuje

zjawiska, w rozwoju których wyraźnie można wyodrębnić trzy etapy: I – bardzo szybki

wzrost, II – wzrost coraz wolniejszy, III – stabilizacja na poziomie bliskim poziomowi

nasycenia α .

Funkcję logistyczną można zapisać w takiej postaci matematycznej:

1 XY

e γα

β −=+ ⋅

, 0α > , 0β > , 0γ > . (1.58)

Interpretację ma tylko parametr α . Jest on asymptotą poziomą zwaną poziomem

nasycenia (rys. 1.14).

Rys. 0.14. Funkcja logistyczna

67

Pierwsza funkcja Tornquista

Poza wymienionymi wyżej standardowymi funkcjami matematycznymi w modelowaniu

ekonometrycznym można spotkać również funkcje o charakterze specjalnym. Do grupy tych

funkcji należą m.in. funkcje Tornquista, których nazwa pochodzi od nazwiska szwedzkiego

ekonomisty.

Funkcje te są najczęściej wykorzystywane w ekonomicznej analizie popytu

konsumpcyjnego. Opisują one zależność popytu (Y ) na różne dobra od wielkości dochodów

konsumentów (X ). Znane są trzy funkcje o tej nazwie.

I funkcja Tornquista ma taką postać matematyczną:

XY

X

αβ

=+

, 0α > , 0β > , (1.59)

Jej przebieg przedstawia rysunek 1.15, przy czym Y α= jest asymptotą poziomą tej

funkcji, tak zwanym poziomem nasycenia, natomiast X β= − jest asymptotą pionową

wykresu funkcji.

Rys. 0.15. Pierwsza funkcja Tornquista

Druga i trzecia funkcje Tornquista

II funkcj ę Tornquista można zapisać w takiej postaci:

( )XY

X

α γβ

−=

+, 0α > , 0β > , 0γ > , (1.60)

gdzie parametry α i β mają interpretację analogiczną jak w pierwszej funkcji Tornquista,

natomiast γ jest poziomem zmiennej objaśniającej X , przy którym pojawia się objaśniane

zjawisko (Y ) (rys. 1.16).

68

Rys. 0.16. Druga funkcja Tornquista

III funkcja Tornquista ma taką postać matematyczną:

( )X XY

X

α γβ−

=+

, 0α > , 0β > , 0γ > . (1.61)

W przypadku tej funkcji interpretacji podlegają tylko dwa parametry: β i γ .

Mianowicie, parametr β jest asymptotą pionową funkcji, a parametr γ – poziomem

zmiennej objaśniającej X , przy którym pojawia się objaśniane zjawisko Y (rys. 1.17).

Rys. 0.17. Trzecia funkcja Tornquista

69

1.5.3. Estymacja metodą najmniejszych kwadratów

modeli transformowalnych do postaci liniowej

Estymację modelu nieliniowego należy rozpocząć od ustalenia czy zakłócenia losowe ( )tε

mają charakter rzeczywisty. Chodzi tu przede wszystkim o to, czy zakłócenia losowe

nakładają się addytywnie (przez dodanie), czy multiplikatywnie (przez pomnożenie).

Dokładniej mówiąc zakłócenia losowe mogą być nałożone:

• jeśli amplituda wahań jest stała – addytywnie: tε+ ,

• jeśli odchylenia losowe są proporcjonalne do poziomu zmiennej objaśnianej (Y ) –

multiplikatywnie, przy czym są dwie możliwości: tε× lub teε× ( 10 tε× ).

Zazwyczaj stosuje się tę drugą możliwość, bowiem po sprowadzeniu do postaci

liniowej zakłócenia losowe nie ulegają transformacji.

Modele transformowalne do postaci liniowej

Modele liniowe względem parametrów

Model ( ),Y f= X α jest liniowy względem parametrów, jeżeli zmienną objaśnianą można

przedstawić jako liniową funkcję jednoznacznych przekształceń zmiennych objaśniających

X , przy czym współczynniki tych przekształceń są znane, czyli model można zapisać w

postaci [17]:

0 1 10

...K

j j K Kj

Y X X Xα α α α=

= = + + +∑ % % % , (1.62)

gdzie

( )j jX X=% . (1.63)

Zatem zmienne pomocnicze jX% są pewnymi funkcjami (przekształceniami)

oryginalnych zmiennych objaśniających jX , a model (1.62) nazywany jest pomocniczym

modelem liniowym

Parametry strukturalne modelu pomocniczego (1.62) szacuje się za pomocą metody

najmniejszych kwadratów, czyli wykorzystując wzór:

( ) 1T T−= ⋅a X X X y% % % , (1.64)

70

przy czym X% jest macierzą obserwacji pomocniczych zmiennych objaśniających, a y –

wektorem obserwacji na zmiennej objaśnianej.

Dla modelu pomocniczego szacuje się następnie parametry struktury stochastycznej,

model pomocniczy poddaje się weryfikacji i jeżeli weryfikacja wypadnie pomyślnie, to

przyjmuje się, że również oryginalny model jest dobrze dopasowany do obserwacji.

Spośród omówionych wcześniej modeli nieliniowych do modeli liniowych względem

parametrów należą m.in.: model hiperboliczny, wielomiany i model logarytmiczny. W tych

modelach zakłócenie losowe nakładane zazwyczaj addytywnie.

Przykład 1.6.

Ustalimy postać analityczną modelu zależności jednostkowego kosztu produkcji (ty )

od wielkości produkcji ( tx ). Ponad to oszacujemy parametry dobranego modelu. Dane

potrzebne do badania dla 10 obserwacji (t ) przedstawiono w poniższej tabeli:

Obserwacja t

1 2 3 4 5 6 7 8 9 10

ty (zł) 44.62 40.77 26.92 24.62 17.69 16.15 15.38 14.62 13.08 11.54

tx

(tys.sztuk) 0.060 0.075 0.150 0.150 0.300 0.375 0.600 0.750 1.500 3.000


Na podstawie danych obserwacji z powyższej tabeli sporządzimy wykres (rys. 1.18).

Rys. 0.18. Zależność jednostkowego kosztu produkcji (ty ) od wielkości produkcji ( tx ) Źródło: dane umowne

Jak widać na rysunku 1.18 do opisu badanej zależności można wykorzystać hiperbolę

(1.56), która po uwzględnieniu zakłócenia losowego przyjmuje postać:

0

0,5

1

1,5

2

2,5

3

3,5

44,62 40,77 26,92 24,62 17,69 16,15 15,38 14,62 13,08 11,54

71

0 1

1t t

t

YX

α α ε= + ⋅ + .

W celu linearyzacji naszego modelu wprowadzimy zmienną pomocniczą

1t

t

XX

=% , przy czym 0tX ≠ .

Wówczas badany model liniowy będzie miał postać:

0 1t t tY Xα α ε= + ⋅ +% .

Korzystając ze wzoru (1.64) oszacujemy parametry naszego modelu, przy czym:

11

22

4

1 11

1 11

1 11 n

xx

xx

xx

= =

x

%

%%

M MM M

%

,

1

2

n

y

y

y

=

yM

,

( )

( ) ( )

1

12

21 2

1 1

1 11

1 1 1 1 1

1 1 11 1

1 1

n

tt

n nn

t tt tn

xn x

x

x x xx x

x

=

= =

= ⋅ =

∑

∑ ∑

TX XL

% %

L M M,

( )

1

12

1 2

1

1 1 1

1 1 11

n

tt

nn

t ttn

yy

y

x x xx y

y

=

=

= ⋅ = ⋅

∑

∑

TX yL

%

L M.

Rezultaty obliczeń pomocniczych zapiszemy w postaci poniższej tabeli:

t ty tx 1

tx

21

tx

1

tt

yx

⋅

1 44.62 0.600 16.67 277.89 743.82 2 40.77 0.075 13.33 177.69 543.46 3 26.92 0.150 6.67 44.49 179.56 4 24.62 0.150 6.67 44.49 164.22 5 17.69 0.300 3.33 11.09 58.91 6 16.15 0.375 2.67 7.13 43.12 7 15.38 0.600 1.67 2.79 27.35 8 14.62 0.750 1.33 1.77 19.44 9 13.08 1.500 0.67 0.45 8.76 10 11.54 3.000 0.33 0.11 3.81

Σ 225.39 6.960 53.34 567.90 1792.45 Źródło: obliczenia własne

72

Na ich podstawie otrzymujemy:

( )1

1 10 53.34 225.39

53.34 567.90 1792.45

−−

= ⋅ = ⋅

T Ta X X X y% % % ,

( ) ( )1 1

det

−= ⋅T T

TX X A

X X% %

% %,

( )det 10 567.90 53.34 53.34 5679.00 2845.16 2833.84= ⋅ − ⋅ = − =TX X% % .

Podwyznacznik macierzy TX X% % składa się z elementów:

11 567.90d = , 12 53.34d = ,

21 53.34d = , 11 10.00d = .

Teraz obliczymy elementy macierzy A :

( )1 1

11 1 567.90 567.90a+= − ⋅ = , ( )1 2

12 1 53.34 53.34a+= − ⋅ = − ,

( )2 1

21 1 53.34 53.34a+= − ⋅ = − , ( )2 2

22 1 10.00 10.00a+= − ⋅ = .

Stąd

567.90 53.34

53.34 10.00

− = −

A

i ze względu na symetrię

567.90 53.34

53.34 10.00

− = −

TA .

Zatem

( ) 1 567.90 53.34 0.2003 0.0188153.34 10.00 0.0188 0.00352833.84

− − − = ⋅ = − −

TX X% %

oraz

0

1

0.2003 0.0188 225.39 0.2003 225.39 0.0188 1792.45

0.0188 0.0035 1792.45 0.0188 225.39 0.0035 1792.45

a

a

− ⋅ − ⋅ = = ⋅ = = − − ⋅ + ⋅

a

45.1456 33.6981 11.4475 11.45

4.2373 6.2736 2.0363 2.04

− = = ≈ − +

.

Otóż mamy model

1ˆ 11.45 2.04 11.45 2.04t t

t

y xx

= + ⋅ = + ⋅% .

73

Korzystając z oszacowanego modelu możemy obliczyć wartości teoretyczne dla

zmiennej objaśnianej:

1ˆ 11.45 2.04 16.67 45.46y = + ⋅ = , 6ˆ 11.45 2.04 2.67 16.90y = + ⋅ = ,

2ˆ 11.45 2.04 13.33 38.64y = + ⋅ = , 7ˆ 11.45 2.04 1.67 14.86y = + ⋅ = ,

3ˆ 11.45 2.04 6.67 25.19y = + ⋅ = , 8ˆ 11.45 2.04 1.33 14.16y = + ⋅ = ,

4ˆ 11.45 2.04 6.67 25.19y = + ⋅ = , 9ˆ 11.45 2.04 0.67 12.82y = + ⋅ = ,

5ˆ 11.45 2.04 3.33 18.24y = + ⋅ = , 10ˆ 11.45 2.04 0.33 12.12y = + ⋅ = .

Dalej obliczymy parametry struktury stochastycznej. W tym celu należy obliczyć

wartość średnią dla zmiennej objaśnianej

10

1 225.3922.539 22.54

10 10

tt

yy == = = ≈

∑

i reszty

ˆt t te y y= − .

Obliczenia pomocnicze zapiszemy w postaci poniższej tabeli:

t ty ˆty te 2

te ty y− ( )2

ty y−

1 44.62 45.46 -0.84 0.7056 21.98 483.12 2 40.77 38.64 2.13 4.5369 18.23 332.33 3 26.92 25.19 1.73 2.9929 4.38 19.19 4 24.62 25.19 -0.57 0.3249 2.08 4.33 5 17.69 18.24 -0.55 0.3025 -4.85 23.52 6 16.15 16.90 -0.75 0.5625 -6.39 40.83 7 15.38 14.86 1.52 2/3104 -7.16 51.27 8 14.62 14.16 0.46 0.2116 -7.92 62.73 9 13.08 12.82 0.26 0.0676 -9.54 91.01 10 11.54 12.12 -0.58 0.3364 -11.00 121.00


Teraz możemy obliczyć parametry struktury stochastycznej:

2 112.3513 1.5439

10 2eS = ⋅ ≈−

,

2 1.5439 1.2425e eS S= = ≈ ,

1.2425

100% 100% 5.51%22.54

ee

SV

y= ⋅ = ⋅ = ,

74

( )

102

2 110

2

1

12.35130.01 1%

1229.32

tt

tt

e

y yϕ =

=

= = = =−

∑

∑

,

2 21 1 0.01 0.99 99%R ϕ= − = − = = .

( ) ( ) 12 0.2003 0.0188 0.1297 0.01221.5439

0.0188 0.0035 0.0122 0.0023eS− − −

= ⋅ = ⋅ = − −

2 TD a X X% % ,

( )0 0.1297 0.3601D a = = , ( )1 0.0023 0.0480D a = = .

Na podstawie otrzymanych wartości parametrów struktury stochastycznej możemy

wywnioskować o dobrym dopasowaniu modelu do danych obserwacji, gdyż tylko 1%

zmienności zmiennej objaśnianej nie został wyjaśniony przez nasz model. Otóż możemy

zapisać:

1ˆ 11.45 2.04t

t

yx

= + ⋅ .

( )(0.3601) 0.0480

Teraz zweryfikujemy zbudowany model, mianowicie zweryfikujemy hipotezę o

statystycznej istotności współczynników regresji:

( )0

11.45 031.797

0.3601t a

−= ≈

( )1

2.04 042.500

0.0480t a

−= = ,

0.05;8 2.306t = (Aneks A).

Ponieważ ( )0 0.05;8t a t> i ( )1 0.05;8t a t> , więc przyjmujemy hipotezę alternatywną (do

hipotezy zerowej), tzn. wszystkie parametry strukturalne (współczynniki regresji) są

statystycznie istotne.

Przeprowadzimy również badanie losowości reszt korzystając z testu serii. Zapiszemy

ciąg reszt z naszego przykładu:

-0.84; 2.13; 1.73; -0.57; -0.55; -0.75; 1.52; 0.46; 0.26; -0.58;

któremu odpowiada następujący ciąg symboli:

b aa bbb aaa b.

75

Otóż w ciągu reszt występuje 5 serii, czyli 5S= , przy czym liczba wartości dodatnich

wynosi 1 5n = , a liczba wartości ujemnych 2 5n = . Zakładamy, że 0.05α = . Wartości

krytyczne dla 1n i 2n wynoszą 1 2S = i 2 9S = (Aneks C, D). Ponieważ 1 2S S S< < , więc

postać analityczna modelu jest właściwą.

Na podstawie naszego modelu możemy scharakteryzować taką zależność: wraz ze

wzrostem wielkości produkcji koszt jednostkowy maleje coraz wolniej – do asymptoty

poziomej 11.45Y = .

Modele nieliniowe względem zmiennych i parametrów

Model ( ),Y f= X α , nieliniowy względem zmiennych i parametrów, jest transformowalny do

postaci liniowej, jeśli za pomocą jednoznacznych przekształceń obu jego stron można go

zapisać w postaci liniowej.

Pomocniczy model liniowy przybiera w tym przypadku postać [17]:

0 1 10

...K

t j tj t t K tK tj

Y X X Xβ ε β β β ε=

= + = + + + +∑% % % % ,

gdzie ( )t tY G Y=% – pomocnicza zmienna objaśniana (pewna funkcja oryginalnej zmiennej

objaśnianej); ( )tj tjX g X=% – pomocnicze zmienne objaśniające (pewne funkcje oryginalnych

zmiennych objaśniających); ( )j jhβ α= – parametry modelu pomocniczego (zazwyczaj także

pewne funkcje parametrów modelu oryginalnego).

Po linearyzacji modelu nieliniowego – zapisaniu go w postaci modelu pomocniczego

– wyznacza się za pomocą metody najmniejszych kwadratów jego parametry strukturalne

korzystając ze wzoru:

( ) 1T T−= ⋅b X X X y% % % % , (1.65)

gdzie X% – macierz obserwacji pomocniczych zmiennych objaśniających; y% – wektor

obserwacji pomocniczej zmiennej objaśnianej.

Dla modelu pomocniczego oblicza się następnie parametry struktury stochastycznej i

model pomocniczy poddaje się weryfikacji. Jeżeli dopasowanie modelu pomocniczego do

obserwacji można uznać za dobre, wnioskuje się, że model oryginalny też jest dobrze

dopasowany. Można zatem zapisać model w postaci oryginalnej.

Najczęściej spotykane w praktyce modele nieliniowe względem parametrów i

zmiennych, które można linearyzować, to model wykładniczy, potęgowy oraz ich kombinacja

76

(potęgowo-wykładniczy). W tych modelach zakłócenie losowe nakłada się na funkcję

multiplikatywnie.

Przykład 1.7.

W pewnym przedsiębiorstwie produkującym lody zaobserwowano takie wielkości

sprzedaży ( ty ) w kolejnych latach (patrz tabelę poniżej).

Rok 2003 2004 2005 2006 2007 2008 2009

ty (ton) 7.300

7.320

8,915

12.680

16.245

21.930

29.600


Należy oszacować parametry modelu trendu, tzn. zależności wielkości sprzedaży od

czasu (t ). Zauważmy, że w modelach trendu zmienna czasowa najczęściej przyjmuje

wartości kolejnych liczb naturalnych ( 1,2,..,t n= ).

Zanim wybierzemy postać analityczną modelu, najpierw zilustrujemy zależność ty od

t na wykresie (rys. 1.19), co ułatwi nam wybór właściwej postaci analitycznej modelu.

Rys. 0.19. Sprzedaż lodów w latach 2003-2009 (ton) Źródło: dane umowne

Jak widać na rysunku 1.19 zależność ta może mieć charakter funkcji wykładniczej.

Przyjmiemy więc funkcję typu (1.48) z multiplikatywnym zakłóceniem losowym:

0 1tt

tY eεα α= ⋅ ⋅ .

0

5

10

15

20

25

30

35

2003 2004 2005 2006 2007 2008 2009

77

Aby sprowadzić ją do postaci liniowej należy obie jej strony zlogarytmować, najlepiej

przy powyższej postaci funkcji wykorzystać logarytm naturalny:

0 1 0 1ln ln ln ln ln lntt t tY e tα α ε α α ε= + + ⋅ = + ⋅ + .

Zatem model pomocniczy (liniowy) przyjmuje postać:

0 1t t tY Xβ β ε= + ⋅ +% % ,

gdzie lnt tY Y=% , tX t=% , 0 0lnβ α= , 1 1lnβ α= .

Parametry struktury danego modelu możemy oszacować korzystając ze wzoru (1.65),

gdzie:

1

2

1

1

1 n

t

t

t

=

X%M M

,

1

2

ln

ln

ln n

y

y

y

=

y%M

,

1

22

1 2

1

1 1 1 1

1n

n

t

t n t

t t t t t

t

= ⋅ =

∑∑ ∑

TX XL

% %

L M M,

1

2

1 2

1 1 1 ln

lnt

n t

n

y

y y

t t t t y

y

= ⋅ = ⋅

∑∑

TX yL

%

L M.

Dalej obliczenia pomocnicze zapiszemy do poniższej tabeli:

tx t= ty lnt ty y=% 2t ln tt y⋅

1 7.300 1.9879 1 1.9879 2 7.320 1.9906 4 3.9812 3 8,915 2.1877 9 6.5631 4 12.680 2.5400 16 10.1600 5 16.245 2.7878 25 13.9390 6 21.930 3.0878 36 18.5268 7 29.600 3.3878 49 23.7146

Σ =28 17.9696 140 78.8726 Źródło: obliczenia własne

( )1

1T T 7 28 17.9696 140 28 17.96961

28 140 78.8726 28 7 78.8726196

−− −

= ⋅ = ⋅ = ⋅ ⋅ = − b X X X y% % % %

78

0.7149 0.1429 17.9696 0.7149 17.9696 0.1429 78.8726

0.1429 0.0357 78.8726 0.1429 17.9696 0.0357 78.8726

− ⋅ − ⋅ = ⋅ = = − − ⋅ + ⋅

12.8465 11.2709 1.5756 1.58

2.5679 2.8158 0.2479 0.25

− = = ≈ − +

.

Zatem 0

1

1.58

0.25

b

b

= =

b .

Jednak należy pamiętać, że 0 0lnb a= i 1 1lnb a= .

Oszacowany model pomocniczy (liniowy) będzie mieć postać:

ˆln 1.58 0.25ty t= + ⋅ .

Obliczymy za jego pomocą wartości teoretyczne:

1ˆln 1.58 0.25 1 1.83y = + ⋅ = , 5ˆln 1.58 0.25 5 2.83y = + ⋅ = ,

2ˆln 1.58 0.25 2 2.08y = + ⋅ = , 6ˆln 1.58 0.25 5 3.08y = + ⋅ = ,

3ˆln 1.58 0.25 3 2.33y = + ⋅ = , 7ˆln 1.58 0.25 7 3.33y = + ⋅ = .

4ˆln 1.58 0.25 4 2.58y = + ⋅ = ,

Obliczymy też wartość średnią

ln 17.9696ln 2.5671

7 7ty

y = = =∑ ,

reszty ˆln lnt t te y y= −% oraz inne dane pomocnicze, za pomocą których można obliczyć

parametry struktury stochastycznej. Pomocnicze dane przedstawimy w postaci tabeli:

Rok ln ty ˆln ty te% 2te% ln lnty y− ( )2

ln lnty y−

2003 1.9879 1.83 0.1579 0.0249 -0.5792 0.3355 2004 1.9906 2.08 -0.0894 0.0080 -0.5765 0.3324 2005 2.1877 2.33 -0.1423 0.0202 -0.3794 0.1439 2006 2.5400 2.58 -0.0400 0.0016 -0.0271 0.0007 2007 2.7878 2,83 -0.0422 0.0018 0.2207 0.0487 2008 3.0878 3.08 0.0078 0.0001 0.5207 0.2711 2009 3.3878 3.33 0.0578 0.0033 0.8207 0.6735


79

Teraz możemy obliczyć parametry struktury stochastycznej:

2 21 10.0599 0.012

7 2e tS en k

= = ⋅ ≈− −∑%

% , 0.012 0.1095eS = =%

,

0.1095

100% 100% 4.26%2.5671ln

ee

SV

y= ⋅ = ⋅ =%

%,

( )2

2 0.05990.0332 3.32%

1.8058ln ln

t

t

e

y yϕ = = = =

−∑

∑

%,

2 21 1 0.0332 0.9668 96.68%R ϕ= − = − = = ,

( ) ( ) 12 0.7149 0.1429 0.0086 0.00170.012

0.1429 0.0357 0.0017 0.0004eS− − −

= ⋅ = ⋅ = − −

2 TD b X X%

% % ,

( ) ( )( )0 0ln 0.0086 0.0927D b D a= = = ,

( ) ( )( )1 1ln 0.0004 0.02D b D a= = = .

Zatem możemy zapisać oszacowany model pomocniczy wraz z parametrami struktury

stochastycznej:

ˆln 1.58 0.25ty t= + ⋅ , 0.1095eS =%

, 4.26%eV =%

,

( ) ( )0.0927 0.02 2 3.32%ϕ = , 2 96.68%R = .

Zweryfikujemy statystyczną istotność otrzymanych parametrów strukturalnych

modelu:

( )0

1.58 017.0442

0.0927t b

−= = , ( )1

0.25 012.5

0.02t b

−= = .

Wartość krytyczna wynosi 0.05;5 2.447t = (Aneks A).

Ponieważ ( )0 0.05;5t b t> i ( )1 0.05;5t b t> , więc model został dobrany trafnie zwłaszcza,

że tylko 3.32% zmienności logarytmów zmiennej objaśnianej nie zostało wyjaśnione przez

nasz model, a odchylenia losowe stanowią zaledwie 4.26% średniej wartości logarytmów Y .

Dla testu serii wypiszemy ciąg reszt:

0.1579; -0.0894; -0.1423; -0.0400; -0.0422; 0.0078; 0.0578;

któremu odpowiada ciąg symboli:

a bbbb aa.

Otóż obserwujemy 3 serii, czyli 3S= . Dla 1 3n = i 2 4n =

1 2S = oraz 2 6S = (Aneks C, D).

80

Ponieważ 1 2S S S< < , więc reszty mają charakter losowy. To potwierdza właściwy

wybór postaci analitycznej modelu.

A teraz należy przejść do postaci oryginalnej modelu w taki sposób:

0 0lnb a= ⇒ 0 1.580 4.855ba e e= = = ,

1 1lnb a= ⇒ 1 0.251 1.284ba e e= = = .

Stąd oryginalny model ma postać:

ˆ 4.855 1.284tty = ⋅ .

Modele ściśle nieliniowe

To są modele, które nie da się transformować do postaci liniowej. Wśród najczęściej

wykorzystywanych w praktyce ekonometrycznej modeli ściśle nieliniowych należy wymienić

funkcje Tornquista oraz krzywe S-kształtne (m.in. funkcję logistyczną i krzywe Gompertza).

Ponad to linearyzacja modeli nieliniowych może czasami powodować dość znaczne

zniekształcenie uzyskanych wyników.

W przypadku estymacji modeli ściśle nieliniowych wykorzystywane są metody

numeryczne (por. [11], [19]). Najczęściej wykorzystuje się w tym celu metody iteracyjne

(por. [11], [19], [28]). W literaturze przedmiotu poleca się także zastosowanie segmentowej

estymacji parametrów modeli nieliniowych o segmentach liniowych (por. [21]).

Jedną z często stosowanych metod estymacji nieliniowej jest nieliniowa metoda

najmniejszych kwadratów, która wykorzystuje różne procedury iteracyjne. Do najbardziej

znanych i najczęściej stosowanych należą (por. [4, s. 151-152], [17, s. 139-145]):

• metoda Gaussa–Newtona,

• metoda najszybszego spadku,

• metoda Marquardta.

Otóż estymacja parametrów funkcji nieliniowych jest znacznie trudniejsza, ale, wraz z

dynamicznym rozwojem techniki komputerowej i oprogramowania w ostatnim 10-leciu,

zastosowanie postaci nieliniowych stało się dość powszechne [4, s.142].

Interesujące omówienie problemów, związanych z modelami nieliniowymi, można

znaleźć również w pracach T.Amemyi [2], G.G.Judge’a i in. [27, s. 195-223] oraz w

klasycznych monografiach autorstwa S.M.Goldfelda i R.E.Quandta [16] i Y.Barda [3], a

także G.A.Sebera i C.J.Wilda [37].

81

ROZDZIAŁ II

PROGNOZOWANIE NA PODSTAWIE MODELI

SZEREGÓW CZASOWYCH

Wstęp

Rozwój gospodarki powoduje, że prognozowanie gospodarcze znajduje coraz szersze

zastosowanie, nie tylko w naukach ekonomicznych do modelowania stanu gospodarki w

przyszłości, ale również w dziedzinie nauk społecznych, przyrodniczych, itp.

Ponieważ wiedza jest największą wartością, zatem, każdy podejmując decyzje, chce je

opierać o realne i rzetelne prognozy. Rządy państw chcą znać prognozy przychodów z

podatków i prognozy wydatków budżetowych, aby móc racjonalnie gospodarować budżetem

i utrzymywać dziurę budżetową na jak najniższym poziomie. Podobnie postępują samorządy

lokalne. Banki prognozują m.in. stopę procentową oraz kurs walutowy aby zabezpieczać się

przed ryzykiem spowodowanym przez te czynniki makroekonomiczne. Ryzyko jakie mogą

powodować te czynniki makroekonomiczne to ryzyko płynności banku lub

niebezpieczeństwo, że przy zbyt drastycznych wzrostach tych czynników, kredytobiorcy nie

będą w stanie wywiązać się ze swoich zobowiązań. Firmy produkcyjne również prognozują.

Starają się one zaprognozować dobrze produkcję na następne okresy, aby nie zostać z

nadwyżką towaru lub jego niedoborem w istotnych okresach. Firmy eksportujące lub

importujące muszą prognozować wartość kursów walutowych, aby dalej opłacało im się

handlować. Wszystkie te podmioty chcą znać prognozy gospodarcze aby wiedzieć, czy

zatrudnić nową siłę roboczą, bo gospodarka będzie się rozkręcać, czy też ciąć zatrudnienie ze

względu na zbliżający się kryzys. Osoby indywidualne przed każdym wyjściem z domu chcą

znać prognozę pogody, aby wiedzieć, czy wziąć parasol, czy nie. Osoby te starają się również

82

prognozować swoje oszczędności, aby wiedzieć, kiedy mogą sobie pozwolić na „odrobinę

luksusu” (np. wymiana samochodu lub egzotyczne wczasy).

Do prognozowania używanych jest wiele modeli matematycznych, poczynając od

modeli naiwnych poprzez regresje linowe, średnie ruchome i trendy pełzające, aż do

wygładzania wykładniczego. Używanych jest również wiele modeli opartych o wiedzę i

doświadczenie eksperckie. Oczywiście każdy podmiot gospodarczy czy też osoba fizyczna

prognozuje zgodnie ze swoją wiedzą. Większe instytucje używają bardziej skomplikowanych

modeli, gdyż mają specjalne zespoły zajmujące się prognozowaniem. Dodatkowo większe

instytucje przeznaczają na cel prognozowania znacznie większe fundusze. Natomiast

mniejsze firmy lub osoby fizyczne opierają się często na modelach bardzo prostych,

eksperckich lub zwykłym przeczuciu.

2.1. Teoretyczne podstawy prognozowania

Prognozowanie jest to przewidywanie przyszłości w sposób racjonalny z wykorzystaniem

metod naukowych. Jednak użycie tych metod nie gwarantuje niezawodności prognozy

(bardzo często jest to obserwowane zwłaszcza w prognozie pogody), ułatwia jednak

uzyskanie prognozy o bardzo dobrej jakości. Informacja o tym jak można zmierzyć jakość

prognozy zostanie opisane szerzej w kolejnych rozdziałach niniejszego opracowania.

Zgodnie ze słownikiem wyrazów obcych PWN prognoza to przewidywanie przyszłych

faktów, zdarzeń, itp. oparte na uzasadnionych przesłankach, obliczeniach.

Istnieje wiele typów prognoz. Rozróżniamy prognozy warunkowe, których realizacja

uzależniona jest lub powodowana jest przez pewne okoliczności oraz prognozy

bezwarunkowe, czyli takie, których realizacja nie jest uzależniona (lub nie jest powodowana)

od żadnych okoliczności.

Prognozy możemy też podzielić na prognozy proste oraz prognozy złożone. W

przypadku prognozy prostej, określa ona stan jednej zmiennej, natomiast w przypadku

prognozy złożonej, określa ona stan wielu zmiennych.

Innym podziałem prognozy jest podział ze względu na rodzaje zmiennych użytych do

prognozowania. Mogą to być zmienne ilościowe oraz zmienne jakościowe. Zmienne

ilościowe można zapisać za pomocą liczby. W innym przypadku mówimy o zmiennych

jakościowych. Idąc dalej tym tropem, również prognoza może być ilościowa lub jakościowa.

Jakościową prognozę możemy podzielić na punktową (gdy zmienna przyjmie określoną

wartość np. że przychody danej firmy wzrosną o 60%) oraz przedziałową (gdy zmienna

83

powinna przyjąć wartość z przedziału, np. że przychody danej firmy wzrosną pomiędzy 50%

a 70%). Natomiast prognoza jakościowa, jest to prognoza, której wynikiem jest stan zmiennej

jakościowej lub słownie opisana sytuacja dotycząca zmiennej ilościowej (przykładem

prognozy jakościowej jest np. zachmurzenie, które możemy określić jako małe, umiarkowane,

duże, itp.).

Ze względu na okres prognozy, rozróżniamy prognozy:

• krótkoterminowe,

• średnioterminowe,

• długoterminowe.

Należy zauważyć, że dla każdej osoby oraz podmiotu, innym horyzontem będzie się

odznaczać dana prognoza (np. prognoza krótkoterminowa meteorologii to jeden dzień,

natomiast dla rządu jest to z reguły rok).

Rola prognoz w ekonomii sprowadza się do dostarczenia informacji dotyczących

przewidywanego kształtowania się zjawisk ekonomicznych w przyszłości. Te informacją

muszą być obiektywne naukowo.

Błąd! Nie można odnaleźć źródła odwołania. przedstawia podstawowe funkcje

prognoz:

Rys. 0.1. Funkcje prognoz

Źródło: opracowanie własne

Funkcja preparacyjna uznawana jest za najważniejszą, gdyż zadaniem prognozy jest

wspomóc proces podejmowania racjonalnych decyzji gospodarczych. Osoba przygotowuje

prognozy dla podmiotu podejmującego decyzje, czyli decydenta. Osoba ta jest zwana

prognostą. Decydent podejmuje decyzje zarówno na poziomie mikro- jak

Funkcje prognoz

preparacyjna aktywizująca informacyjna

84

i makroekonomicznym. Przygotowanie prognoz, czyli stworzenie przesłanek do podjęcia

realnej decyzji, bardzo często uważa się za główny cel prognozowania.

Funkcja aktywizuj ąca polega na pobudzaniu do podejmowania działań sprzyjających

realizacji prognoz, gdy zapowiada ona zdarzenia korzystne lub przeciwstawiających się jej

realizacji, gdy przewidywane zdarzenia są oceniane jako niekorzystne. Kwalifikacja zdarzeń

jako korzystnych, czy też niekorzystnych jest zależna od społeczeństwa i ich systemu

wartości. Należy tutaj podkreślić, że to co dla jednych jest zdarzeniem korzystnym, dla

innych może być postrzegane jako niekorzystne. Funkcja aktywizująca prowadzi do

wyznaczania prognoz badawczych, których zadaniem jest wszechstronne oraz bezstronne

podejście do przewidywania przyszłości, co przejawia się przez ukazanie wielu możliwych

wersji przyszłości. Specyficznym rodzajem prognozy badawczej jest prognoza ostrzegawcza,

której zadaniem jest przewidywanie zdarzeń niekorzystnych dla danych odbiorców prognozy.

Ostatnim typem funkcji jest funkcja informacyjna . Polega ona na oswajaniu ludzi z

nadchodzącymi zmianami. Dzięki temu informowaniu, zmniejsza ona lęk społeczeństwa

przed przyszłością, powoduje uspokojenie, a w niektórych sytuacjach nawet akceptację.

2.2. Organizacja procesu prognostycznego

Prognozowanie jest pewnego rodzaju procesem. Od stworzenia/zbudowania tego procesu,

może zależeć jakość prognozy. Sformułowanie prognozy wymaga wielu kroków, które można

spróbować ułożyć w pewien ogólny schemat.

Błąd! Nie można odnaleźć źródła odwołania. przedstawia przykładowy schemat

etapów prognozowania.

85

Rys. 0.2. Etapy prognozowania


W proces prognozy zaangażowane są dwie strony. Pierwsza strona zleca prognozę,

natomiast druga ją przeprowadza. Osoba zlecająca prognozę najczęściej jest decydentem,

która na podstawie tej prognozy będzie musiała podjąć jakąś decyzję. Warto wspomnieć, że

decydent nie musi być specjalistą w budowaniu prognoz. Jego głównym zadaniem jest

sformułowanie zadania prognostycznego. Dodatkowo powinien on wspierać osobę

przeprowadzającą prognozowanie również na innych etapach, gdyż jest on znawcą zjawiska,

które będzie prognozowane. W pierwszym etapie decydent powinien, określić obiekt lub

zjawisko, które będzie prognozowane, gdzie ono zachodzi i jakie jego zdaniem zmienne

najlepiej to zjawisko charakteryzują. Osoba zlecająca prognozę powinna wyznaczyć również

cel wyznaczenia prognozy, czyli to do czego jej ta prognoza będzie potrzebna. Istotnym

elementem dla osoby przeprowadzającej prognozę, jest horyzont czasowy tej prognozy, gdyż

liczba detali prognozy będzie malała wraz ze wzrostem horyzontu prognozy.

Podanie przesłanek prognostycznych wymaga współpracy obu stron. Jednak to

osoba przeprowadzająca prognozę powinna na tym etapie odgrywać rolę wiodącą. Powinna

ona zadawać osobie zlecającej pytania o realia zjawiska, konsultować z tą osobą opinie i

teorie uzyskane w wyniku analizy literatury naukowej przedmiotu oraz badań

dotychczasowych danego zjawiska. Analizując różne teorie, można wybrać te, które wydają

się najbardziej adekwatne w tym konkretnym przypadku prognostycznym. Analiza teorii

ułatwia również wybór modelu oraz danych wejściowych do modelu. Efektem tych prac

Sformułaowanie

zadania

Podanie

przesłanekWybór metody

Wyznaczenie

prognozy

Ocena

dopuszczalnościWeryfikacja

86

powinny być hipotezy o czynnikach kształtujących zjawisko, które będzie prognozowane, a

także określenie oraz zebranie zbioru danych potrzebnych do sporządzenia prognozy.

Wybór metody prognozowania jest po części wynikiem/konsekwencją uzgodnień z

osobą zlecającą prognozę. Wybór metody zależy od rodzaju posiadanych danych oraz

uzgodnionych z decydentem przesłanek prognostycznych. Warto jednak zwrócić uwagę, że

ostateczna decyzja o metodzie użytej do prognozowania, zależy wyłącznie od prognosty.

Wyznaczenie prognozy powinno przebiegać zgodnie z najlepszymi standardami

statystyki/ekonometrii oraz ogólnym schematem, którego wybór jest uzależniony od

wybranego modelu. W tym miejscu prognosta ma możliwość określenia dodatkowych

parametrów, takich jak stała wygładzania, przedział ufności prognozy, funkcja trendu, jeśli

występuje, itp.

Ocena dopuszczalności prognozy – jest to informacja, czy prognoście udało spełnić

się oczekiwania osoby zlecającej prognozę (horyzont czasowy, wymogi jakościowe, itp.).

Weryfikacja prognozy polega na oszacowaniu błędu ex post, gdy prognoza dotyczyła

zmiennej ilościowej lub na porównaniu prognozowanego stanu zmiennej ze stanem

faktycznym. O możliwych wyliczeniach błędów ex post będzie szerzej w następnych

rozdziałach niniejszego opracowania. Systematyczna weryfikacja prognoz nazywa się

monitoringiem i jest ona pożądana w przypadku istotnych decyzji gospodarczych, które nie są

przeprowadzane jednorazowo.

2.3. Zasady i metody prognozowania

W niniejszym rozdziale zostaną zaprezentowane najbardziej popularne zasady/reguły

prognozowania oraz przedstawione zostaną różne metody prognozowania.

2.3.1. Zasady prognozowania

Jak już zostało wspomniane, ideą prognozowania jest przewidzenie pewnego zjawiska w

przyszłości za pomocą różnego rodzaju metod oraz wiedzy i doświadczenia osoby

przeprowadzającej prognozę, a także analizy historycznej tego zjawiska. W metodzie

prognozowania można wyodrębnić dwie fazy: fazę diagnozowania przeszłości oraz fazę

określania przyszłości. Diagnozowanie przeszłości może odbywać się za pomocą budowy

formalnego modelu (np. ekonometrycznego) lub myślowego (tworzonego przez eksperta).

Sposób przejścia od danych do prognozy, czyli faza określania przyszłości nazywana jest

zasadą prognozy lub regułą prognozy. Należy pamiętać, że określonemu sposobowi

87

(metodzie) przetworzenia danych rzeczywistych mogą towarzyszyć różne zasady

wyznaczania prognozy. Błąd! Nie można odnaleźć źródła odwołania. obrazuje najczęściej

stosowane reguły/zasady prognozy.

Prognoza za pomocą metody podstawowej zakłada, że model będzie aktualny w

chwili na którą określa się prognozę. Parafrazując oznacza to, że w chwili obecnej budujemy

model na danych rzeczywistych (przeszłych) i zakładamy, że na chwilę przyszłą ten model

również będzie aktualny. Przyjecie tej reguły powoduje, że prognozę otrzymujemy w skutek

ekstrapolacji modelu. Reguła jest stosowana, gdy osoba przeprowadzająca prognozę uważa,

że model, który dość dobrze dopasował się do danych i opisywał przeszłość, będzie również

aktualny w przyszłym momencie, na który budowana jest prognoza. Najbardziej popularnym

modelem opartym o regułę podstawową jest klasyczny model regresji liniowej.

Prognoza za pomocą metody podstawowej z poprawką jest rozszerzeniem prognozy

za pomocą metody podstawowej. Korzystamy z tej reguły w przypadku, jeśli występują

uzasadnione przypuszczenia, że zaobserwowane ostatnio odchylenie danych empirycznych od

modelu utrzyma się w przyszłości. Jeśli osoba przeprowadzająca prognozę jest przekonana, że

odchylenie to będzie stałe, wtedy o wartość tego odchylenia powiększa prognozę modelu. W

przypadku, gdy odchylenie nie jest stałe i nastąpiło w kilku ostatnich obserwacjach, wtedy

jako poprawkę można przyjąć średnią arytmetyczną (jeśli osoba przeprowadzająca prognozę

uważa, że odchylenie dla każdej obserwacji jest tak samo istotne) lub średnią ważoną (jeśli

osoba przeprowadzająca prognozę uważa, że odchylenie w każdym momencie nie jest tak

samo istotne i np. chce przypisać większe wagi odchyleniom ostatnim).

88

Rys. 0.3. Zasady/reguły prognozy Źródło: opracowanie własne

Prognoza za pomocą metody największego prawdopodobieństwa zakłada, że

wartością przyszłą będzie stan zmiennej lub wartość, któremu odpowiada najwyższe

prawdopodobieństwo lub maksymalna wartość funkcji gęstości rozkładu. Reguła ta może być

stosowana, gdy zmienna prognozowana jest zmienną losową i znamy jej rozkład

prawdopodobieństwa, bądź jesteśmy w stanie oszacować go na podstawie rzeczywistych

danych (próbki). Reguła ta jest najczęściej stosowana, gdy zmienna prognozowana jest

skokowa lub niemierzalna. Upraszczając, można powiedzieć, że wartością prognozowaną jest

moda/dominanta rozkładu.

Prognoza za pomocą metody minimalnej straty zakłada, że wartością przyszłą

będzie wartość zmiennej, która spowoduje minimalną stratę. Metoda ta zakłada, że wielkość

straty jest funkcją błędu prognozy i aby wybrać prognozę, należy znaleźć minimum tej

funkcji. Z założenia, reguła ta powinna być powiązana z pewnego rodzaju negatywnym

skutkiem jak np. wysokie nakłady finansowe, prawdopodobieństwo niewykonania projektu,

ryzyko wystąpienia różnego rodzaju niepokojów społecznych, itp.

Zasady

prognozy

Podstawowa

Podstawowa

z poprawką

Największego

prawdopodo-

bieństwa

Minimalnej

straty

89

2.3.2. Metody prognozowania

Rysunek 2.4 przedstawia schemat obrazujący różne metody prognostyczne. Metody zostały

pogrupowane ze względu na rodzaj wykorzystywanych danych i sposób ich przetworzenia.

Rys. 0.4. Metody prognostyczne Źródło: opracowanie własne na podstawie [34]

Pierwszym podziałem metod prognostycznych jest podział na metody matematyczno-

statystyczne oraz metody niematematyczne.

Metody niematematyczne, zwane również heurystycznymi, polegają na

wykorzystaniu opinii grupy ekspertów, opartej na ich wiedzy, intuicji oraz wyobraźni.

Przewidywanie w przypadku modeli niematematycznych nie jest ekstrapolowaniem

wykrytych w danych rzeczywistych różnych prawidłowości, lecz bardziej prognozowaniem

możliwych wariantów rozwoju zjawisk i wskazywaniem tych najbardziej realistycznych.

Metody

prognostyczne

Matematyczno-

statystyczne

Oparte na

modelach deterministycznych

Oparte na

modelach ekonometrycznych

Jednorównaniowe

- Klasyczne modele trendu

- Adaptacyjne

- Przyczynowo-

skutkowe

- Autoregresyjne

Wielorównaniowe

- Proste

- Rekurencyjne

- O równaniach

współzależnych

Niematematyczne

- Ankietowe

- Intuicyjne

- Kolejnych przybliżeń

- Ekspertyz

- Delficka

- Refleksji

- Analogowe

- Burza mózgów

- Sieci neuronowe

90

Warto wyróżnić burzę mózgów i metodę delficką, które zakładają większą trafność prognozy

opartej o uzgodnienia miedzy grupą ekspertów, niż prognozy pojedynczego eksperta.

Wykorzystywane są do sporządzania prognoz długoterminowych, gdzie wykorzystanie

danych nie jest możliwe (np. odkrycia naukowe, rozwój techniki, itp.). Z innych bardziej

znanych metod niematematycznych warto wyróżnić sieci neuronowe. W wyniku procesu

uczenia się i adaptacji do nowych danych, sieci zdobywają wiedzę, którą potem wykorzystują

w procesie prognozowania. Metody analogii są często wykorzystywane w biologii, gdzie

zakłada się analogiczną drogę rozwoju dla niektórych podobnych zjawisk.

Drugą klasą są wszystkie metody matematyczno-statystyczne, które to oparte są o

modele matematyczne, statystyczne lub ekonometryczne. Są one znacznie bardziej popularne

i nie wymagają tak dogłębnej wiedzy eksperckiej przy ich budowaniu. Metody te bazują

bardziej na pewnych prawidłowościach w przeszłości, które starają się odzwierciedlić w

przyszłości. Warto jednak zaznaczyć, że metody te, nie ukazują przyczyn powstania tych

prawidłowości.

Metody matematyczno-statystyczne możemy następnie podzielić na metody oparte na

modelach deterministycznych oraz modelach ekonometrycznych.

Modele deterministyczne, są to modele, które pozwalają obliczyć prognozowaną

wartość bez żadnego błędu w dowolnym momencie w przyszłości. Do takich modeli możemy

zaliczyć m.in. wysokość prognozowanych odsetek na lokacie kapitałowej ze znanym

oprocentowaniem przy znanej metodzie kapitalizacji odsetek. Wtedy osoba znająca wzór na

kwotę odsetek oraz metodę kapitalizacji może bez żadnego błędu obliczyć kwotę odsetek.

Niestety większość zjawisk (ekonomicznych, finansowych, czy socjologicznych) nie

jest deterministyczna, co oznacza, że na wielkość tych zjawisk mają także wpływ inne

czynniki natury losowej. Owe czynniki wykluczają możliwość znalezienia modelu

deterministycznego, który mógłby w sposób dokładny opisać lub zaprognozować te zjawiska.

Należy wtedy zbudować model, który z pewnym prawdopodobieństwem pozwala wyznaczyć

przyszłą wielkość badanego zjawiska. Model taki nazywamy modelem ekonometrycznym.

W modelach ekonometrycznych, w odróżnieniu od modeli deterministycznych, przyszłą

wartość danego szeregu możemy wyznaczyć z pewnym błędem, który to odpowiada

czynnikowi losowemu badanego zjawiska. Oczywiście przy budowie modeli chcemy, aby ten

błąd był jak najmniejszy.

Modele ekonometryczne możemy następnie podzielić na jednorównaniowe oraz

wielorównaniowe.

91

Model jednorównaniowy jest to model, który do opisania danego zjawiska używa

wyłącznie jednego równania. Natomiast model wielorównaniowy jest to model, który do

opisania danego zjawiska używa wielu równań (układu równań). Modele wielorównaniowe są

znacznie bardziej skomplikowane, gdyż pomiędzy zmiennymi mogą występować różne

zależności albo sprzężenia zwrotne.

W niniejszym opracowaniu zostaną zaprezentowane modele z kategorii

matematyczno-statystycznej oparte o modele ekonometryczne jednorównaniowe.

2.4. Rodzaje błędów prognoz i rodzaje jakości prognoz

W niniejszym rozdziale zostaną zaprezentowane rodzaje błędów prognoz oraz rodzaje jakości

prognoz.

2.4.1. Rodzaje błędów prognoz Określając pojęcie prognozy zostało zaznaczone, że jest ona odzwierciedleniem modelu

ekonometrycznego obarczonego błędem losowym. W tym podrozdziale zostaną omówione

rodzaje błędów oraz metody ich pomiaru.

Błąd prognozy można określić jako różnicę pomiędzy wartościami prognozowanymi,

a wartościami rzeczywistymi. Matematycznie można to zapisać za pomocą następującego

wzoru:

�� = ��∗ − ��, (2.1)

gdzie:

• �� – zmienna rzeczywista Y w okresie t,

• ��∗ – prognoza zmiennej Y w okresie t.

Zauważmy, że błąd może być określony po upływie czasu na który prognoza była

ustalona, czyli gdy znana jest realizacja zmiennej prognozowanej na ten czas. Wtedy mówimy

o prognozie ex post, czyli o trafności prognozy.

Jeśli natomiast błąd jest określony przed upływem czasu na który prognoza była

ustalona, czyli gdy nie jest znana realizacja zmiennej prognozowanej, a jedynie jej

spodziewana realizacja na ten czas, wtedy mówimy o prognozie ex ante, czyli o dokładności

prognozy. Błąd prognozy ex ante jest szacowany w tym samym momencie co prognoza i

służy określeniu jej dopuszczalności.

Do najczęściej stosowanych metod pomiarów błędów ex post należą:

92

• bezwzględny błąd prognozy w okresie t – informuje jak duże było odchylenie

prognozy od wartości rzeczywistej zmiennej Y. Znak błędu wskazuje, czy rzeczywista

wartość była wyższa czy też niższa od prognozy. Matematycznie bezwzględny błąd

prognozy można zapisać za pomocą następującego wzoru

�� = ��∗ − �� . (2.2)

• średni błąd predykcji ex post (ang. mean error – ME) – informuje jak duży jest błąd

z ostatnich m wyrazów predykcji w porównaniu z danymi rzeczywistymi. W

przypadku prognozy nieobciążonej wartość średniego błędu predykcji ex post

powinna być równa 0. Przeważnie tak jednak nie jest. Wadą tego błędu jest to, że

odchylenia dodatnie i ujemnie znoszą się wzajemnie. Matematycznie średni błąd

predykcji ex post można zapisać za pomocą następującego wzoru [20]

�� = 1��∗ − ��

��.

(2.3)

• względny błąd prognozy ex post w okresie t – informuje jak duże było odchylenie

prognozy od wartości rzeczywistej zmiennej Y liczonej w procentach wartości

rzeczywistej zmiennej Y. Znak błędu wskazuje, czy rzeczywista wartość była wyższa,

czy też niższa od prognozy. Matematycznie względny błąd prognozy ex post można

zapisać za pomocą następującego wzoru

Ψ� =

��∗ − �� ∗ 100. (2.4)

• średni kwadratowy błąd prognozy ex post w przedziale weryfikacji – informuje o

przeciętnym odchyleniu prognoz od wartości rzeczywistej w przedziale empirycznej

weryfikacji prognoz. Pierwiastek błędu może być porównywalny z odchyleniem

standardowym reszt. Matematycznie średni kwadratowy błąd prognozy ex post można


s∗�=

1

T − n� ��∗ − ��

��. (2.5)

• średni względny błąd prognozy ex post – informuje jaki procent rzeczywistej

zmiennej Y stanowiło przeciętne bezwzględne odchylenie prognozy od danych

rzeczywistych. Jest on wyrażony w procentach. Matematycznie średni względny błąd

prognozy ex post można zapisać za pomocą następującego wzoru [1]

93

Ψ =

1

T − n� ��∗ − �� ∗ 100�

��. (2.6)

Do najczęściej stosowanych metod pomiarów błędów ex ante należą:

• wariancja prognozy w okresie t – informuje jak duże jest rozproszenie możliwych

prognoz wokół możliwych realizacji zmiennej prognozowanej. Matematycznie

wariancję prognozy można zapisać za pomocą następującego wzoru

�� = ��∗ − ��. (2.7)

• bezwzględny błąd prognozy ex ante w okresie t – informuje jak duże jest przeciętne

odchylenie realizacji zmiennej prognozowanej od prognozy. Błąd ten służy określeniu

dokładności prognozy. Prognoza jest tym dokładniejsza, im mniejsza jest wartość tego

błędu. Błąd ten jest wystarczający do wyboru kilku prognoz otrzymanych z różnych

modeli tej samej zmiennej. Bezwzględny błąd prognozy ex ante w okresie t jest równy

pierwiastkowi z wariancji prognozy w okresie t. Matematycznie bezwzględny błąd

prognozy ex ante można zapisać za pomocą następującego wzoru

�� = �� = ��∗ − ��. (2.8)

• względny błąd prognozy ex ante w okresie t – informuje jak duże jest przeciętne

odchylenie realizacji zmiennej prognozowanej od prognozy liczonej w procentach

wartości prognozowanej. Błąd ten służy określeniu dokładności prognozy. Jest on

wystarczający do wyboru kilku prognoz otrzymanych z różnych modeli kilku

zmiennych. Matematycznie względny błąd prognozy ex ante można zapisać za

pomocą następującego wzoru

�� = ��∗. (2.9)

• prawdopodobieństwo realizacji prognozy jest kolejnym sposobem określania

dopuszczalności prognozy. Jeśli zmienna prognozowana jest losową zmienną

skokową, to możemy wyznaczyć prawdopodobieństwo, że zmienna Y przyjmie

wartość ��∗. Jeśli natomiast zmienna prognozowana jest zmienną losową ciągłą, to

��|��∗ − ��| < � = ��, (2.10)

gdzie ε jest dowolnie małą dodatnią liczbą otrzymana jako krotność błędu ex ante.

Wartość γt nazywana jest również wiarygodnością prognozy.

94

2.4.2. Rodzaje jakości prognoz Oprócz informacji o błędach i niedopasowaniu wartości prognozowanych modelu do wartości

rzeczywistych lub możliwych realizacji zmiennej prognozowanej, bardzo istotną informacją

jest informacja dotycząca jakości modelu. Jakość modelu jest traktowana jako jakość

prognozy, albo zgodność modelu z danymi empirycznymi. Jest wiele mierników, które mogą

określać rodzaj jakości prognozy. Do najważniejszych z nich możemy zaliczyć:

• współczynnik determinacji R2 – określa miarę dopasowania liniowego modelu

regresji do danych rzeczywistych. Współczynnik R2 przyjmuje wartości z przedziału

[0,1] w przypadku gdy model jest szacowany za pomocą metody najmniejszych

kwadratów. Im większa wartość współczynnika, tym większa część zmienności

zmiennej objaśnianej została wyjaśniona przez model, a co za tym idzie model jest

lepszej jakości. Matematycznie współczynnik determinacji można zapisać za pomocą

następującego wzoru

�� = ∑ ��∗ − ��∑ �� − ��, (2.11)

gdzie �� jest wartością średnią zmiennej Y.

• skorygowany współczynnik determinacji, analogicznie jak współczynnik

determinacji pokazuje miarę dopasowania modelu do zmiennych rzeczywistych. W

odróżnieniu jednak od standardowego współczynnika determinacji, ma on pewną

zaletę. Standardowy współczynnik determinacji nie pozwala porównywać kilku

modeli z różną liczbą danych, gdyż każde dołożenie dowolnej zmiennej do modelu

powoduje zwiększenie standardowego współczynnika determinacji, natomiast

skorygowany współczynnik determinacji nie jest podatny na ten zabieg.

Matematycznie skorygowany współczynnik determinacji można zapisać za pomocą


�� = 1 − � − 1� −� − 1��, (2.12)

gdzie m jest liczbą zmiennych objaśniających w modelu (nie wliczając wyrazu

wolnego).

• odchylenie standardowe składnika resztowego informuje jakie są przeciętne

odchylenia wartości rzeczywistych zmiennej prognozowanej od teoretycznych. Im

mniejsza jest wartość tego odchylenia, tym lepsza jest jakość modelu. Matematycznie

95

odchylenie standardowe składnika resztowego można zapisać za pomocą


� = � 1� −� − 1��∗ − ��

��, (2.13)

• współczynnik wyrazistości informuje, jaka część średniej wartości zmiennej Y

stanowi jej odchylenie reszt. Jest to więc charakterystyka zmienności losowej

zmiennej Y (czyli tej części niewyjaśnionej przez model). Model jest tym lepszy, im

mniejsza wartość tego współczynnika. Matematycznie współczynnik wyrazistości

można zapisać za pomocą następującego wzoru

� = �� ∗ 100. (2.14)

Oceny jakości modelu można również dokonać pośrednio patrząc, czy poszczególne

zmienne objaśniające istotnie wpływają na zmienną prognozowaną. W tym celu oblicza się

błąd oceny estymatora każdego parametru, który nazywany jest również średnim błędem

szacunku parametru.

2.5. Prognozowanie na podstawie klasycznych modeli trendu

Klasyczne modele zakładają prognozę za pomocą metody podstawowej, co jak wcześniej

zostało już opisane, zakłada, że model będzie niezmienny w czasie (budowany model na

danych rzeczywistych będzie aktualny również do prognozowania przeszłości). Z punktu

widzenia matematycznego oznacza to, ze szereg jest stacjonarny. W tym i następnych

rozdziałach będziemy się koncentrować na szeregach, które nie są deterministyczne, co

będzie jednym z założeń prezentowanych modeli. Oznacza to, że w analizowanych szeregach

będziemy wyróżniać dwie składowe:

• składową systematyczną związaną z procesem deterministycznym (tą zmienną

powinniśmy zaprognozować bez żadnego błędu),

• składową przypadkową (zwaną również składnikiem losowym lub wahaniem

przypadkowym) związaną z procesem stochastycznym szeregu czasowego.

Składowa systematyczna może wystąpić w postaci trendu lub wahań cyklicznych

(sezonowych). Trend jest to długookresowa skłonność do jednokierunkowej zmiany (wzrostu

lub spadku) wartości badanej zmiennej. Przy klasycznych modelach trendu nie zakładamy

96

zmiany trendu lub jego załamania. Trend jest konsekwencją zestawu czynników, które

działają na prognozowane zjawisko.

Wahania cykliczne (sezonowe) to okresowe zmiany wartości badanej zmiennej wokół

trendu. Zmiany te powtarzają się co pewien okres zwany cyklem.

Proces wyodrębniania poszczególnych składowych szeregu czasowego nazywa się

jego dekompozycją.

Rysunek 2.5 przedstawia najważniejsze modele, które możemy zaliczyć do kategorii

klasycznych modeli trendu.

Rys. 0.5. Klasyczne modele trendu Źródło: opracowanie własne

Poszczególne modele prognostyczne zostaną szczegółowo opisane w następnych

rozdziałach niniejszego opracowania.

2.5.1 Klasyczny model regresji liniowej

Klasycznym, a zarazem najbardziej znanym modelem trendu jest model klasycznej regresji

liniowej. W tym przypadku zakładamy, że trend jest liniowy. Klasyczny model regresji

Klasyczne modele trendu

Klasyczny

model regresji

liniowej

Metoda

harmonikiMetoda Kleina

97

liniowej stosuje się do danych bez elementów sezonowości. Matematycznie funkcje trendu

możemy zapisać za pomocą następującego wzoru [41]

�� = � + � ∙ � + �, (2.15)

gdzie:

• α, β są parametrami strukturalnymi funkcji regresji natomiast,

• ε jest błędem oszacowania całej funkcji (reszty modelu). Zakłada się, że ε ma rozkład

normalny o średniej zero.

Parametry α oraz β nie są znane. Osoba przeprowadzająca prognozę szacuje je na

podstawie próby. Metodą szacowania tych parametrów jest minimalizacja sumy kwadratów

reszt zwana Klasyczną Metodą Najmniejszych Kwadratów (KMNK). Nazwa tej metody

wzięła się stąd, że jej zasada działania to minimalizacja sumy kwadratów reszt, otrzymanych

po odjęciu od rzeczywistych wartości yt wartości funkcji regresji.

Estymatory parametrów α oraz β aproksymujemy odpowiednio za pomocą

parametrów a oraz b wyliczonych za pomocą następujących funkcji [41]:

� = �� , (2.16)

! = �� − � ∙ ". (2.17)

gdzie:

�� =��" − "�

��, (2.18)

�� =��" − "�� − ��.

�� (2.19)

Przykład 2.1.

Zastosujmy klasyczny model regresji liniowej do danych obrazujących płacę

minimalną w poszczególnych latach. Dane pochodzą z Głównego Urzędu Statystycznego od

początku roku 2003 do roku 2013.

Tabela 0.1 zawiera wartość płacy minimalnej w poszczególnych latach. Dodatkowo

tabela zawiera dodatkowe kolumny z wyliczeniami zmiennych pomocniczych niezbędnych do

oszacowania prostego modelu regresji. Następnie oszacujmy wartości parametrów prostej

regresji a oraz b posługując się odpowiednio wzorami (2.16) oraz (2.17) wiedząc, ze średnia x

wynosi 6, natomiast średnia y wynosi 1 137,55.

98

Tabela 0.1. Dane dotyczące płacy minimalnej

rok (x) płaca minimalna (y) �$� − $% �$� − $%� �&� − &% �$� − $%�&� − &% 2003 800 -5 25 -337,55 1 687,77 2004 824 -4 16 -313,55 1 254,22 2005 849 -3 9 -288,55 865,66 2006 899,1 -2 4 -238,45 476,91 2007 936 -1 1 -201,55 201,55 2008 1126 0 0 -11,55 0,00 2009 1276 1 1 138,45 138,45 2010 1317 2 4 179,45 358,89 2011 1386 3 9 248,45 745,34 2012 1500 4 16 362,45 1 449,78 2013 1600 5 25 462,45 2 312,23

Suma 110 9 490,80 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Otrzymamy następujące wartości:

� = �� = 9490,80110= 86,28, (2.20)

! = �� − � ∙ " = 1137,55 − 86,28 ∙ 6 = 619,87. (2.21)

Zatem wzór prostej regresji przyjmie postać:

�� = 619,87 + 86,28 ∙ �. (2.22)

Wyliczmy wartości prognozowane na poszczególne okresy zgodnie z powyższym

wzorem. Tabela 0.2 zawiera dane rzeczywiste wraz z wartościami płacy minimalnej

wyliczonymi za pomocą funkcji regresji – wzór (2.22).

Tabela 0.2. Prognozowanie za pomocą regresji liniowej

rok (x) płaca minimalna (y) wartość dopasowana (y*) 2003 800,00 706,15 2004 824,00 792,43 2005 849,00 878,71 2006 899,10 964,99 2007 936,00 1 051,27 2008 1 126,00 1 137,55 2009 1 276,00 1 223,83 2010 1 317,00 1 310,11 2011 1 386,00 1 396,39 2012 1 500,00 1 482,67 2013 1 600,00 1 568,95 2014 1 655,23

Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

99

Rysunek 2.6 podsumowuje dane z Tabela 0.2.

Rys. 0.6. Wykres funkcji regresji liniowej wraz z danymi rzeczywistymi Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Na podstawie tego wykresu można zauważyć, że model dość dobrze dopasował się do

danych. Współczynnik R2 wyniósł 96%, co oznacza, że 96% zmienności zmiennej

prognozowanej jest wyjaśnione przez model.

Warto zauważyć, że za pomocą klasycznego modelu regresji liniowej można

prognozować na znacznie więcej okresów niż tylko jeden. W takim przypadku, do funkcji

regresji należy wstawić rok, na który chcemy wyliczyć prognozę.

Dodatkowo warto wspomnieć, że model regresji liniowej możemy zbudować na

więcej niż jednej zmiennej objaśniającej. Parafrazując, za pomocą regresji liniowej możemy

prognozować wartości danego zjawiska używając kilku zmiennych objaśniających, jednak

jest to trudniejsze i wymaga lepszych narzędzi informatycznych.

2.5.2. Metoda harmoniki

Drugim dość popularnym modelem klasycznych modeli trendu jest metoda harmoniki zwana

inaczej analiza harmoniczną. Jest to swojego rodzaju rozszerzenie modelu klasycznej regresji

liniowej. Model można stosować do danych z wahaniami periodycznymi. Model ten daje dość

dobre rezultaty wyodrębniania sezonowości z szeregów czasowych. Metoda ta polega na

600,00

800,00

1 000,00

1 200,00

1 400,00

1 600,00

1 800,00

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

wartość dopasowana (y*) płaca minimalna (y)

100

zbudowaniu modelu w postaci sumy tzw. harmonik, tj. funkcji sinusoidalnych lub

kosinusoidalnych o danych okresach. Pierwsza harmonika ma okres równy długości okresu

badanego, druga połowie tego okresu, trzecia jednej trzeciej okresu badanego, itd. Ogólnie w

przypadku n obserwacji, liczba wszystkich możliwych harmonik jest równa �.

Funkcję prognozującą, opisaną za pomocą modelu harmoniki, możemy zapisać

następującym równaniem matematycznym [38]

�� = '�( +�)� sin *2+� ,(- + � cos*2+� ,(-.�

��, (2.23)

gdzie, f(t) jest funkcją trendu, jeśli dany szereg posiada tendencję rozwojową. Natomiast

pozostały człon odpowiada za sezonowość w modelu. W przypadku braku sezonowości, wzór

ten możemy uprościć do postaci

�� = �� +�)� sin *2+� ,(- + � cos*2+� ,(-. .�

�� (2.24)

Estymatory parametrów α0, αi oraz βi, możemy otrzymać stosując metodę

najmniejszych kwadratów odpowiednio do następujących funkcji:

!� =��

��, (2.25)

! = 2��

��sin *2+� ,(- ,, = 1, 2, … ,�

2− 1, (2.26)

� = 2��

��cos *2+� ,(- ,, = 1, 2, … ,�

2− 1.

(2.27)

Dla ostatniej harmoniki, o numerze równej �, wartości estymuje sie z następujących

wzorów:

!� = 0, (2.28)

�� = 1��

��cos�+(. (2.29)

Zauważmy, że estymatorem wyrazu wolnego jest po prostu średnia z wszystkich

wyrazów, natomiast pozostałe wyrazy informują jak daleko od tej średniej się odsuwamy.

O składowych ai/bi możemy myśleć, jak o współczynnikach pokazujących, w którą

stronę odchyla się suma wartości yi wyskalowanych funkcji sinus lub cosinus o odpowiednim

101

okresie (składowa pierwsza uwzględnia jeden okres funkcji w obrębie danych, składowa

druga dwa okresy, trzecia trzy, itd.).

Następnie należy wyliczyć wartość amplitudy dla poszczególnych harmonik, którą to

wyraża się wzorem

/ � = ! � + � �. (2.30)

W celu zlokalizowania amplitud i faz na osi czasu, dla każdej harmoniki można

wyznaczyć wartości przesunięcia fazowego za pomocą następującego wzoru:

�!0(1ść2034�5�,ę6,!'!31�471 = � 8 , (2.31)

gdzie εi oraz θi odpowiednio wyznacza się za pomocą następujących wzorów:

� = !06(7 *! � -, (2.32)

8 = 2+� ,. (2.33)

Liczba harmonik, które należy wyznaczyć, jest tym większa, im dłuższy jest

wyjściowy szereg czasowy. Przeważnie nie ma potrzeby wyliczania wszystkich harmonik

możliwych do wyliczenia w modelu. Należy to zrobić wyłącznie dla zmiennych, których

składowe istotnie wpływają na wartość szeregu wyjściowego Y. Wymaga to określenia

udziału poszczególnych harmonik w ogólnej zmienności funkcji. Udział ten jest określony za

pomocą następującego ilorazu

� =/ �2�� , , = 1, 2, … ,�

2− 1. (2.34)

Dla ostatniej harmoniki, o numerze równej �, udział jest określony za pomocą


�� =/ �� , , = �

2, (2.35)

gdzie s2 jest wariancją zmiennej Y.

Do prognozy używamy tylko tych wartości harmonik, dla których udział w ogólnej

zmienności jest największy. Warto tutaj zaznaczyć, że żadne dwie harmoniki, nie są ze sobą

skorelowane i nie mogą uwzględniać jednej i tej samej części ogólnej wariancji. Oznacza to,

że części ogólnej zmienności Y, które są uwzględniane przez różne harmoniki, można

sumować.

102

Przykład 2.2.

Zastosujmy metodę harmoniki do prognozy danych dotyczących zużycia energii w

poszczególnych miesiącach.

Tabela 0.3 zawiera wartości energii elektrycznej w kWh w poszczególnych

miesiącach (są to dane fikcyjne wygenerowane na potrzeby tego ćwiczenia) oraz wartości a1-

a3 oraz wartości b1-b3 wyliczone odpowiednio za pomocą wzorów (2.26) oraz (2.27) dla

danych obserwacji. Natomiast wiersz „ai/bi” zawiera wyliczona już sumę zgodnie z tymi

wzorami.

Tabela 0.3. Prognozowanie metodą harmoniki

Energia elektryczna w kWh

a1 a2 a3 b1 b2 b3

14,75 3,82 7,38 10,43 14,25 12,78 10,43 13,62 6,81 11,79 13,62 11,79 6,81 0,00 12,89 9,11 12,89 9,11 9,11 0,00 -9,11 11,38 9,86 9,86 0,00 5,69 -5,69 -11,38 11,84 11,44 5,92 -8,37 3,06 -10,25 -8,37 9,76 9,76 0,00 -9,76 0,00 -9,76 0,00 10,86 10,49 -5,43 -7,68 -2,81 -9,41 7,68 9,78 8,47 -8,47 0,00 -4,89 -4,89 9,78 10,13 7,16 -10,13 7,16 -7,16 0,00 7,16 11,32 5,66 -9,80 11,32 -9,80 5,66 0,00 12,49 3,23 -6,24 8,83 -12,06 10,82 -8,83 14,84 0,00 0,00 0,00 -14,84 14,84 -14,84 14,74 -3,81 7,37 -10,42 -14,24 12,76 -10,42 13,26 -6,63 11,49 -13,26 -11,49 6,63 0,00 13,46 -9,52 13,46 -9,52 -9,52 0,00 9,52 12,62 -10,93 10,93 0,00 -6,31 -6,31 12,62 11,49 -11,10 5,74 8,12 -2,97 -9,95 8,12 10,11 -10,11 0,00 10,11 0,00 -10,11 0,00 10,78 -10,42 -5,39 7,63 2,79 -9,34 -7,63 9,49 -8,22 -8,22 0,00 4,74 -4,74 -9,49 11,18 -7,90 -11,18 -7,90 7,90 0,00 -7,90 13,55 -6,78 -11,74 -13,55 11,74 6,78 0,00 13,68 -3,54 -6,84 -9,67 13,21 11,85 9,67 14,54 0,00 0,00 0,00 14,54 14,54 14,54

Suma -3,15 13,39 -3,81 2,75 23,02 1,55 ai/bi -0,26 1,12 -0,32 0,23 1,92 0,13 Źródło: opracowanie własne

Rysunek 2.7 przedstawia dopasowanie pierwszych trzech składowych ai do danych

wyjściowych wraz z tymi danymi. Jak już to zostało wspomniane, pierwsza harmonika

103

zakłada, że wyjściowe dane mają jeden okres, druga zakłada, że wyjściowe dane mają dwa

okresy, a trzecia, że wyjściowe dane mają trzy okresy.

Rys. 0.7. Dopasowanie poszczególnych składowych ai do danych. Źródło: opracowanie własne

Rysunek 2.8 przedstawia dopasowanie pierwszych trzech składowych bi do danych

wyjściowych wraz z tymi danymi.

Rys. 0.8. Dopasowanie poszczególnych składowych bi do danych. Źródło: opracowanie własne

-15,0

-10,0

-5,0

0,0

5,0

10,0

15,0

20,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Energia elektryczna w kWh a1 a2 a3

-20,0

-15,0

-10,0

-5,0

0,0

5,0

10,0

15,0

20,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Energia elektryczna w kWh b1 b2 b3

104

Zobaczmy następnie jak wygląda pierwszych piętnaście składowych ai oraz bi, wartość

amplitudy oraz ich udział w zmienności Y. Tabela 0.4 przedstawia te dane.

Tabela 0.4. Wyliczenie udziału w zmienności Y

i ai bi 9�� Udział w zmienności Y

1 -0,26 0,23 0,12 2,0% 2 1,12 1,92 4,92 81,2% 3 -0,32 0,13 0,12 1,9% 4 -0,08 0,37 0,14 2,3% 5 -0,03 -0,25 0,07 1,1% 6 0,00 0,09 0,01 0,1% 7 0,05 -0,30 0,09 1,5% 8 0,31 -0,08 0,10 1,7% 9 -0,06 0,08 0,01 0,2%

10 0,14 0,38 0,16 2,7% 11 0,09 -0,03 0,01 0,1% 12 0,00 -0,34 0,11 1,9% 13 -0,09 -0,03 0,01 0,1% 14 -0,14 0,38 0,16 2,7% 15 0,06 0,08 0,01 0,2%


Jak widać pierwsze trzy obserwacje a1-a3 oraz b1-b3 są wzięte z ostatniego wiersza

Tabela 0.3. Kolumna / � została wyliczona zgodnie ze wzorem (2.30). Natomiast udział w

zmienności Y zgodnie ze wzorem (2.34). Wariancja zmiennej Y wynosi 3,03. Jak widać,

najlepszym dopasowaniem charakteryzuje się harmonika druga oraz czternasta (pogrubione w

tabeli). Ich udział w wariancji zmiennej Y wynosi odpowiednio 81,2% oraz 2,7%.

Następnie należy wyliczyć wartości dopasowane oraz prognozowane zgodnie ze

wzorem (2.24). Jednak do tego wzoru użyjemy wyłącznie harmoniki 2 oraz 14. Harmoniki te

przedstawia Rysunek 2.9.

105

Rys. 0.9. Harmoniki: druga oraz czternasta Źródło: opracowanie własne

Tabela 0.5 przedstawia wartości harmoniki 2 oraz harmoniki 14 wyliczonej zgodnie ze

wzorem (2.24). Wartość teoretyczna/dopasowana jest to wartość wyliczona jako suma

średniej wartości wyjściowego szeregu Y (α0) oraz harmoniki drugiej i czternastej. Średnia

wartość energii elektrycznej (szeregu wyjściowego) wynosi 12,2.

Tabela 0.5. Wartości prognozowane modelem analizy harmonicznej

Miesiące Energia

elektryczna w kWh Harmonika 2 Harmonika 14 Wartości teoretyczne

(prognozowane)

1 14,8 2,219 -0,397 14,013 2 13,6 1,925 0,311 14,426 3 12,9 1,116 -0,142 13,164 4 11,4 0,007 -0,065 12,132 5 11,8 -1,103 0,255 11,342 6 9,8 -1,918 -0,376 9,896 7 10,9 -2,219 0,397 10,368 8 9,8 -1,925 -0,311 9,954 9 10,1 -1,116 0,142 11,216

10 11,3 -0,007 0,065 12,248 11 12,5 1,103 -0,255 13,039 12 14,8 1,918 0,376 14,484 13 14,7 2,219 -0,397 14,013 14 13,3 1,925 0,311 14,426 15 13,5 1,116 -0,142 13,164 16 12,6 0,007 -0,065 12,132 17 11,5 -1,103 0,255 11,342

-2,500

-2,000

-1,500

-1,000

-0,500

0,000

0,500

1,000

1,500

2,000

2,500

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Harmonika 2 Harmonika 14

106

Miesiące Energia

elektryczna w kWh Harmonika 2 Harmonika 14 Wartości teoretyczne

(prognozowane)

18 10,1 -1,918 -0,376 9,896 19 10,8 -2,219 0,397 10,368 20 9,5 -1,925 -0,311 9,954 21 11,2 -1,116 0,142 11,216 22 13,6 -0,007 0,065 12,248 23 13,7 1,103 -0,255 13,039 24 14,5 1,918 0,376 14,484 25 2,219 -0,397 14,013 Źródło: opracowanie własne

Rysunek 2.10 został zbudowany na podstawie danych z Tabela 0.5. Przedstawia on

wyjściowe dane o zużyciu energii elektrycznej wraz z wartościami teoretycznymi/

prognozowanymi.

Rys. 0.10. Dane wyjściowe oraz wartości teoretyczne/prognozowane. Źródło: opracowanie własne

Widać, że wartości teoretyczne dość dobrze dopasowały się do danych wyjściowych.

Zauważmy, że za pomocą metody harmoniki można prognozować na znacznie więcej

okresów niż tylko jeden. Wystarczy podstawiać kolejne wartości t na które chcemy znać

prognozę do wzoru (2.24).

8,000

10,000

12,000

14,000

16,000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Wartości teoretyczne (prognozowane) Energia elektryczna w kWh

107

2.5.3. Metoda Kleina

Kolejną metodą pozwalającą na konstrukcję modelu, w którym znajdują się wahania

sezonowe oraz tendencja rozwojowa jest model zaprezentowany przez amerykańskiego

ekonomistę Lawrenca Roberta Kleina, który w roku 1980 otrzymał za ten model Nagrodę

Nobla [24]. Model ten od twórcy modelu jest nazywany jego nazwiskiem. Model Kleina

matematycznie można zapisać za pomocą następującego wzoru [34]

�� = ':(��;+ � ��Ι� + ζ��

�� (2.36)

gdzie:

• f(t) jest funkcją trendu, przy czym (�� = ��< − 1 + =, gdzie l=1,..,N, j=1,…,m czyli

wartość w l-tym cyklu j-tej fazy,

• I i jest zmienną zero-jedynkową, która przyjmuje wartość jeden dla fazy o numerze i

oraz zero dla pozostałych faz cyklu,

• m jest liczbą faz w cyklu.

Parametry modelu Kleina szacuje się za pomocą metody najmniejszych kwadratów,

natomiast prognozy przez ekstrapolację oszacowanego modelu.

Ze względu na skomplikowanie modelu, nie zostanie on przedstawiony szerzej w

niniejszym opracowaniu.

2.6. Prognozowanie na podstawie modeli adaptacyjnych szeregów czasowych

Modele adaptacyjne zyskują coraz bardziej na popularności wśród modeli prognostycznych.

Jest to związane z faktem, że klasyczne modele zakładają prognozę za pomocą metody

podstawowej, co jak wcześniej zostało opisane, zakłada, że model będzie niezmienny w

czasie (budowany model na danych rzeczywistych, będzie aktualny również w przyszłości do

prognozowania). Niestety nie zawsze szereg jest stacjonarny, a model niezmienny w czasie.

Może się zatem okazać w pewnym momencie w przyszłości, że model, którego używamy już

nie prognozuje dobrze, gdyż jest zdezaktualizowany. Prowadzi to do większych błędów

prognozy, gdyż parametry zdezaktualizowanego modelu już nie odzwierciedlają w pełni

rzeczywistych relacji pomiędzy zmienną prognozowaną, a zmiennymi opisującymi tą

zmienną.

Modele adaptacyjne, jak sama nazwa wskazuje adaptują się do zmiennych danych, co

powoduje, że w przyszłości model sam ewoluuje. Model sam dostosowuje się do zmian

108

trendu (zarówno jeśli chodzi o kierunek jak i nachylenie krzywej trendu, czyli szybkość

trendu), zmian amplitudy czy też okresu wahań sezonowych. Modele adaptacyjne nie

zakładają również stałości parametrów występujących w modelu.

Jedynym założeniem jaki musi spełniać szereg czasowy aby móc stosować modele

adaptacyjne, jest założenie stacjonarności w czasie błędów predykcji, co jest założeniem dość

realistycznym.

Prostota obliczeń, względnie wysoka jakość prognoz, odrzucenie niezmienności

modelu w czasie oraz jedyne, dość realistyczne założenie dotyczące stacjonarności błędów

predykcji sprawiły, że modele adaptacyjne szybko stały się bardzo popularne.

Rysunek 2.11 przedstawia najważniejsze modele, które możemy zaliczyć do modeli

adaptacyjnych.

Rys. 0.11. Modele adaptacyjne Źródło: opracowanie własne

Poszczególne modele prognostyczne zostaną szczegółowo opisane w następnych

rozdziałach niniejszego opracowania.

Modele adaptacyjne

Modele naiwne

Średnia ruchoma

Wygładzanie wykładnicze

Trend pełzający

109

2.7. Modele naiwne

Modele naiwne są najprostszym modelem adaptacyjnym. Charakteryzują się one dużą

prostotą. Opierają się one na założeniu, że prognozowana wartość nie ulegnie zmianie w

najbliższym okresie (np. zysk danego przedsiębiorstwa w następnym kwartale będzie taki sam

jak w obecnym, wzrost obrotów w następnym kwartalne wzrośnie w tym samym stopniu w

przyszłym miesiącu, w jakim wzrósł w obecnym). Z powodu tego założenia, modele naiwne

używane są do prognozowania krótkoterminowego (np. jeden miesiąc lub jeden kwartał).

Inną możliwością użycia modeli naiwnych jest niematerialność prognozowanej kwoty lub jej

bardzo mała amplituda zmian (np. wartość kapitału zakładowego nie zmieni się przez

najbliższy rok do czasu zatwierdzenia sprawozdania finansowego przez audytora).

Matematycznie model metody naiwnej, w którym zakładamy, że zmienna w okresie t+1 jest

równa wartości tej zmiennej w okresie t można zapisać za pomocą następującego wzoru [9]

��∗ = ��, (2.37)

gdzie:

• ��∗ – prognoza zmiennej Y na okres t+1,

• �� – wartość zmiennej Y na okres t.

Metoda ta jest oparta na modelu błądzenia losowego, który to ma rozkład normalny ze

średnią zero. Ponieważ prawdopodobieństwo tego, że dana zmienna wzrośnie jest takie samo

jak to że spadnie, zgodnie z symetrycznym rozkładem normalnym, zatem zakłada się stały

poziom tej zmiennej.

Metody naiwne można też rozszerzać. Jeśli na przykład w danych widoczny jest trend,

wtedy możemy założyć, że wartość w okresie t+1 będzie równa wartości w okresie t

zwiększonej o wartość trendu szacowną jako różnice pomiędzy okresami t oraz t-1. Możemy

to zapisać za pomocą następującego wzoru, przy analogicznych oznaczeniach jak we wzorze

(2.37)

��∗ = �� + �� − ��. (2.38)

Trend możemy też spróbować opisać za pomocą współczynnika addytywnego.

Współczynnik ten będzie określał pewną tendencję do spadku lub wzrostu zmiennej y w

badanym okresie o pewną stałą c. Wtedy zamiast wzrostu/spadku zmiennej y wyliczonej jako

różnica pomiędzy wartościami t oraz t-1 możemy do zmiennej w okresie t dodać stałą c.

Można to zapisać za pomocą następującego wzoru

��∗ = �� + 6. (2.39)

110

Trend możemy również spróbować opisać za pomocą innego współczynnika –

multiplikatywnego. Współczynnik ten będzie określał pewną tendencję do spadku lub

wzrostu zmiennej y w badanym okresie o pewien procent c. Matematycznie możemy to


��∗ = �� ∙ �1 + 6. (2.40)

Metody naiwne są bardzo proste w zrozumieniu oraz szybkie i tanie w implementacji

przez każde przedsiębiorstwo. Jednak z uwagi na swoją prostotę ich wartość prognostyczna

jest dość niska. Natomiast błąd prognozy można oszacować wyłącznie ex post. Nie ma

możliwości oszacowania błędu ex ante.

Zauważmy, że za pomocą modeli naiwnych można prognozować na znacznie więcej

okresów niż tylko jeden. Jest to bardzo proste, jednak jak już zostało wspomniane, im dłuższy

okres tym większy błąd prognozy możemy generować.

2.8. Modele średniej ruchomej

Modele średnie ruchomej są drugim rodzajem modeli adaptacyjnych. Warto wspomnieć, że

średnia ruchoma oprócz prognozowania może też być użyta do wygładzania szeregów

czasowych.

Metoda średniej ruchomej polega na zastąpieniu oryginalnego szeregu zmiennej Y,

prognozowanymi wartościami średniej arytmetycznej obliczonymi dla każdej wartości z k

ostatnich elementów (obserwacji).

Używając średniej ruchomej do prognozowania, zakłada się, że wartość zmiennej y w

okresie t+1 jest równa wartości średniej arytmetycznej z ostatnich k obserwacji tej zmiennej.

Matematycznie możemy tą regułę zapisać za pomocą następującego wzoru (jest to tak zwana

średnia ruchoma prosta) [38]

��∗ =1> � � �

��, (2.41)

gdzie k jest tak zwaną stałą wygładzania. Im większe k, tym szereg czasowy będzie bardziej

wygładzony (odstające obserwacje będą miały bardzo mały wpływ na wartość szeregu).

Wadą dużego k jest wolna reakcja szeregu średnich na zmiany oryginalnego szeregu Y.

Mała wartość k będzie powodowała natomiast, że szereg zmiennych będzie bardzo

szybko reagował na zmiany wyjściowego szeregu zmiennej Y. Jego wadą natomiast będzie

duży wpływ obserwacji odstających na wartość szeregu średnich.

111

Stała k jest określana przez osobę prognozującą i jest to najtrudniejsza część tej

metody.

Należy zauważyć, że w prostej średniej arytmetycznej, na wartość prognozowanej

zmiennej Y w takim samym stopniu będzie miała informacja (obserwacja) ostatnia, jak i

pierwsza brana do liczenia średniej.

Bardzo często zakłada się w prognozowaniu, że ostatnie obserwacje niosą więcej

informacji (można powiedzieć, że w większym stopniu tłumaczą zachowanie zmiennej Y),

niż obserwacje początkowe. W celu zwiększenia istotności ostatnich obserwacji nadaje im się

większą wagę. Taki sposób prognozowania nazywamy średnią ruchomą ważoną.

Matematycznie model średniej ruchomej ważonej możemy zapisać za pomocą następującego

wzoru

��∗ = � � �

�� , (2.42)

gdzie wi jest wagą nadaną przez osobę prognozującą, zmiennej prognozowanej w okresie i.

Wagi są liczbami nieujemnymi, które posiadają następujące własności:

�� < �� < ⋯ < �� ≤ 1, (2.43)

��

��= 1. (2.44)

Zauważmy, że w przypadku średniej ruchomej ważonej, osoba przeprowadzająca

prognozowanie musi określić liczbę wyrazów średniej (podobnie jak w prostej średniej

ruchomej) oraz dodatkowo wagę każdej obserwacji. W przypadku obu modeli średniej

ruchomej (prostej oraz ważonej) do prognozowania służy tylko k ostatnich elementów.

Modele średniej ruchomej stosuje się najczęściej do szeregów, które nie mają trendu

oraz sezonowości. W przypadku szeregów czasowych w których występuje trend linowy

można zastosować metodę tzw. podwójnej średniej ruchomej. Polega ona na pierwszym

wygładzeniu danych za pomocą średniej ruchomej, a następnie obliczeniu średniej ruchomej

już na wygładzonym szeregu danych.

Przykład 2.3.

Zastosujmy średnią ruchomą prostą oraz ważoną do prognozowania kursu akcji. Do

tego celu użyjemy różnych współczynników wygładzania oraz różnych wag w przypadku

średniej ruchomej ważonej.

112

Tabela 0.6 pokazuje prognozę za pomocą średniej ruchomej prostej oraz ważonej z

różnymi wagami i różnymi współczynnikami wygładzania. Model prognozuje wartość kursu

akcji BUDIMEX na dzień 1 lipca 2013 roku na podstawie kursów zamknięcia akcji

notowanych na Giełdzie Papierów Wartościowych w Warszawie od 10 czerwca 2013 roku do

28 czerwca 2013 roku (15 obserwacji).

Tabela 0.6. Prognozowanie kursu akcji BUDIMEX za pomocą średniej ruchomej

okres szereg oryginalny

średnia ruchoma prosta (k=3)

średnia ruchoma prosta (k=5)

średnia ruchoma ważona

(k=3, w1=0,2, w2=0,3, w3=0,5)


(k=3, w1=0,1, w2=0,1, w3=0,8)

1 87,40 2 87,75 3 88,00 4 88,73 87,72 87,81 87,89 5 90,65 88,16 88,32 88,49 6 92,70 89,13 88,51 89,54 90,00 7 93,00 90,69 89,57 91,29 91,89 8 95,28 92,12 90,62 92,44 92,71 9 93,20 93,66 92,07 94,08 94,57

10 91,30 93,83 92,97 93,78 93,60 11 92,50 93,26 93,10 92,67 92,08 12 91,40 92,33 93,06 92,28 92,33 13 93,00 91,73 92,74 91,71 91,61 14 88,03 92,30 92,28 92,42 92,63 15 94,00 90,81 91,25 90,20 89,36

prognoza 91,68 91,79 92,01 83,90 Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie

Aby zobaczyć, który model najlepiej prognozuje, należy zweryfikować wartość

prognozy poszczególnych modeli z kursem zamknięcia akcji w dniu 1 lipca 2013 roku.

Wynosi on 94,60 PLN.

2.12 podsumowuje dane z Tabela 0.6. Na podstawie tego wykresu można próbować

zobaczyć, który model najlepiej dopasował się do danych. Można podejrzewać, że model,

który najlepiej dopasuje się do danych, najlepiej zaprognozuje też ich przyszłą wartość.

Oczywiście nie musi tak się zdarzyć, jeśli nastąpi gwałtowny spadek lub wzrost wartości

oryginalnego szeregu. Wtedy może się okazać, że gorzej dopasowany model lepiej przewidzi

przyszłą wartość zmiennej.

113

Rys. 0.12. Model średniej ruchomej Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie

Za pomocą modeli średniej ruchomej można prognozować na znacznie więcej

okresów niż tylko jeden. W takim przypadku, prognoza na okres t+1 staje się składnikiem

średniej do wyliczenia na okres t+2.

Gdy mamy do czynienia z sezonowością, w niektórych przypadkach stosując średnią

ruchomą scentrowaną możemy ten szereg wygładzić oraz pozbyć się sezonowości. W

modelu średniej ruchomej scentrowanej, wartość średniej ruchomej zależy od tego, czy stała

wygładzania k jest liczbą parzystą, czy nieparzystą [38].

Gdy k jest liczbą nieparzystą, wartości scentrowanej średniej ruchomej obliczane są

jako średnia k wyrazów przypisywana do wyrazu środkowego.

Gdy k jest liczbą parzystą, a tak jest najczęściej, przy próbie likwidacji sezonowości

(np. kwartały), wartości scentrowanej średniej ruchomej obliczane są za pomocą


��∗ =�� ?��

�

+∑ � ��

��

��

�

+��

�

@. (2.45)

Starając się ten wzór przełożyć na bardziej zrozumiały opis, możemy powiedzieć, że

gdy k jest parzyste, do wyznaczenia prognozy za pomocą średniej scentrowanej, liczona jest

suma z połowy pierwszej wartości szeregu, połowy z (k+1)-szej wartości oraz wszystkich

wartości pomiędzy nimi. Następnie suma ta dzielona jest przez wartość k. Dla przykładu,

84,00

86,00

88,00

90,00

92,00

94,00

96,00

średnia ruchoma prosta (k=3) średnia ruchoma prosta (k=5)


(k=3, w1=0,2, w2=0,3, w3=0,5)


(k=3, w1=0,1, w2=0,1, w3=0,8)

szreg oryginalny

114

obliczając średnią dla k=4, liczymy średnią z połowy wartości pierwszej i połowy piątej

obserwacji oraz wartości drugiej, trzeciej i czwartej obserwacji zmiennej Y.

Przykład 2.4.

Zastosujmy scentrowana średnią ruchomą dla wygładzenia szeregu wartości eksportu

towarów, który zawiera wahania sezonowe.

Tabela 0.7 zawiera wartość eksportu towarów w milionach złotych od początku

danego roku do danego kwartału. Dane pochodzą z Głównego Urzędu Statystycznego od

początku roku 2009 do końca roku 2012 w podziale na kwartały. Dodatkowo tabela zawiera

wartości szeregu wygładzonego za pomocą scentrowanej średniej ruchomej z k=4 (gdyż

mamy cztery kwartały).

Tabela 0.7. Dane eksportu towarów w milionach PLN

Okres Eksport w mln

PLN Scentrowana średnia ruchoma

(k=4)

2009Q1 34 426,63

2009Q2 69 191,53

2009Q3 104 053,03 87 515,26

2009Q4 141 080,67 88 889,85

2010Q1 37 045,00 91 752,91

2010Q2 77 569,83 95 977,70

2010Q3 118 579,27 99 207,11

2010Q4 160 352,73 101 444,85

2011Q1 43 608,20 105 038,58

2011Q2 88 908,53 110 451,68

2011Q3 135 990,43 114 410,81

2011Q4 186 246,33 116 395,47

2012Q1 49 387,67 119 257,82

2012Q2 99 006,33 122 456,16

2012Q3 148 791,47

2012Q4 199 032,03 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Rysunek 2.13 przygotowany na podstawie danych z Tabela 0.7 przedstawia

wygładzenie szeregu wyjściowego oraz dopasowanie scentrowanej średniej ruchomej do

danych. Jak łatwo zauważyć, średnia scentrowana nie zawiera już sezonowości.

115

Rys. 0.13 Scentrowana średnia ruchoma Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

2.9. Modele wygładzania wykładniczego

Modele wygładzania wykładniczego są kolejnym rodzajem modeli adaptacyjnych. Modele

wygładzania wykładniczego stosuje się w szeregach czasowych podobnie jak modele średniej

ruchomej, z tą różnicą, że wagi określone są wykładniczo. Najczęściej modele wygładzania

wykładniczego stosuje się do szeregów czasowych bez wahań sezonowych. W literaturze

można znaleźć wiele modeli wygładzania wykładniczego. W niniejszym opracowaniu zostaną

przedstawione trzy najbardziej znane:

• modele wygładzania wykładniczego Browna,

• modele wygładzania wykładniczego Holta,

• modele wygładzania wykładniczego Wintersa.

Szczegółowe opisy poszczególnych modeli zostanie zaprezentowany w następnych

podrozdziałach.

0

50 000

100 000

150 000

200 000

250 000

2009Q1

2009Q2

2009Q3

2009Q4

2010Q1

2010Q2

2010Q3

2010Q4

2011Q1

2011Q2

2011Q3

2011Q4

2012Q1

2012Q2

2012Q3

2012Q4

scentrowana średnia ruchoma Eksport w mln PLN

116

2.9.1. Modele wygładzania wykładniczego Browna

Model wygładzania wykładniczego Browna został zaprezentowany przez Roberta Goodella

Browna w roku 1959 odtąd zwany jego nazwiskiem [6].

W metodzie wygładzania wykładniczego do prognozowania zakłada się, że

wygładzona wartość zmiennej Y w okresie t+1 jest równa pewnemu procentowi α zmiennej y

z okresu t oraz pewnemu procentowi (1-α) zmiennej prognozowanej y* na okres t. Procent

zmiennej prognozowanej y* z okresu t został wzięty w ten sposób, aby stanowić dopełnienie

(1-α) zmiennej y z okresu t. Suma tych dwóch procentów musi sumować się do jedności.

Matematycznie możemy tą regułę zapisać za pomocą następującego wzoru [17]

��∗ = � ∙ �� + (1 − �) ∙ ��∗, (2.46)

gdzie:

• ��∗ – prognoza zmiennej Y na okres t+1,

• ��∗– prognoza zmiennej Y na okres t,

• ��– rzeczywista wartość zmiennej Y na okres t,

• α – stała wygładzania z przedziału (0,1].

Oczywiście w tym modelu musimy założyć, że ��∗ = ��, tzn. że pierwsza wartość

prognozy jest równa pierwszej wartości szeregu prognozowanego.

Dobór wag w modelu wygładzania wykładniczego Browna zależy od osoby

przeprowadzającej prognozowanie oraz typu danych na podstawie których jest wykonywana

prognoza. Jeśli prognosta sądzi, że możliwe są częste zmiany w czasie zmiennej

prognozowanej y*, to powinien większą wagę przyłożyć do najświeższych rzeczywistych

wartości zmiennej y (α powinno być blisko jedynki). Można powiedzieć, że w tym przypadku,

prognoza będzie w większym stopniu uwzględniać błędy ex post poprzednich prognoz.

Natomiast, gdy α będzie bliżej zera, większe znaczenie będzie miała wartość wygładzona w

poprzednim okresie. W tym przypadku prognoza w mniejszym stopniu będzie odzwierciedlać

błędy ex post poprzednich prognoz.

Bardzo często zakłada się, że ostatnie obserwacje w większym stopniu objaśniają

zmienną, co świadczy o tym, że większą wagę powinniśmy przyłożyć do nowszych

obserwacji. Najczęściej parametr α określany jest empirycznie na podstawie danych

historycznych tak, aby szereg prognoz był jak najlepiej dopasowany do szeregu

rzeczywistych wartości zmiennej y.

117

Metoda ta nazywana jest także metodą pojedynczego wygładzania wykładniczego.

Określenie wykładnicze jest związane ze sposobem wyliczenia szeregu prognozowanego

zmiennej Y. Zobaczmy jak wygląda kilka pierwszych wartości tego szeregu.

Dla t=1, mamy

��∗ = � ∙ �� + (1 − �) ∙ ��∗ = � ∙ �� + (1 − �) ∙ �� = ��. (2.47)

Dla t=2 oraz podstawiając za ��∗ wyrażenie z równania (2.47) mamy

��∗ = � ∙ �� + �1 − � ∙ ��∗ = � ∙ �� + �1 − � ∙ ��. (2.48)


��∗ = � ∙ �� + �1 − � ∙ ��∗ = � ∙ �� + �1 − � ∙ �� ∙ �� + �1 − � ∙ �� == � ∙ �� + ��1 − � ∙ �� + (1 − �)� ∙ ��. (2.49)


��∗ = � ∙ �� + �1 − � ∙ ��∗ == � ∙ �� + �1 − � ∙ �� ∙ �� + ��1 − � ∗ �� + (1 − �)� ∙ �� == � ∙ �� + � ∙ �1 − � ∙ �� + � ∙ �1 − �� ∙ �� + �1 − �� ∙ ��. (2.50)

Ogólnie dla t=k oraz korzystając z rekurencji mamy

��∗ = � ∙ �� + � ∙ �1 − � ∙ �� + � ∙ �1 − �� ∙ �� +⋯+ �1 − �� ∙ ��. (2.51)

Ponieważ α zawiera się w przedziale (0,1], zatem wagi α, α(1- α), α(1- α)2 mają

wartości wykładnicze malejące, co daje nazwę tej metodzie. Z uwagi na to, że jest to szereg

geometryczny, zatem zgodnie z wzorem na sumę szeregu geometrycznego, jego wartości

sumują się do jedności. W przypadku gdy α=1, model upraszcza się do modelu metody

naiwnej.

W przypadku szeregów czasowych w których występuje trend linowy można

zastosować metodę tzw. podwójnego wygładzania wykładniczego. Polega ona na

pierwszym wygładzeniu danych za pomocą wygładzania wykładniczego, a następnie

obliczeniu kolejnego wygładzania wykładniczego już na szeregu wygładzonym. Można to

zapisać za pomocą następującego wzoru rekurencyjnego

A�B�� = �B��B�� = � ∗ �B� + (1 − �) ∗ �B�� (2.52)

gdzie:

• �B�� – jest wartością podwójnie wygładzonego szeregu dla okresu t,

• �B� – jest wartością wygładzonego szeregu dla okresu t.

W przypadku trendu nieliniowego stosuje się modele potrójnego wygładzania

nieliniowego.

Przykład 2.5.

118

Zaprognozujmy za pomocą modelu wygładzania wykładniczego kurs akcji

BUDIMEX stosując różne parametry wygładzania.

Tabela 0.8 pokazuje prognozę za pomocą wygładzania wykładniczego z różnymi

parametrami wygładzania.

Model prognozuje wartość kursu akcji BUDIMEX na dzień 1 lipca 2013 roku na

podstawie kursów zamknięcia notowanych na Giełdzie Papierów Wartościowych w

Warszawie od 10 czerwca 2013 roku do 28 czerwca 2013 roku (15 obserwacji).

Tabela 0.8. Prognozowanie kursu akcji BUDIMEX za pomocą wygładzania wykładniczego

Okres szreg oryginalny

Wygładzanie wykładnicze (alfa = 0,1)



1 87,40 87,40 87,40 87,40 2 87,75 87,40 87,40 87,40 3 88,00 87,44 87,58 87,72 4 88,73 87,49 87,79 87,97 5 90,65 87,62 88,26 88,65 6 92,70 87,92 89,45 90,45 7 93,00 88,40 91,08 92,48 8 95,28 88,86 92,04 92,95 9 93,20 89,50 93,66 95,05 10 91,30 89,87 93,43 93,38 11 92,50 90,01 92,36 91,51 12 91,40 90,26 92,43 92,40 13 93,00 90,38 91,92 91,50 14 88,03 90,64 92,46 92,85 15 94,00 90,38 90,24 88,51 prognoza 90,74 92,12 93,45

Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie

Jak już zostało wspomniane, kurs zamknięcia akcji w dniu 1 lipca 2013 roku wynosi

94,60 PLN.

Rysunek 2.14 podsumowuje dane z Tabela 0.8. Na podstawie tego wykresu łatwo

zobaczyć, która stała wygładzania najlepiej dopasowała model do danych. Stała ta wynosi

0,9. Błąd ex post pomiędzy prognozą, a faktycznym wykonaniem wynosi 1,15 PLN

(94,60 PLN – 93,45 PLN), co stanowi 1,2% wartości akcji w dniu 1 lipca 2013 roku.

119

Rys. 0.14. Wygładzanie wykładnicze Browna Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie

Warto zauważyć, że za pomocą modeli wygładzania Browna można prognozować na

znacznie więcej okresów niż tylko jeden.

2.9.2. Modele wygładzania wykładniczego Holta

Metoda wygładzania wykładniczego Holta jest rozwinięciem modelu wygładzania

wykładniczego Browna. Metoda ta została przedstawiona przez Charlsa C. Holta w roku 1957

[23]. Model ten dodatkowo pozwala modelować szeregi z trendem. Do modelowania trendu

użyty jest wielomian stopnia pierwszego, czyli linia prosta. Metoda wygładzania

wykładniczego Holta jest bardziej elastyczna w porównaniu z modelem wygładzania

wykładniczego Browna, gdyż występują w nim dwa parametry dobierane przez osobę

przeprowadzającą prognozowanie. Równanie modelu wygładzania wykładniczego Holta

możemy zapisać za pomocą następujących wzorów [40]:

C� = � ∙ �� + (1 − �) ∙ �C�� + D��, (2.53)

D� = � ∙ �C� − C��+ (1 − �) ∙ D��, (2.54)

oraz wzoru na wartość prognozy

��∗ = C� + D�, (2.55)

gdzie:

• Ft – wygładzona wartość zmiennej prognozowanej na moment t,

• Tt – wygładzona wartość przyrostu trendu na moment t,

86,00

87,00

88,00

89,00

90,00

91,00

92,00

93,00

94,00

95,00

96,00

Wygładzanie wykładnicze (alfa = 0,1) Wygładzanie wykładnicze (alfa = 0,5)

Wygładzanie wykładnicze (alfa = 0,9) szreg oryginalny

120

• α, β – parametry modelu z przedziału (0,1].

W modelu tym jako wartości początkowe przyjmuje się najczęściej F1=y1 oraz T1=y2-y1.

Jak widać, proces wygładzania w tym modelu może być rozbity na dwa etapy:

• etap przybliżania poziomu zmiennej, któremu to odpowiada wzór (2.53),

• etap przybliżania przyrostu zmiennej, któremu to odpowiada wzór (2.54).

Zmienna β wyraża wpływ przyrostu. Gdy wpływ ten jest silny, parametr β jest bliskie zera.

Natomiast, gdy wpływ ten jest słaby, parametr β jest bliski jedności.

Przykład 2.6.

Zobaczmy jak wygląda dopasowanie modelu wygładzania wykładniczego Holta w

przypadku prognozowania eksportu towarów w milionach PLN. Dane pochodzą z Głównego

Urzędu Statystycznego od początku roku 2008 do końca roku 2012 w podziale na kwartały i

przedstawiają wartość eksportu w poszczególnych kwartałach danego roku.

Tabela 0.9 przedstawia dane eksportu wraz z prognozą modelu wygładzania

wykładniczego Holta. Model został skalibrowany z parametrami α= 0,9 oraz β=0,6.

Łatwo zauważyć, że prognoza na okres pierwszego kwartału 2013 roku jest prawie

idealna. Różnica na kwocie 3,5 mln PLN stanowi błąd ex post rzędu 0,01%.

Tabela 0.9. Prognozowanie eksportu towarów za pomocą wygładzania wykładniczego Holta

Okres Eksport w mln

PLN F T Prognoza

2008Q1 34 425,37 34425,4 352,7 0,0

2008Q2 34 778,07 34778,1 352,7 34 778,1

2008Q3 33 603,97 33756,6 -471,8 35 130,8

2008Q4 32 320,30 32416,8 -992,6 33 284,9

2009Q1 34 426,63 34126,4 628,7 31 424,1

2009Q2 34 764,90 34763,9 634,0 34 755,1

2009Q3 34 861,50 34915,1 344,3 35 397,9

2009Q4 37 027,63 36850,8 1299,1 35 259,5

2010Q1 37 045,00 37155,5 702,5 38 150,0

2010Q2 40 524,83 40258,1 2142,6 37 858,0

2010Q3 41 009,43 41148,6 1391,3 42 400,7

2010Q4 41 773,47 41850,1 977,4 42 539,8

2011Q1 43 608,20 43530,1 1399,0 42 827,5

2011Q2 45 300,33 45263,2 1599,4 44 929,1

2011Q3 47 081,90 47060,0 1717,8 46 862,7

121

Okres Eksport w mln

PLN F T Prognoza

2011Q4 50 255,90 50108,1 2516,0 48 777,8

2012Q1 49 387,67 49711,3 768,3 52 624,1

2012Q2 49 618,67 49704,8 303,4 50 479,6

2012Q3 49 785,13 49807,4 183,0 50 008,2

2012Q4 50 240,57 50215,6 318,1 49 990,4

2013Q1 (prognoza) 50 530,10 50 533,6 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Rysunek 2.15 podsumowuje dane z Tabela 0.9. Zauważmy, na podstawie tego

wykresu, że szereg prognoz dość ładnie dopasowuje się do wartości szeregu wyjściowego, co

potwierdza mały błąd prognozy. Dodatkowo na rysunku została umieszczona prosta trendu

wraz z jej równaniem, aby podkreślić tendencję rozwojową występującą w danych.

Rys. 0.15. Wygładzanie wykładnicze Holta Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Warto zauważyć, że za pomocą modeli wygładzania Holta można również

prognozować na znacznie więcej okresów niż tylko jeden.

y = 1070,2x + 29855

30 000,0

35 000,0

40 000,0

45 000,0

50 000,0

55 000,0

Prognoza Eksport w mln PLN Liniowy (Eksport w mln PLN)

122

2.9.3. Modele wygładzania wykładniczego Wintersa

Metoda wygładzania wykładniczego Wintera jest uogólnieniem metody Holta. Została ona

przedstawiona przez Petera R. Wintersa w roku 1960 [44]. Jest stosowana dla szeregów, które

zawierają trend, a także wahania sezonowe. Wahania sezonowe mogą nakładać się na trend w

sposób addytywny lub multiplikatywny. Wersja multiplikatywna jest używana rzadziej, ze

względu na założenie, że przyrosty względne wartości trendu zmiennej Y zmieniają się w

sposób regularny lub są mniej więcej stałe. Oczywiście mówimy tylko o przypadkach, w

których nie nastąpiła zmiana lub załamanie trendu.

Równanie modelu wygładzania wykładniczego Wintersa w wersji addytywnej


C� = � ∙ �� − ��+ (1 − �) ∙ �C�� + D��, (2.56)

D� = � ∙ �C� − C��+ (1 − �) ∙ D��, (2.57)

� = � ∙ ��−C�+ (1 − �) ∙ ��, (2.58)


��∗ = C� + D� + ��, (2.59)

gdzie:

• Ft – wygładzona wartość zmiennej prognozowanej na moment t,

• Tt – wygładzona wartość przyrostu trendu na moment t,

• St – wygładzona wartość składnika sezonowości na moment t,

• r – długość cyklu sezonowego,

• α, β, γ – parametry modelu z przedziału (0,1].

W modelu tym jako wartości początkowe przyjmuje się najczęściej F1=y1 oraz T1=y2-

y1, natomiast, początkowe wartości St otrzymujemy odejmując od wartości yi średnią z r

pierwszych obserwacji.

Jak widać, proces wygładzania w tym modelu może być rozbity za pomocą trzech

etapów:

• etap przybliżania poziomu zmiennej, któremu to odpowiada wzór (2.56),

• etap przybliżania przyrostu zmiennej, któremu to odpowiada wzór (2.57),

• etap przybliżania sezonowości zmiennej, któremu to odpowiada wzór (2.58).

Równanie modelu wygładzania wykładniczego Wintersa w wersji multiplikatywnej


C� = � ∙ * �� -+ (1 − �) ∙ �C�� + D��, (2.60)

123

D� = � ∙ �C� − C��+ (1 − �) ∙ D��, (2.61)

� = � ∙ *��C�- + (1 − �) ∙ ��, (2.62)


��∗ = �C� + D� ∙ ��, (2.63)

Przykład 2.7.

Zobaczmy jak wygląda dopasowanie modelu wygładzania wykładniczego Wintersa w

wersji addytywnej w przypadku prognozowania średniego miesięcznego wynagrodzenia

brutto w sektorze przedsiębiorstw zatrudniających przynajmniej 9 osób. Dane pochodzą z

Głównego Urzędu Statystycznego od początku roku 2008 do końca roku 2012 w podziale na

kwartały. Wartość kwartalna wyliczana jest jako średnia arytmetyczna z trzech miesięcy.

Tabela 0.10 przedstawia dane średniego miesięcznego wynagrodzenia brutto w

sektorze przedsiębiorstw wraz z prognozą modelu wygładzania wykładniczego Wintersa w

wersji addytywnej. Model został skalibrowany z parametrami α= 0,7, β=0,9 oraz γ=0,1.

Średnia r została policzona z czterech kwartałów roku 2008 (4 obserwacje) i wynosi

3 176,5 PLN.

Tabela 0.10. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą wygładzania wykładniczego Wintersa

okres Średnie miesięczne

wynagrodzenie brutto

F T S Prognoza

2008_Q1 3048,92 3 048,9 91,9 -127,5 2008_Q2 3140,83 3 165,8 114,4 -35,6 3 013,3 2008_Q3 3188,59 3 207,6 49,0 12,1 3 244,5 2008_Q4 3327,523 3 200,5 -1,4 151,1 3 268,7 2009_Q1 3 248,0 3 322,6 109,7 -122,3 3 350,1 2009_Q2 3 258,8 3 335,8 22,9 -39,8 3 310,1 2009_Q3 3 304,6 3 312,3 -18,9 10,1 3 319,0 2009_Q4 3 456,2 3 301,7 -11,5 151,4 3 303,6 2010_Q1 3 337,6 3 409,0 95,4 -117,2 3 441,6 2010_Q2 3 383,0 3 447,2 44,0 -42,2 3 387,2 2010_Q3 3 414,8 3 430,6 -10,6 7,5 3 449,0 2010_Q4 3 604,6 3 443,2 10,3 152,4 3 427,6 2011_Q1 3 482,4 3 555,8 102,3 -112,8 3 606,0 2011_Q2 3 560,8 3 619,5 67,6 -43,9 3 545,3 2011_Q3 3 594,9 3 617,3 4,8 4,5 3 643,2 2011_Q4 3 771,6 3 620,0 2,9 152,3 3 626,6 2012_Q1 3 668,5 3 733,8 102,6 -108,0 3 775,3

124

okres Średnie miesięczne

wynagrodzenie brutto

F T S Prognoza

2012_Q2 3 697,4 3 769,8 42,7 -46,7 3 728,4 2012_Q3 3 675,8 3 713,6 -46,3 0,3 3 765,8 2012_Q4 3 868,9 3 701,8 -15,3 153,8 3 667,6 2013_Q1 (prognoza) 3 741,0 3 840,4

Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

W tabeli 2.10 na szaro zaznaczono wiersze, w których początkowe wartości St,

otrzymaliśmy odejmując od wartości yi średnią równą 3 176,5 PLN. Pozostałe wartości St, są

liczone za pomocą wzoru (2.58).

Zauważmy, że prognoza na okres pierwszego kwartału 2013 roku wyszła wyższa w

porównaniu z wykonaniem, co oznacza, że model lekko przeszacowuje. Różnica na kwocie

99,4 mln PLN stanowi błąd ex post rzędu 2,7% co jest błędem znacznie wyższym niż udało

się osiągnąć przy modelu Holta. Jednak ciągle nie jest to błąd znaczący.

Rysunek 2.16 podsumowuje dane z Tabela 0.10. Dzięki umieszczeniu linii prostej

trendu wraz z jej równaniem, łatwiej zauważyć tendencję rozwojową występującą w danych

oraz sezonowość (gdyż regularnie dane są raz pod linią trendu, a raz nad nią).

Rys. 0.16. Wygładzanie wykładnicze Wintersa Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Podobnie jak w poprzednich modelach, za pomocą modeli wygładzania Wintersa

można prognozować na znacznie więcej okresów niż tylko jeden.

y = 35,108x + 3079,3

3 000,0

3 200,0

3 400,0

3 600,0

3 800,0

4 000,0

2008_Q1

2008_Q2

2008_Q3

2008_Q4

20Q3_Q1

20Q3_Q2

20Q3_Q3

20Q3_Q4

2010_Q1

2010_Q2

2010_Q3

2010_Q4

2011_Q1

2011_Q2

2011_Q3

2011_Q4

20Q4_Q1

20Q4_Q2

20Q4_Q3

20Q4_Q4

2013_Q1

Średnie miesięczne wynagrodzenie brutto

Prognoza

Liniowy (Średnie miesięczne wynagrodzenie brutto)

125

2.10. Trend pełzający

Model trendu pełzającego jest również przykładem szerokiej gamy modeli adaptacyjnych,

czyli modeli dostosowujących się do szeregu wyjściowego Y. W porównaniu z modelami

średniej ruchomej i wygładzania wykładniczego model trendu pełzającego jest znacznie

trudniejszy w implementacji. Jego zaletą jest natomiast prognozowanie szeregów, które

odznaczają się dużą nieregularnością lub załamaniami trendu. Metoda ta została

przedstawiona przez Z. Hellwiga [22] w roku 1967. Polega ona na szacowaniu wartości

trendu w każdym okresie (lub zdefiniowanym przez prognostę fragmencie szeregu) za

pomocą dopasowanych trendów liniowych, a następnie na ekstrapolacji tak uzyskanego

trendu pełzającego za pomocą wag harmonicznych.

Dla danego szeregu czasowego Y oraz stałej wygładzania k ustalonej przez prognostę,

a będącej liczbą obserwacji na jakich szacujemy trend liniowy, szacujemy na kolejnych

fragmentach szeregu:

y1, y2, … , yk,

y2, y3, … , yk+1,

y3, y4, … , yk+2,

…

yn-k+1, yn-k+2, … , yn,

parametry liniowych funkcji trendu:

f1(t)=α1+β1(t), gdzie ( ∈ [1, >], f2(t)=α2+β2(t), gdzie ( ∈ [2, > + 1], f3(t)=α3+β3(t), gdzie ( ∈ [3, > + 2],

…

fn-k+1(t)=αn-k+1+βn-k+1(t), gdzie ( ∈ [� − > + 1, �]. Dla dowolnego ( ∈ [1,�] wartościom yi odpowiadają teoretyczne/prognozowane

wartości y* z wyliczonych funkcji fi. Ostatecznie prognozą na dany moment i jest uśredniona

wartość wyliczonych tych funkcji y* (można powiedzieć, że każdej wartości z szeregu yi

odpowiada wartość prognozowana � ∗), która będzie równa ��. Łącząc kolejne punkty (t,� ∗) otrzymujemy tendencję rozwojową szeregu czasowego w postaci segmentowej, zwaną

trendem pełzającym (stąd nazwa metody). Zauważmy, że szereg prognoz jest dokładnie tej

samej długości co szereg wyjściowy realnych obserwacji. Aby dokonać prognozy należy

zastosować pewien algorytm oparty o wagi harmoniczne. Zastosowanie wag harmonicznych

126

ma na celu uwzględnienie tzw. „postarzania informacji”, co oznacza, że nowsze obserwacje

niosą więcej informacji nt. prognozowanych danych, niż informacje stare. Harmoniczne wagi

są dlatego, iż przyjmuje się założenie, że przyrosty wag przypisywane kolejnym wyrazom

szeregu wyjściowego, są odwrotnie proporcjonalne do wieku danych.

Algorytm wag harmonicznych polega na:

• obliczeniu przyrostów funkcji trendu

�� = ��∗ − ��∗ dla ( ∈ [1, � − 1], (2.64)

• określeniu wartości przyrostów

�% =�6��

��, (2.65)

gdzie 6� są wagami harmonicznymi. Są to liczby dodatnie z przedziału (0,1], których suma

wynosi jeden, a konstruowane są w następujący sposób

6� = 1� − 1� 1� − ,�

��,( = 1,2, … ,� − 1 (2.66)

• wyznaczeniu prognozy punktowej na okres T według następującego wzoru

��∗ = ��+ �D − � ∙�% . (2.67)

We wzorze na prognozę wyraz wolny równy jest ostatniej wartości szeregu prognoz, a

współczynnik nachylenia równy jest sumie wartości przyrostów wyliczonej zgodnie ze

wzorem (2.65).

Warto tutaj wspomnieć, że przeważnie zakłada się, że wartość wygładzania jest stała

we wszystkich fragmentach wyjściowego szeregu, co jest prostszym założeniem w

implementacji. W literaturze można jednak spotkać trend pełzający ze zmienną wartością

wygładzania w poszczególnych fragmentach wyjściowego szeregu.

Podsumowując zastosowanie metody trendu pełzającego ze stałą wygładzania stałą w

czasie prognozy można podzielić na dwa etapy:

• wyrównanie szeregu czasowego przy użyciu trendu pełzającego, za pomocą

trendów liniowych,

• prognozowanie wartości za pomocą wag harmonicznych.

127

Przykład 2.8.

Zobaczmy jak wygląda dopasowanie modelu trendu pełzającego w przypadku

prognozowania średniego miesięcznego wynagrodzenia brutto w sektorze przedsiębiorstw

zatrudniających przynajmniej 9 osób. Dane pochodzą z Głównego Urzędu Statystycznego od

początku roku 2010 do końca roku 2012 w podziale na kwartały. Wartość kwartalna

wyliczana jest jako średnia arytmetyczna z trzech miesięcy. Niech stała wygładzania wynosi

4, co oznacza, że dla każdego roku będziemy szacować wartość trendu na podstawie czterech

kwartałów. W Excelu wartość trendu oszacujemy za pomocą regresji liniowej.

Tabela 0.11 przedstawia dane średniego miesięcznego wynagrodzenia brutto w

sektorze przedsiębiorstw (uśrednione na kwartale) wraz z prognozą modelu trendu

pełzającego.

Tabela 0.11. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą trendu pełzającego

Średnie miesięczne wynagrodzenie brutto

Wartości teoretyczne Y w poszczególnych segmentach

Kwartały t tyś PLN y* 1 2 3 4 5 6 7 8 9

2010_Q1 1 3,34 3,31 3,31

2010_Q2 2 3,38 3,40 3,39 3,40

2010_Q3 3 3,41 3,46 3,48 3,45 3,47

2010_Q4 4 3,60 3,53 3,56 3,50 3,50 3,55

2011_Q1 5 3,48 3,53 3,54 3,53 3,56 3,47

2011_Q2 6 3,56 3,56 3,56 3,56 3,56 3,57

2011_Q3 7 3,59 3,62 3,57 3,65 3,62 3,65

2011_Q4 8 3,77 3,71 3,74 3,67 3,67 3,74

2012_Q1 9 3,67 3,69 3,72 3,69 3,72 3,64

2012_Q2 10 3,70 3,70 3,71 3,69 3,70

2012_Q3 11 3,68 3,71 3,66 3,76

2012_Q4 12 3,87 3,81 3,81 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Wartości teoretyczne zostały wyliczone jako funkcja regresji liniowej zmiennej

wynagrodzenia. Jako zmienna objaśniająca została wykorzystana zmienna t (kolejny numer

kwartału). Funkcja użyta w Excelu to „REGLINP”. Wartość y* jest wyliczona jako średnia

arytmetyczna dla każdego wiersza. Poszczególne wartości funkcji trendu (estymatorów

parametrów) przedstawia Tabela 0.12.

128

Tabela 0.12. Estymatory parametrów

Estymatory parametrów trendu liniowego dla podokresów

0,08 3,23

0,05 3,30

0,03 3,37

0,00 3,53

0,09 3,02

0,05 3,27

0,02 3,51

-0,03 3,95

0,06 3,12 Źródło: opracowanie własne

Następnie spróbujmy zaprognozować wartość wynagrodzenia na kolejne kwartały. Do

tego celu użyjemy wag harmonicznych.

Tabela 0.13. Prognozowanie metodą wag harmonicznych

t y* wt ct - wagi harmoniczne

wt*ct Składniki Wagi

1 3,31

2 3,40 0,086 0,008 0,008 0,0007

3 3,46 0,068 0,009 0,017 0,0012

4 3,53 0,063 0,010 0,027 0,0017

5 3,53 -0,002 0,011 0,039 -0,0001

6 3,56 0,039 0,013 0,052 0,0020

7 3,62 0,059 0,015 0,067 0,0039

8 3,71 0,084 0,018 0,085 0,0071

9 3,69 -0,013 0,023 0,108 -0,0014

10 3,70 0,007 0,030 0,138 0,0010

11 3,71 0,010 0,046 0,184 0,0018

12 3,81 0,104 0,091 0,275 0,0286

13 - prognoza 3,861 Suma = 0,0466 Źródło: opracowanie własne

129

Kolumna „Składniki” w Tabela 0.13 została wyliczona dla każdego t zgodnie z

następującym wzorem

1� − 1 ∙ 1� − ( − 1. (2.68)

Natomiast kolumna „Wagi” stanowi sumy „Składników” od pierwszej obserwacji do

danego t – zgodnie ze wzorem (2.66).

Rysunek 2.17 przedstawia wyjściowy szereg wynagrodzenia oraz dopasowane

wartości szeregu wygładzonego za pomocą trendu pełzającego wraz z prognozą

wyestymowaną za pomocą wag harmonicznych.

Rys. 0.17. Trend pełzający z wagami harmonicznymi Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego

Za pomocą modeli trendu pełzającego można prognozować na znacznie więcej

okresów niż tylko jeden. Korzystając z wzoru (2.67) oraz mając �� oraz �% wystarczy, że

będziemy podmieniać tylko okres T na który chcemy prognozować.

3,00

3,10

3,20

3,30

3,40

3,50

3,60

3,70

3,80

3,90

4,00

Średnie miesięczne wynagrodzenie brutto prognoza

130

ROZDZIAŁ III

BUDOWA I PROGNOZOWANIE NA PODSTAWIE

MODELI AUTOREGRESJI I ŚREDNIEJ RUCHOMEJ

3.1. Proces stochastyczny

Podczas badania zjawisk, zwykle otrzymujemy zestaw zmierzonych wartości pewnej

wielkości, która zmienia się w czasie. Zatem otrzymujemy pewien ciąg wartości {E�}�� . Każdą z wartości możemy interpretować jako realizację pewnego doświadczenia. Z

matematycznego punktu widzenia będzie to zmienna losowa.

Przypomnijmy zatem intuicyjne pojęcie zmiennej losowej, którą określamy jako

zmienną przyjmującą przy realizacji pewnego doświadczenia określoną wartość liczbową w

zależności od losowego wyniku doświadczenia.

Zmienną losową nazywamy dowolną funkcję E określoną na przestrzeni zdarzeń

elementarnych, przyjmującą wartości rzeczywiste (E: Ω → ℝ ) [7, 9, 13, 39].

Dokonując pomiarów w czasie wyznaczamy wartość tej zmiennej losowej w

określonej jednostce czasu. Zatem rozważamy zmienną losową zależną również od czasu.

Załóżmy dodatkowo, że w każdej jednostce czasu zmienne losowe są o rozkładach

normalnych. Rysunek 1 przedstawia wykresy procesów stochastycznych zadanych przez te

zmienne.

131

a) b)

Rys. 0.1. Proces stochastyczny a) dyskretny, b) ciągły Źródło: opracowanie własne

Procesem stochastycznym nazywamy uporządkowany ze względu na czas zbiór

zmiennych losowych [39]. Dokładniej będzie to funkcja �� przekształcająca zbiór � � Ω

w �. Realizację zmiennych losowych w kolejnych chwilach nazywamy szeregiem

czasowym. Zatem szereg czasowy stanowi pojedynczą realizację procesu stochastycznego

[39]. Używając pojęć proces stochastyczny i szereg czasowy należy zwrócić uwagę na to, że i

jedno i drugie pojęcie oznacza ciąg. W pierwszym przypadku jest to ciąg funkcyjny (zmienne

losowe), a w drugim ciąg liczbowy (szeregi czasowe) 1.

W przypadku procesów ekonomicznych z reguły mamy do czynienia z procesami

dyskretnymi, często nazywanymi skokowymi. Obserwacje wartości są przeprowadzane

zazwyczaj w jednakowych odstępach czasu (rocznych, kwartalnych, miesięcznych). W

przypadku obserwacji procesów finansowych mamy do czynienia z obserwacjami dziennymi,

godzinowymi, a ze względu na specyfikę elektronicznego systemu transakcji giełdowych

można twierdzić, że obserwacje są ciągłe. Należy zwrócić uwagę na to, że obserwacja w

określonej chwili jest jedyną realizacją zmiennej losowej dla tej chwili. Tej realizacji

zmiennej losowej nie można powtórzyć czy ponownie zaobserwować2 realizacji tej zmiennej,

gdyż powtórzenie doświadczenia w idealnie takich samych warunkach jest niemożliwe [39].

W dalszej części będziemy proces stochastyczny oznaczać zamiennie w zależności od

kontekstu �� lub ��. Na potrzeby dalszych rozważań przypomnijmy następujące określenia.

1 W literaturze ekonomicznej często stosuje się zamiennie określenia szereg czasowy i proces stochastyczny. 2 Prawdopodobieństwo zaobserwowania tej samej realizacji jest równe zero.

w

t

Yt HwL

132

Dystrybuantą łączną ciągu zmiennych losowych nazywamy funkcję C określoną

zależnością [9]: C��, ��, … , �|(�, (�, … , ( = ��FE�(� ≤ ��,E�(� ≤ ��, … , E�( ≤ �G. Średnią procesu stochastycznego E� nazwiemy funkcję �:D → ℝ określoną

zależnością3:

�� = ��( = �HE�(I = �HE�I = J '�"|("K"�

��.

Wariancją procesu stochastycznego nazywamy funkcję L�:D → ℝ określoną

zależnością

L�� = L��( = L��E� = M!0�E� = J '�"|([" −��]��

��K".

Autokowariancją procesu stochastycznego nazwiemy funkcję 61M:D × D → ℝ,

określoną zależnością ��,�� = 61M:E�� ,E��; = �N:E�(�−��(�;:E�(�−��(�;O. Oczywiście mając, wielkości wariancji i autokowariancji możemy zbudować dla

procesu dyskretnego macierz wariancji i kowariancji postaci:

� = PQQQR L�� ,�� , L�� … ��,��

⋯ ��,��⋮ ⋮��,�� ,�� ⋱ ⋮

⋯ L� STTTU,

a następnie macierz korelacji procesu stochastycznego

V = PQQR 1 V��,��V��,�� 1

… V��,��⋯ V��,��

⋮ ⋮V��,�� V��,�� ⋱ ⋮

⋯ 1 STTU,

gdzie funkcja autokorelacji jest postaci V��,�� = ��,��

.

Do badań szeregów czasowych używamy nieco zawężonych pojęć. Przez funkcję

autokorelacji ACF rozumiemy funkcję V� = ��, gdzie �� = 61M�E�,E�. 3 W definicjach stosujemy kilka oznaczeń w dalszej części będziemy wykorzystywać je zamiennie.

133

Estymatorami tych funkcji są dla funkcji autokowariancji o odstępie >

6� = 1��(�� − ��)(�� − ��),��

��

gdzie �� oznaczą wartość średnią.

Estymatorem funkcji autokorelacji jest 0� = 6�6�. Natomiast wariancję estymatora funkcji autokorelacji wyznaczamy z zależności:

M!0�0� = 1� W1 + 2�0 �!

��X ,> > �.

Wykres funkcji 0� w zależności od wartości > nazywamy korelogramem.

Funkcja autokorelacji cząstkowej (w skrócie PACF) jest odpowiednikiem funkcji

autokorelacji (ACF). Mierzy ona korelację między kolejnymi opóźnieniami po

wyeliminowaniu wpływu pośrednich opóźnień. Dlatego dla rzędu opóźnienia 1 funkcje ACF i

PACF mają równe wartości.

Funkcję PACF oznaczamy przez Y�,� i obliczmy następująco:

Y�,� =K4(

PQQQR 1 V� V�V� 1 V�V� V� 1

⋯ V�� V�⋯ V�� V�⋯ V�� V�

⋮ ⋮ ⋮V�� V�� V�� ⋮ ⋮ ⋮

⋯ V� V� STTTU

K4(PQQQQRPQQQR 1 V� V�V� 1 V�V� V� 1

⋯ V�� V��⋯ V�� V��⋯ V�� V��

⋮ ⋮ ⋮V�� V�� V�� ⋮ ⋮ ⋮

⋯ V� 1STTTUSTTTTU.

3.2. Filtrowanie szeregów

W celu uzyskania szeregu stacjonarnego stosuje się często przekształcenia szeregów za

pomocą tzw. filtrów z których najczęściej stosujemy filtry liniowe. Filtry liniowe są

stosowane do transformacji zmiennych, które charakteryzują się trendem stochastycznym lub

deterministycznym, które omawiamy później. Filtrem liniowym nazywamy zamianę procesu E� na proces E�∗ za pomocą przekształcenia [7, 14]

134

E�∗ = � 8 E� ,"

��

gdzie ( = 0 + 1,… , � − �, 0 + � + 1 < �, 0, � > 0, 8 – wagi.

W zależności od postaci wag mamy:

• średnią ruchomą, gdy ∑ 8 = 1,

• średnią scentrowaną, gdy 0 = �,

• średnią symetryczną, gdy 8 = 8� .

Rys. 0.2. Zastosowanie filtru liniowego Źródło: Dane PKB GUS, obliczenia własne

Przy stosowaniu filtrów liniowych występują następujące problemy:

• obcięcie 0 początkowych i � końcowych wyrazów szeregu wstępnego (stosuje się

wtedy średnie asymetryczne).

• średnia asymetryczna powoduje przesunięcie fazy.

• średnia ruchoma rzędu k (której wszystkie współczynniki są równe 1/k) usuwa

sezonowość o okresie k.

Do usuwania trendu wielomianowego stosujemy tzw. filtr różnicowy Δ 4 postaci:

ΔE� = E� − E��.

4 nazywany też operatorem różnicowania.

170000

190000

210000

230000

250000

270000

290000

310000

330000

1 3 5 7 9 11 13 15 17 19 21 23

y_t

średnia 3 okresowa

135

Rekurencyjnie filtr różnicowy możemy zdefiniować dla dowolnego rzędu 2

następująco:

Δ#E� = Δ�Δ#��E�.

Przykład 3.1. (dla 2 = 2) Δ�E� = Δ�ΔE� = Δ�E� − E�� = �E� − E��− �E�� − E�� = E� − 2E�� + E��.

Do opisu procesów autoregresyjnych stosujemy pewne operatory. Jednym z nich jest

operator opóźnienia5 Z określony następująco: ZE� = E��. Pomiędzy operatorem opóźnienia a filtrem różnicowym zachodzi zależność:

Δ#E� = �1 − Z#E�.

Przykład 3.2. (dla 2 = 1, oraz 2 = 2)

ΔE� = E� − E�� = E� − ZE� = �1 − ZE�. Δ�E� = E� − 2E�� + E�� = �1 − 2Z + Z�E� = �1 − Z�E�.

3.3. Stacjonarność procesu stochastycznego

W badaniach szeregów czasowych ważną rolę odgrywa pojęcie stacjonarności [13].

W literaturze funkcjonują dwa pojęcia stacjonarności. Stacjonarność w węższym sensie

definiujemy jako brak zmiany łącznego i warunkowego rozkładu prawdopodobieństwa przy

przesunięciu punktu zerowego na osi czasu, co formalnie zapisujemy jako C��, ��, … , �|(�, (�, … , ( = C��, ��, … , �|(� + <, (� + <, … , ( + < dla < ∈ ℝ.

Oznacza to że łączny rozkład zmiennych losowych E� jest identyczny i niezmienny w

czasie. Takie pojęcie stacjonarności jest mało przydatne w zastosowaniach, gdyż wymaga

użycia zaawansowanego aparatu analizy funkcjonalnej. Dlatego też wprowadzono pojęcia

stacjonarności określone za pomocą parametrów, które łatwo można zmierzyć. Wprowadza

się zatem pojęcie słabej (w szerszym sensie) stacjonarności procesu [9, 13, 14, 18]. Proces

jest więc słabo stacjonarny6 gdy proces ma stałą średnią, wariancję, a funkcja autokowariancji

zależy tylko od <. Matematycznie oznacza to, że

5 W literaturze występuje również jako operator wycofania, przesunięcia wstecz. 6 Dalej mówimy krótko stacjonarny

136

�HE�I = [ = 61��(, M!0�E� = L� = 61��(, 61M�E�,E�� = ��<, dla ( ∈ ℝ, < ≠ 0.

Proces stochastyczny stacjonarny w węższym sensie jest również słabo stacjonarny.

Dla zmiennej losowej o rozkładzie normalnym określenie słabej stacjonarności jest

równoznaczne z pojęciem silnej stacjonarności. Dlatego, aby sprawdzić, czy proces o

rozkładzie normalnym jest ściśle stacjonarny, wystarczy poznać podstawowe parametry jego

rozkładu. Na ogół dokonujemy jedynie weryfikacji stałości parametrów wielowymiarowego

rozkładu zmiennej losowej, a nie testujemy konkretnej postaci tego rozkładu.

Ponieważ dokładne parametry procesu na ogół nie są znane więc opisujemy je za

pomocą estymatorów. I tak w próbie �- elementowej estymatorem średniej [ jest

�� = 1��

��.

Zaś wariancji L� jest

�� = 1��(�� − ��)�

��.

3.4. Biały szum

W badaniach procesów stochastycznych posługujemy się pojęciem białego szumu [5, 14, 18,

39]. Białym szumem7 nazywamy proces stochastyczny �� spełniający 3 warunki:

1. �H��I = 0, 2. M!0�� = L� = 61��(, 3. 61M��, �" = 0, dla � > (.

W przypadku gdy ��~\(0,L�) mówimy, że proces białego szumu jest gaussowski.

Proces białego szumu oczywiście jest stacjonarny.

7 ang. white noise.

137

Rys. 0.3. Przykład procesu białego szumu Źródło: opracowanie własne

Zbadajmy w programie Statistica autokorelację przedstawionego na wykresie szeregu.

Wykorzystamy do tego polecenie Statystyka → Zaawansowane modele liniowe i nieliniowe

→ Szeregi czasowe i prognozowanie. Po wyborze zmiennej korzystamy z opcji OK

(Przekształcenia, autokorelacje, korelacje wzajemne, wykresy). Wybierając w zakładce

Autokorelacje przycisk Autokorelacje otrzymujemy następujący wykres.

Rys. 0.4. Wykres funkcji autokorelacji Źródło: opracowanie własne

138

Funkcja autokorelacji pokazuje nam występowanie autokorelacji pomiędzy

wartościami szeregu w chwili ( i w chwili ( − �. Dla białego szumu autokorelacja nie

powinna występować tzn. powinna wynosić 0. W programie Statistica oznacza to, że wykres

tej funkcji znajduje się w pewnym zbiorze krytycznym, stanowiącym przedział ufności.

Do badania własności szeregów czasowych możemy wybrać program Gretl.

Rys. 0.5 Funkcja korelogram w Gretlu Źródło: opracowanie własne

Otrzymujemy zarówno wykres funkcji autokorelacji (ACF) jak i korelacji cząstkowej

(PACF) oraz tabelę testów autokorelacji Ljunga-Boxa.

Rys. 0.6. Wykres i test funkcji ACF i PACF Źródło: opracowanie własne


139

Mając proces białego szumu możemy określić proces błądzenia losowego8 . Niech E� będzie pewną ustaloną wartością początkową, Określamy dla dowolnego ( > 0 proces E� = E�� + ��, gdzie �� jest procesem białego szumu. Oczywiście powyższy wzór rekurencyjny możemy

przekształcić na

E� = E� +��

��.

Oznacza to, że dla tego procesu zachodzą:

�HE�I = � ]E� +��

��^ = �HE�I = E�,

M!0�E� = M!0 W��

��X = (L�,

61M�E�,E�" = (L�. Jak widzimy, zarówno wariancja jak i kowariancja zależą od czasu, zatem proces

błądzenia losowego jest procesem niestacjonarnym.

Rys. 0.7. Przykład błądzenia losowego Źródło: opracowanie własne

8 ang. random walk

140

Do badania stacjonarności szeregów czasowych służą różnego rodzaju testy

pierwiastka jednostkowego. Najpopularniejszymi testami są test Dickeya-Fullera (DF),

rozszerzony test Dickeya-Fullera (ADF9), test Phillipsa-Perrona (PP) czy też test

Kwiatkowskiego–Phillipsa–Schmidta–Shina (KPSS).

3.5. Proces średniej ruchomej

Analizując proces błądzenia losowego, możemy przypuszczać, że wiele procesów

obserwowanych w przyrodzie ma znamiona losowości (przypadku). Mało tego, możemy

zaobserwować wpływ tych działań przypadkowych na następne wartości. Możemy zatem

zastanawiać się jak głęboki jest ten wpływ, tzn. na ile okresów naprzód działa. Procesem

opisującym to jest proces średniej ruchomej10. Niech ��∈$ będzie procesem białego szumu.

Proces średniej ruchomej zapisujemy w postaci [5, 9, 13, 14, 18, 39]:

E� = 8� + �� +�8 �� ,!

��

lub w postaci operatorowej E� = 8� + _�Z��, gdzie _�Z = 1 + 8�Z +⋯+ 8!Z! jest wielomianem operatorowym stopnia �, zaż �� jest

białym szumem o wariancji L�. Proces średniej ruchomej (MA(q)) ma następujące własności:

1. �HE�I = 8�, 2. M!0�E� = :1 + 8�� +⋯+ 8!�;L�, 3. 61M�E�,E�� = ` 0, > > �,:8� + 8��8� +⋯+ 8!8!��;L�, > ≤ �, 4. �� = ` 0, > > �,L�∑ 8� 8 !��

�� 0 ≤ > ≤ �, Na tej podstawie możemy powiedzieć, że każdy proces średniej ruchomej jest

procesem stacjonarnym.

Rozważmy proces średniej ruchomej zobrazowany na poniższym rysunku.

9 ang. agumented Dickey-Fuller test. 10 ang. moving average proces.

141

Rys. 0.8. Proces Ma(1) Źródło: opracowanie własne

Przyjrzyjmy się jego funkcji ACF i PACF.

Rys. 0.9 Funkcje ACF i PACF procesu AR(1) Źródło: opracowanie własne

Możemy tutaj zauważyć następującą zależność – funkcja PACF jest geometrycznie

gasnąca, natomiast funkcja ACF ma jedną wartość statystycznie niezerową. Ilość tych

niezerowych wartości oznacza wartość rzędu � procesu MA.

142

3.6. Proces autoregresyjny

Model procesu autoregresyjnego rzędu 2 opisuje fakt zależności wartości szeregu w chwili ( od wszystkich 2 wcześniejszych wartości. Model taki oznaczamy symbolem /�(2), a

zależność zapisujemy wzorem [5, 9, 13, 14, 18, 39] E� = �� + ∑ � E�� + ��,# �� g

gdzie 2 – rząd autoregresji, lub też opóźnienie zmiennej objaśniającej, ��,��, … ,�# – parametry modelu autoregresji, �� – biały szum.

Model ten często zapisujemy przy użyciu operatora opóźnienia Z jako

Φ�ZE� = �� + ��, gdzie

Φ�Z = 1 − ��Z − ��Z� −⋯− �#Z# jest wielomianem operatorowym stopnia 2.

Proces autoregresyjny jest stacjonarny gdy pierwiastki 2 wielomianu Φ(Z) leżą poza

okręgiem jednostkowym tzn. |2 | > 1.

Warto zwrócić uwagę na fakt, że funkcje ACF dla procesu autoregresyjnego wygasa

tzn. jej wartości zmniejszają się a od pewnego miejsca leżą w przedziale ufności. Natomiast

liczba niezerowych wartości funkcji PACF przybliża rząd 2modelu.

Zauważmy to na przykładzie procesu E� = 1,3E�� − 0,4E�� + ��. Zapiszemy proces

ten w postaci E��1 − 1,3Z + 0,4Z� = ��. Otrzymaliśmy wielomian charakterystyczny

postaci 1 − 1,3Z + 0,4Z�, który ma dwa pierwiastki 1,25 i 2. Ich moduły są większe od

jedności zatem badany proces jest stacjonarny. Czasami wielomian charakterystyczny

zapisujemy w postaci iloczynowej np. 1 − 1,3Z + 0,4Z� = (1− 0,53)(1− 0,83). Wówczas dla stwierdzenia stacjonarności badamy moduł współczynnika przy 3. U nas

wynoszą odpowiednio 0,5 oraz 0,8 są tym razem mniejsze od 1 co zapewnia stacjonarność.

143

Przykład 3.3.

Dany jest proces którego początkowa realizacja dana jest w tabeli 3.1.

Tabela 0.1. Początkowe wartości szeregu

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0,81 0,68 0,55 0,01 0,92 0,30 0,41 0,55 0,03 0,32 0,65 0,29 0,47 0,10 0,66 0,10 0,40 0,41 0,29 0,47 0,18 0,82

-

0,16 0,63


Rys. 0.10. Wykres szeregu AR(1) Źródło: opracowanie własne

Rys. 0.11. Wykres funkcji ACF i PACF Źródło: opracowanie własne

144

Rys. 0.12 Wartości testu Ljunga-Boxa Źródło: opracowanie własne

Identyfikację modelu autoregresyjnego przeprowadzamy ustalając jego rząd w oparciu

o funkcje ACF i PACF. Na rysunku 3.11 współczynnik autokorelacji cząstkowej rzędu 1

przekracza znacząco wartość krytyczną a więc jest statystycznie istotny, natomiast pozostałe,

wyższych rzędów nie wychodzą poza obszar, tym samym są statystycznie nieistotne. Zatem

nasz model jest postaci E� = �� + ��E�� + ��. Parametry tego modelu szacujemy klasyczną metodą najmniejszych kwadratów

(MNK) 11wybierając rząd opóźnienia 1.

Rys. 0.13. Ekran dostępu do modelu MNK Źródło: opracowanie własne

11 Patrz str. 31

145

Rys. 0.14. Wybór zmiennych modelu MNK Źródło: opracowanie własne

Rys. 0.15. Ocena parametrów modelu Źródło: opracowanie własne

Wynika stąd, że model jest postaci E� = 0,503682 − 0,328687E�� + ��. Otrzymujemy stąd równanie charakterystyczne wielomianu w postaci iloczynowej 1 +

0,328687Z = 0. Współczynnik przy Z jest mniejszy od jedności zatem szereg jest

stacjonarny.

Rozważmy proces AR(p) dla chwil (, ( − 1. E� = �� +�� E�� + ��,#

��

146

E�� = �� +�� E(��)� + ��.#

��

Wstawiając drugie równanie do pierwszego mamy E� = 8� + 8�� + a�E�� +⋯+ a#�E%��&�#

Wyznaczając kolejno E��, E��, … i wstawiając do równania powyższego

otrzymamy docelowo, że E� = 8� + 8�� + 8�� +⋯. Czyli otrzymaliśmy nieskończony szereg (średnia ważona) białego szumu.

Możemy zatem opisać momenty procesu autoregresyjnego na podstawie powyższej

zależności i wzorów dla procesów MA.

1. �HE�I = '��∑ '��

��

,

2. M!0�E� = �1 + ∑ 8 �� L� Należy zwrócić uwagę na fakt, że uzyskanie w wyniku zastosowania modelu AR i MA

składnika losowego, jako różnicy pomiędzy modelem a wartościami rzeczywistymi,

identycznego z procesem białego szumu jest potwierdzeniem, że analiza szeregu czasowego

jednej zmiennej została zakończona. Oznacza to, że nie możemy wydzielić żadnych innych

ważnych składowych procesu (zarówno stacjonarnych, jak i niestacjonarnych), natomiast to,

co pozostało ma charakter czysto losowy.

Równania Yule-Walkera [14] pozwalają w sposób rekurencyjny wyznaczyć wartość

funkcji autokorelacji dla procesu autoregresyjnego AR(p) i są określane zależnością:

V� =�� V�� #

��.

3.7. Proces ARMA

Jeżeli weźmiemy pod uwagę fakt że na wartość procesu mają wpływ zarówno nasze działania

jak i bodźce czysto przypadkowe możemy połączyć oba procesy AR i MA w jeden ARMA

[5, 7, 9, 14, 18, 39]. Jego postać będzie następująca: E� = �� + ��E�� + ��E�� +⋯+ �#E��# + �� + 8�� +⋯+ 8!��!, gdzie �� jest procesem białego szumu.

147

Wykorzystując zdefiniowane operatory wycofania mamy

Φ�ZE� = !� + _�Z��. Model ARMA generuje proces stacjonarny gdy jego składowymi są model stacjonarny

AR oraz model odwracalny MA. Oznacza to że należy zbadać moduły pierwiastków

odpowiednich wielomianów charakterystycznych(wszystkie mają być poza okręgiem

jednostkowym).

Dla procesu ARMA(p,q) funkcja autokowariancji jest zadana zależnością

rekurencyjną:

�� −�� #

��= L��8��",0 ≤ > ≤ �,!

��

�� −�� #

��= 0,> ≥ � + 1,

gdzie �� określają zależności

bccdcce 1, = = 0,�� −�! �� = 8� ,�

��1 ≤ = ≤ 2,

�� −�! �� = 8� ,#

��K<!= > 2, 203�63��8� = 0K<!= > �,

! oraz 8 są współczynnikami modelu ARMA(p,q), natomiast L� jest wariancją procesu ��.

3.8. Stopień zintegrowania modelu

W rzeczywistości mamy rzadko do czynienia z procesami stacjonarnymi. Najczęściej jeden z

trzech warunków stacjonarności jest niespełniony i wówczas powinniśmy szukać sposobu jej

usunięcia. Zwykle spotykamy się z niestacjonarnością ze względu na średnią gdy mamy jakiś

szczególny trend lub ze względu na wariancję, gdy mamy dużą zmienność szeregu. W takich

przypadkach należy wykorzystać metody usunięcia trendu lub sezonowości. Proces który

można sprowadzić do stacjonarnego po K krotnym różnicowaniu nazywamy procesem

zintegrowanym stopnia K [5, 13, 14, 18]. Proces zintegrowany stopnia K, który jest typu

AR(p) oznaczamy ARI(p,d), analogicznie MA(q) oznaczamy IMA(d,q), oraz ARMA(p,q)

oznaczamy ARIMA(p,d,q).

148

Niezależnie od wyboru sposobu badania stacjonarności schemat wnioskowania jest

następujący. Rozpoczynamy od analizy szeregu E�. W przypadku przyjęcia hipotezy o

stacjonarności, mówimy, że szereg jest zintegrowany w stopniu zerowym co zapisujemy E�~f(0). Jeżeli jednak przyjmiemy hipotezę o jego niestacjonarności to stosujemy filtr

różnicowy i badamy stacjonarność szeregu E�∗ = ΔE�. Jeżeli taki szereg jest stacjonarny to

mówimy, że szereg E� jest zintegrowany w stopniu pierwszym co zapisujemy E�~f(1). W

przeciwnym wypadku znów stosujemy filtr różnicowy. Procedurę kontynuujemy aż do

znalezienia szeregu stacjonarnego. Jeżeli dla > = 1,2, … ,K − 1 szereg Δ�E� jest

niestacjonarny, natomiast szereg Δ)E� jest stacjonarny to mówimy, że szereg E� jest

zintegrowany w stopniu d co zapisujemy E�~f(K). Liczba różnicowań jest równa liczbie pierwiastków jednostkowych wielomianu

charakterystycznego modelu autoregresji [5, 14, 18]. Jednakże rzadko zdarza się aby

zachodziła potrzeba większej ilości różnicowań niż 2. Dlatego po każdym różnicowaniu

powinniśmy badać czy powstały szereg jest stacjonarny ze względu na wartość średnią.

Większość szeregów makroekonomicznych przedstawiających strumienie lub zasoby

powiązanych z liczbą ludności, takich jak produkcja lub zatrudnienie jest stopnia I(1). Szeregi

I(2) wzrastają według stale rosnącej stopy. Są to w większości przypadków szeregi powiązane

z poziomem cen. Szeregi I(3) lub wyższe występują niezmiernie rzadko. Są to na przykład

zasoby pieniądza, poziomy cen przy hiperinflacji itp. Wyróżniamy dwa skrajne przypadki

niestacjonarności: trend deterministyczny, gdy wartość oczekiwana nie jest stała, i trend

stochastyczny, gdy wariancja nie jest stała.

Rozważmy proces błądzenia losowego z dryftem postaci: E� = � + ��, E� = E�� +� + ��. Wówczas

�HE�I = � ]�(� + ��)�

��^ = �( ≠ 61��(.

Obserwujemy tu trend w wartości oczekiwanej czyli tzw. trend deterministyczny.

Rozważmy operator różnicowania Δ. Niech

Z� = ΔE� = E� − E�� = ��. Dla procesu g� mamy �Hg�I = �HΔY�I = �H��I = 61��(. Zatem proces g� jest stacjonarny.

149

Proces ARIMA(p,d,q) zapisujemy w postaci równania

Φ�ZΔ)E� = !� + _�Z�� lub

Φ�Z(1 − B))E� = !� + _�Z��.

3.9. Procedura Boxa – Jenkinsa

Procedurą Boxa – Jenkinsa nazywamy metodę wstępnego wyznaczania parametrów 2,K, �

modelu ARIMA, adekwatnego dla danego szeregu czasowego [5, 9, 18]. Procedura ta

zwyczajowo dzielona jest na trzy etapy:

1. Identyfikacja,

2. estymacja,

3. diagnozowanie.

1. Identyfikacja wymaga wstępnej identyfikacji trzech parametrów określających rząd

procesu autoregresyjnego, rząd integracji oraz rząd średniej ruchomej. Zaczynamy od

badania wykresu, z którego wnosimy o jego niestacjonarności względem średniej lub

wariancji, skupiskach, lokalnej podwyższonej zmienności itp. Istotnym rolę odgrywa

analiza funkcji autokorelacji i autokorelacji cząstkowej (ACF i PACF). Wyróżniamy

następujące sytuacje wstępnej identyfikacji parametrów 2,K, �.

a) ACF nie wygasa, zatem mamy niestacjonarność. Należy zróżnicować szereg

wyjściowy jedno lub dwukrotnie,

b) ACF wykładniczo gaśnie, PACF jest ucięta od pewnego argumentu p. Daje to

proces AR(p).

c) ACF jest ucięta, a PACF szybko gaśnie. Oznacza to proces MA(q).

d) Jeśli ani ACF ani PACF nie maja punktu ucięcia, to proces jest mieszany

ARIMA(p,q).

2. Po tak wstępnym wyestymowaniu parametrów p i q badamy modele o wartościach nieco

większych dla wyestymowanych parametrów. Liczymy więc kolejno modele

powiększając za każdym razem tylko jeden parametr o jedna jednostkę. Badamy

statystycznie normalność reszt. Jeśli okaże się, że mimo to otrzymujemy nieakceptowalny

ze względu na normalność reszt model, oznacza to, że metoda ARIMA jest niewłaściwą

metodą estymacji dla danego szeregu. Do dalszej estymacji parametrów stosuje się

metodę największej wiarygodności (MNW).

150

3. Po oszacowaniu modelu sprawdzamy wykresy reszt i przeprowadzamy test Jarque-Bera`y

na normalność reszt. Często stosowanym testem na autokorelacje reszt oszacowanego

modelu jest test Q Ljunga- Boxa. Powszechnie stosowanym kryterium porównania modeli

o różnych zestawach parametrów są kryterium informacyjne Akaike lub kryterium

informacyjne Schwartza-Bayesa Za liczbę h oznaczającą liczbę szacowanych parametrów

należ podstawić 2 + �. Za model lepiej dopasowany uznajemy natomiast ten o najniższej

wartości kryterium informacyjnego.

Korzystanie z kryteriów informacyjnych w praktyce oznacza, że powinniśmy

estymować wszystkie możliwe modele ARMA dla których rząd opóźnień składowej AR jest

mniejszy lub równy ustalonemu p, a rząd składowej MA mniejszy lub równy ustalonemu q, a

następnie wybrać ten dla którego wartość kryterium informacyjnego jest najmniejsza.

Rozważmy szereg wartości cen miedzi, którego początkowa realizacja jest dana w

tabeli 3.2.

Tabela 0.2. Początkowe wartości cen miedzi

2007-04-16 2007-04-17 2007-04-18 2007-04-19 2007-04-20 2007-04-23 2007-04-24 2007-04-26 7690,00 8015,00 7874,00 7797,00 7887,00 7955,00 7828,00 7662,00

Źródło: wyborcza.biz.pl

Obliczenia wykonujemy w programie Gretl. Na początek wykonujemy wykres

obserwacji przedstawiony na rysunku 3.16.

Rys. 0.16. Wykres obserwacji Źródło: opracowanie własne

2000

3000

4000

5000

6000

7000

8000

9000

10000

11000

0 200 400 600 800 1000 1200 1400

Kurs

151

Z wykresu możemy wstępnie wnioskować o istnieniu niestacjonarności szeregu

względem średniej i wariancji. W celu usunięcia niestacjonarności względem wariancji

rozważamy szereg zlogarytmowany, natomiast dla usunięcia niestacjonarności względem

średniej rozważmy jego pierwsze różnice.

Zatem będziemy identyfikować model ARIMA o stopniu integracji 1. Na podstawie

korelogramu wartości zlogarytmowanych i pierwszych ich różnic szacujemy że � 1, � 2.

Rys. 0.17. Wykresy ACF i PACF Źródło: opracowanie własne

Analizujemy model ARIMA(1,1,2).

Rys. 0.18. Specyfikacja modelu ARIMA(1,1,2) Źródło: opracowanie własne

152

Okazuje się że najlepszym, który ma istotne statystycznie współczynniki jak również

najniższe kryterium Akaike’a jest model ARIMA(1,1,2).

Rys. 0.19. Specyfikacja modelu ARIMA(1,1,1) Źródło: opracowanie własne

Dopasowanie modelu obrazuje poniższy rysunek. Następnym etapem jest zbadanie

normalności reszt

Rys. 0.20. Porównanie szeregów Źródło: opracowanie własne

7,8

8

8,2

8,4

8,6

8,8

9

9,2

9,4

0 200 400 600 800 1000 1200 1400

l_Kurs

Empiryczne i wyrównane warto¶ci zmiennej: l_Kurs

wyrównane

empiryczne

153

3.10. Model SARIMA

Wygodnie jest przy szeregach z sezonowością rozpatrywać podszeregi zbudowane z danych

z tego samego sezonu (np. przy sezonowości kwartalnej z tego samego kwartału) . Model

ARMA dla tych danych będzie postaci:

Φ*�Z"E� = !� + _+�Z"��. gdzie

Φ*�Z" = 1 − ��Z" − ��Z�" −⋯− �,Z,", _+�Z" = 1 + 8�Z" +⋯+ 8+Z+". Operatory Φ*�Z" oraz _+�Z" są odpowiednio sezonowymi operatorami dla

autoregresji i średniej ruchomej rzędu P, Q o okresie sezonowym s. Model taki oznaczamy

symbolem SARMA(P,Q)s [5, 13, 18]

Rozważmy model SARMA(1,1)12 o okresie sezonowości 12. Wówczas

Φ��Z�� = 1 − ��Z��, _��Z�� = 1 + 8�Z��. Zatem model zapiszemy w postaci �1 − ��Z��E� = !� + �1 + 8�Z��,

skąd E� = ��E�� + �� + 8�� + ��. Okazuje się, ze szeregi sezonowe mogą również posiadać trend, który jak już wiemy

usuwamy poprzez kolejne różnicowanie. Model taki nazywamy SARIMA(P,D,Q)s i

zapisujemy w postaci

Φ*�Z"Δ"-E� = !� + _+�Z"�� lub

Φ*�Z"�1 − Z"-E� = !� + _+�Z"��. Łącząc model sezonowy ze standardowym otrzymamy model

SARIMA(p,d,q)x(P,D,Q)s postaci:

Φ�ZΦ*�Z"Δ)Δ"-E� = !� + _�Z_+�Z"�� Jako przykład rozważmy model SARIMA(0,1,1)x(0,1,1)12 tzn. Φ�Z = 1, Φ*�Z" =

Φ��Z�� = 1, Δ) = Δ = (1 − Z), Δ"- = Δ�� = (1 − Z��), _�Z = 1 + 8�Z, _+�Z" =_��Z�� = 1 + 8�Z��. Zatem �1 − Z�1 − Z��E� = �1 + 8�Z�1 + 8�Z�� skąd

154

�1 − Z − Z�� + Z��E� = �1 + 8�Z+8�Z��+8�8�Z��, lub w prostszej postaci E� = E�� + E�� − E�� + �� + 8��+8��+8�8��.

Modele SARIMA często traktuje się jako szczególne przypadki procesów ARIMA.

Rozpisując równanie operatorowe dla procesu SARIMA (p,d,q)x(P,D,Q)s otrzymamy proces

ARIMA(p+Ps+d+sD, q+sQ). Jednakże ich wykorzystanie ma sens w prostocie zapisu i

interpretacji. Poniższa tabela przedstawia klasyfikację podstawowych modeli szeregów

czasowych

Tabela 0.3. Klasyfikacja podstawowych modeli procesów stochastycznych

Charakterystyki procesu Wariancja procesu stacjonarna Niestacjonarna-procesy zintegrowane niecykliczna cykliczna

Średnia procesu

stacjonarna ARMA(p,q) ARIMA(p,d,q) ARIMA(P,D,Q)

niestacjonarna niecykliczna f(t) ARIMA(p,d,q)+f(t) ARIMA(P,D,Q)+f(t) cykliczna g(t) ARIMA(p,d,q)+g(t) ARIMA(P,D,Q)+g(t)

f(t) – trend deterministyczny, g(t) – wahania okresowe deterministyczne Źródło: [9]

3.11. Prognozy w modelach ARIMA

Ogólną postać modelu ARIMA zapisujemy w postaci operatorowej jak wiemy następująco:

Φ�Z(1 − B))E� = !� + _�Z��. Rozważmy trzy postacie jawne tego modelu [5]:

1. Wartość E� procesu zapisujemy poprzez poprzednie jego wartości oraz bieżącą i

poprzednie wartości ��. E� = �� + ��E�� + ��E�� +⋯+ �#)E��#�) + �� + 8�� +⋯+ 8!��!

To równanie jest bardzo wygodne do wyznaczania prognoz.

2. Wartość E�� zapisujemy tylko przy pomocy bieżących i poprzednich impulsów �� jako nieskończona suma

E�� = � _��

��=�_��

��= Θ�Z��,

gdzie _� = 1. Wagi _ wyznaczamy z zależności:

155

Φ�Z�1 − B)Θ(Z) = _�Z. Dla dodatnich < > K model ten przedstawiamy w postaci uciętej E�� = i�� + �� + _�� +⋯+ _��, gdzie

i�� = � _��

��=�_�� .�

��

3. Poprzez nieskończoną sumę ważoną poprzednich wartości szeregu E�� i bieżącego

impulsu �� E�� =�2�E��

��+ ��.

Jeżeli K ≥ 1, to wyrażenie

�2�E��

��

jest średnią ważoną. Wagi 2� wyznaczamy z zależności

Φ�Z�1 − B) = �1 − 2�Z − 2�Z� −⋯ _�Z poprzez porównanie współczynników przy tych samych potęgach.

Jeżeli mamy wykonany odpowiedni model, to możemy go wykorzystać do

wyznaczenia prognoz. Rozważmy proces ARIMA(p,d,q) postaci E� = �� + ��E�� + ��E�� +⋯+ �#E��# + �� + 8�� +⋯+ 8!��!, Prognozą realizacji procesu stochastycznego zrobioną w okresie ( z wyprzedzeniem <

jest wartość oczekiwana �[E��] postaci E��∗ = �NE��O = �[�� + ��E�� + ��E�� +⋯+ �#E��# + �� + 8�� +⋯+ 8!��! .

Przez wartość oczekiwaną �NE��O rozumiemy tu warunkową wartość oczekiwaną E�� przy znajomości wszystkich wartości E do momentu (, czyli �NE��|E�,E��, … O. Funkcję E�∗(<) = E��∗ jako funkcję zmiennej < przy ustalonym ( nazywamy funkcją prognozy w

momencie (. Błąd prognozy dla wyprzedzenia <wynosi ��< = �� + _�� +⋯+ _��.

156

Wariancja błędu prognozy M!0:��<; = �1 + _�� + _�� +⋯+ _�� L�. Błąd prognozy na jeden krok naprzód jest równy ��1 = E�� − E��∗ = ��. Poprawianie prognoz. Spróbujmy znaleźć przedziały prawdopodobieństw dla prognoz

z wyprzedzeniem 1,2, … , j i obliczmy nowe prognozy poprzez poprawę starych. Korzystając

z punktu 2) z równania operatorowego wyznaczamy wartości wag _�,_�, …_.. Są one

postaci: _� = Y�∗ − 8�,_� = Y�∗_� + Y�∗ − 8�,⋮_� = Y�∗_�� +⋯+ Y#)∗ _��#�) − 8� .

gdzie _� = 1, _� = 0, dla = < 0 i 8� = 0 dla = > � oraz _∗ są współczynnikami równania

operatorowego postaci _∗�Z = _�Z�1 − Z) = _�ZΔ) . Jeżeli h = �!"F2 + K − 1, �G, to dla = > h wagi _ spełniają równanie _� = Y�∗_�� +⋯+ Y#)∗ _��#�) .

Zauważmy, że w momencie ( prognoza z wyprzedzeniem < + 1 będzie postaci: E�(��)∗ = _�� + _�� +⋯, Natomiast w momencie ( + 1 prognoza z wyprzedzeniem < będzie postaci: E%��&�∗ = _�� + _�� +⋯,

skąd E%��&�∗ = E�(��)∗ + _��. Zatem prognozę w chwili ( na moment < + 1 poprawiamy poprzez dodanie �� =��1, który jest błędem prognozy na jeden krok naprzód wzmocnionego przez czynnik _�.

Znając wagi _ możemy podać przedział ufności dla prognozy w postaci

kE�� − 5/��1 +�_��

��;E�� + 5/��1 +�_��

��l,

gdzie 5

�

jest kwantylem rzędu 1 − �/2 standardowego rozkładu normalnego, natomiast �� jest estymatorem wariancji L�.

157

Rozważmy poprzedni przykład ceny miedzi w programie Statistica. Dane to ceny

miedzi za okres od16.04.2007 do 31.12.2012. Po otwarciu pliku z danymi przechodzimy do

modułu Analiza szeregów czasowych i wybieramy opcję Arima i funkcja autokorelacji. Tak

jak w Gretlu analizę zaczynamy od przeglądu funkcji ACF i PACF. Analizując wykres

szeregu dochodzimy do wniosku że mamy brak stacjonarności wariancji i średniej. Zatem

logarytmujemy szereg i różnicujemy go za pomocą przycisku Inne przekształcenia i wykresy,

zatwierdzając OK(przekształć wybrany szereg).

Otrzymujemy potwierdzenie że 2 ≈ 1, � ≈ 2. Przechodzimy do zakładki Więcej i

zaznaczamy opcje jak niżej. W szczególności zaznaczamy STAŁĄ, rząd autoregresji p 1, rząd

średniej ruchomej q 2 i różnice pierwszego opóźnienia 1. Oczywiście należy zaznaczyć

przekształć zmienną przed analizą funkcją logarytm naturalny.

Rys. 0.21. Modyfikacja szeregu Źródło: opracowanie własne

Rys. 0.22. Wykresy ACF i PACF dla szeregu log ceny miedzi Źródło: opracowanie własne

158

Rys. 0.23. Wybór postaci modelu ARIMA Źródło: opracowanie własne

Otrzymujemy parametry modelu wraz z oceną ich błędów i istotnością.

Rys. 0.24. Ocena parametrów modelu Źródło: opracowanie własne

W ten sposób możemy zbadać kilka modeli i dobrać te które mają istotne parametry.

Następnym krokiem jest badanie reszt. W tym celu przechodzimy do zakładki Rozkład reszt.

Możemy dla niego zbadać wykres normalności

159

Rys. 0.25. Wykres normalności Źródło: opracowanie własne

Wykresy funkcji ACF i PACF dla reszt modelu

Rys. 0.26. ACF i PACF reszt modelu Źródło: opracowanie własne

160

Ponieważ nie ma istotnych korelacji reszt można po zbadaniu testami normalności

reszt przejść do prognozowania w zakładce Więcej. Ustalamy tu na podstawie jak długiego

szeregu prognozujemy i z jakim wyprzedzeniem.

Szeregi czasowe są ciągiem obserwacji rozmieszczonych w czasie. Przykładami takich

ciągów są roczne dane o zyskach firm, kwartalne dane o Produkcie Krajowym Brutto (PKB),

miesięczne informacje o stopie bezrobocia, tygodniowe sprawozdania o wielkości sprzedaży

w firmie, dzienne dane o obrotach na giełdzie. Są to tzw. dane dyskretne. Ale jeśli

popatrzymy na wyceny akcji, czy zapis EKG (elektrokardiogram), lub zapis drgań ziemi

możemy mówić niemal o zapisie ciągłym. Istnieje wiele powodów do zapisywania i

analizowania danych czasowych. Są to np. próba analizowania własności szeregu, próba

szukania analogi w zachowaniu się szeregu, ale też chęć lepszego zrozumienia mechanizmów

generowania szeregu a tym samym możliwość przewidywania przyszłości. Wraz z rozwojem

nowoczesnych wysoko wydajnych komputerów stało się możliwe wykonywanie obliczeń na

dużych macierzach. Dzięki temu możliwe stało się, zaawansowane oparte na własnościach

procesów stochastycznych, badanie szeregów czasowych. Modele szeregów czasowych są

wykorzystywane coraz częściej do opisu i przewidywania zachowań gospodarki. Nieraz nie

jesteśmy w stanie określić niektórych zależności, pomiędzy zmiennymi, za to chcemy

uchwycić zależność samego szeregu w czasie. W tym celu wykorzystujemy szeregi czasowe.

Obecnie rozwija się zarówno narzędzia badania szeregów autoregresji wraz ze średnią

ruchomą ale również zależności wielowymiarowe w modelach VAR i GARCH. Omawiane w

tym rozdziale zagadnienia mają na celu przedstawienie podstawowych informacji i własności

o procesach autoregresyjnych i procesach średniej ruchomej. Procesy te są wykorzystywane

do opisu zjawisk gospodarczych np. PKB. Są one również wyjściem do przygotowywania

wstępnych prognoz. Analiza rzeczywistych danych przy pomocy metod statystycznych, a

zwłaszcza przy pomocy pakietów statystycznych, nie jest zwykle integralną częścią studiów

matematycznych. Jednakże jest ona na pewno użyteczna w przyszłej pracy zawodowej.

Dlatego też wszystkie rozważania zostały zobrazowane przy pomocy pakietów Gretl i

Statistica.

161

Podsumowanie

W dzisiejszym świecie przepływu dużej ilości informacji przestaje być istotne co było, nawet

co jest, a staje się priorytetem informacja o przyszłości. Każdy z nas chce wiedzieć jaka

będzie pogoda jutro gdy pójdziemy do pracy, czy też na spacer, za tydzień gdy chcemy

odwiedzić znajomych, czy za kilka miesięcy gdy będziemy na wakacjach. Służby reagowania

kryzysowego chcą wiedzieć czy grozi nam powódź lub inne zdarzenie. Przedsiębiorcy chcą

przewidywać zachowania rynku by dostosować do nich swoją produkcję.

Najpierw dokonywano naiwnych przewidywań w sprawach banalnych, babcia mówiła

„dziś wieje z południa za trzy dni będzie padał deszcz”. Te przewidywania były oparte na

obserwacji natury i często podawane w postaci przysłów.

Wraz z rozwojem nauki zaczęto badać dokładniej różne zjawiska. Na szczególną

uwagę zasłużyły zjawiska ekonomiczne. Wszakże poznanie zarysu przyszłości w biznesie to

czysty zysk. Każdy podejmując decyzje, chce je opierać o realne i rzetelne prognozy. Rządy

państw chcą znać prognozy przychodów z podatków i prognozy wydatków budżetowych, aby

móc racjonalnie gospodarować budżetem i utrzymywać dziurę budżetową na jak najniższym

poziomie. Podobnie postępują samorządy lokalne. Banki prognozują m.in. stopę procentową

oraz kurs walutowy aby zabezpieczać się przed ryzykiem spowodowanym przez te czynniki

makroekonomiczne. Ryzyko jakie mogą powodować te czynniki makroekonomiczne to

ryzyko płynności banku lub niebezpieczeństwo, że przy zbyt drastycznych wzrostach tych

czynników, kredytobiorcy nie będą w stanie wywiązać się ze swoich zobowiązań. Firmy

produkcyjne również prognozują. Starają się one zaprognozować dobrze produkcję na

następne okresy, aby nie zostać z nadwyżką towaru lub jego niedoborem w istotnych

okresach. Firmy eksportujące lub importujące muszą prognozować wartość kursów

walutowych, aby dalej opłacało im się handlować. Wszystkie te podmioty chcą znać

prognozy gospodarcze aby wiedzieć, czy zatrudnić nową siłę roboczą, bo gospodarka będzie

się rozkręcać, czy też ciąć zatrudnienie ze względu na zbliżający się kryzys.

Do prognozowania używanych jest wiele modeli matematycznych, poczynając od

modeli naiwnych poprzez regresje linowe, średnie ruchome i trendy pełzające, aż do

wygładzania wykładniczego. Używanych jest również wiele modeli opartych o wiedzę i

doświadczenie eksperckie. Oczywiście każdy podmiot gospodarczy czy też osoba fizyczna

prognozuje zgodnie ze swoją wiedzą.

162

Wraz z rozwojem narzędzi matematycznych, a szczególne statystyki, a następnie

metod komputerowych stało się możliwe wykorzystanie coraz bardziej zaawansowanego

aparatu matematycznego. Rozpoczęto badania zależności pomiędzy zjawiskami i powstały

modele regresji liniowej jedno i wielowymiarowe.

W niniejszej monografii skupiliśmy się między innymi na dokładnym przedstawieniu

jak zbudować model ekonometryczny, na podstawie którego możemy wyciągać wnioski co

do przyszłości. Jest to ekonometria klasyczna, która została wzbogacona o następne modele.

Modele szeregów czasowych, które z natury są proste i możliwe do wykorzystania przez

każdego przy pomocy arkusza kalkulacyjnego. Następnym etapem są już zaawansowane

modele szeregów czasowych oparte o pojęcia procesów stochastycznych stacjonarnych i

niestacjonarnych. Przedstawione tutaj informację mają na celu pokazanie ewolucji w

badaniach nad prognozowaniem przy jednoczesnym pokazaniu wielu przykładów

zastosowania niekoniecznie trudnych modeli, zwłaszcza jeśli można do tego użyć

funkcjonujących na rynku narzędzi. Wykorzystaliśmy do tego takie narzędzia ja MS Excel,

Gretl, Statisticę.

163

Tablice statystyczne

Aneks A

Wartości krytyczne dla testu t Studenta

spełniające warunek ( ),P t tα ν α> =

α / ν α = 0.5 α = 0.1 α = 0.05 α = 0.01 α = 0.005 α = 0.001 ν =1 1,0000 6,.3138 12,7062 63,6567 127,3213 636,6196 ν =2 0,8165 2,9200 4,3027 9,9248 14,0890 31,5991 ν =3 0,7649 2,3534 3,1824 5,8409 7,4533 12,9240 ν =4 0,7407 2,1318 2,7764 4,6041 5,5976 8,6103 ν =5 0,7267 2,0150 2,5706 4,0321 4,7733 6,8688 ν =6 0,7176 1,9432 2,4469 3,7074 4,3168 5,9588 ν =7 0,7111 1,8946 2,3646 3,4995 4,0293 5,4079 ν =8 0,7064 1,8595 2,3060 3,3554 3,8325 5,0413 ν =9 0,7027 1,8331 2,2622 3,2498 3,6897 4,7809 ν =10 0,6998 1,8125 2,2281 3,1693 3,5814 4,5869

11 0,6974 1,7959 2,2010 3,1058 3,4966 4,4370 12 0,6955 1,7823 2,1788 3,0545 3,4284 4,3178 13 0,6938 1,7709 2,1604 3,0123 3,3725 4,2208 14 0,6924 1,7613 2,1448 2,9768 3,3257 4,1405 15 0,6912 1,7530 2,1314 2,9467 3,2860 4,0728 16 0,6901 1,7459 2,1199 2,9208 3,2520 4,0150 17 0,6892 1,7396 2,1098 2,8982 3,2224 3,9651 18 0,6884 1,7341 2,1009 2,8784 3,1966 3,9216 19 0,6876 1,7291 2,0930 2,8690 3,1737 3,8834 20 0,6870 1,7247 2,0860 2,8453 3,1534 3,8495 22 0,6858 1,7171 2,0739 2,8188 3,1188 3,7921 24 0,6848 1,7109 2,0639 2,7969 3,0905 3,7455 26 0,6840 1,7056 2,0555 2,7787 3,0669 3,7066 28 0,6834 1,7011 2,0484 2,7633 3,0469 3,6739 30 0,6828 1,6973 2,0423 2,7500 3,0298 3,6460 35 0,6816 1,6901 2,0286 2,7280 3,0008 3,5829 40 0,6807 1,6839 2,0211 2,7045 2,9712 3,5510 45 0,6800 1,6780 2,0142 2,6898 2,9522 3,5204 50 0,6794 1,6759 2,0086 2,6778 2,9370 3,4960 60 0,6786 1,6706 2,0003 2,6603 2,9146 3,4602 70 0,6780 1,6669 1,9944 2,6479 2,8997 3,4350 80 0,6776 1,6641 1,9901 2,6387 2,8870 3,4163 90 0,6772 1,6620 1,9867 2,6316 2,8779 3,4019 100 0,6770 1,6602 1,9840 2,6259 2,8707 3,3905 200 0,6757 1,6525 1,9719 2,6006 2,8385 3,3398 500 0,6750 1,6479 1,9647 2,5857 2,8195 3,3101 ∞ 0,6745 1,6449 1,9600 2,5758 2,8070 3,2905

164

Aneks B

Wartości krytyczne dla testu F Fishera-Snedecora spełniające warunek ( )1 2, ,m mP F Fα α> = ,

dla 0.05α = , gdzie 1 1m n k= − , 2 2m n k= −

1m

/ 2m 1m

=1

2 3 4 5 6 7 8 9 10 11 12

2m

=1

161 200 216 225 230 234 237 239 241 242 244 245

2 18,5 19,0 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,4 19,4 19,4 3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,71 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,96 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,53 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,24 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,03 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,86 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,64 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,48 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,37 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,29 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,22 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,04 35 4,12 3,27 2,87 2,64 2,48 2,37 2,28 2,22 2,16 2,12 2,04 1,98 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,95 45 4,05 3,21 2,81 2,58 2,43 2,30 2,23 2,15 2,10 2,04 1,97 1,91 50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,89 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,86 80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,88 1,82 100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,79 125 3,92 3,07 2,68 2,44 2,29 2,17 2,08 2,01 1,96 1,91 1,83 1,77 150 3,90 3,06 2,66 2,46 2,27 2,16 2,07 2,00 1,94 1,89 1,82 1,76 200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,80 1,74 300 3,87 3,03 2,63 2,40 2,24 2,13 2,04 1,97 1,91 1,86 1,78 1,72 500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,77 1,71 1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,76 1,70

∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,69

165

Aneks B (c.d.)

Wartości krytyczne dla testu F Fishera-Snedecora spełniające warunek ( )1 2, ,m mP F Fα α> = ,

dla 0.05α = , gdzie 1 1m n k= − , 2 2m n k= −

1m

/ 2m

16 18 20 24 30 40 50 75 100 200 500 ∞

2m

=1

246 247 248 249 250 251 252 253 253 254 254 254

2 19,4 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5 19,5 19,5 19,5 3 8,69 8,67 8,66 8,64 8,62 8,59 8,58 8,57 8,55 8,54 8,53 8,53 4 5,84 5,82 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63 5 4,60 4,58 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,37 6 3,92 3,90 3,87 3,84 3,81 3,77 3,75 3,72 3,71 3,69 3,68 3,67 7 3,49 3,47 3,44 3,41 3,38 3,34 3,32 3,29 3,28 3,25 3,24 3,23 8 3,20 3,17 3,15 3,12 3,08 3,05 3,03 3,00 2,98 2,96 2,94 2,93 9 2,99 2,96 2,94 2,90 2,86 2,82 2,80 2,77 2,76 2,73 2,72 2,71 10 2,83 2,80 2,77 2,74 2,70 2,67 2,64 2,61 2,59 2,56 2,55 2,54 12 2,60 2,57 2,54 2,50 2,46 2,42 2,40 2,36 2,35 2,32 2,31 2,30 14 2,44 2,41 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13 16 2,33 2,30 2,28 2,24 2,20 2,16 2,13 2,09 2,07 2,04 2,02 2,01 18 2,25 2,22 2,19 2,15 2,11 2,07 2,04 2,00 1,98 1,95 1,93 1,92 20 2,18 2,15 2,12 2,08 2,04 1,99 1,96 1,92 1,90 1,87 1,85 1,84 30 1,99 1,96 1,93 1,89 1,84 1,79 1,76 1,72 1,69 1,66 1,64 1,62 35 1,94 1,91 1,88 1,83 1,79 1,73 1,70 1,66 1,63 1,60 1,57 1,56 40 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51 45 1,87 1,84 1,81 1,76 1,72 1,66 1,63 1,58 1,54 1,52 1,49 1,47 50 1,85 1,81 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44 60 1,81 1,78 1,75 1,70 1,65 1,59 1,56 1,50 1,48 1,44 1,41 1,39 80 1,77 1,73 1,70 1,65 1,60 1,54 1,51 1,45 1,42 1,38 1,35 1,32 100 1,75 1,71 1,68 1,63 1,57 1,51 1,48 1,42 1,39 1,34 1,30 1,28 125 1,72 1,69 1,65 1,60 1,55 1,49 1,45 1,39 1,36 1,31 1,27 1,25 150 1,71 1,67 1,64 1,59 1,54 1,47 1,44 1,37 1,34 1,29 1,25 1,22 200 1,69 1,66 1,62 1,57 1,52 1,45 1,42 1,35 1,32 1,26 1,22 1,19 300 1,68 1,64 1,61 1,55 1,50 1,43 1,39 1,33 1,30 1,23 1,19 1,15 500 1,66 1,62 1,59 1,54 1,48 1,42 1,38 1,31 1,28 1,21 1,16 1,12 1000 1,65 1,61 1,58 1,53 1,47 1,41 1,36 1,30 1,26 1,19 1,13 1,08

∞ 1,64 1,60 1,57 1,52 1,46 1,40 1,35 1,28 1,24 1,17 1,11 1,00

166

Aneks C

Wartości krytyczne dla testu serii

spełniające warunek ( )1 2, ,n nP S Sγ γ≤ = , dla 2 0.025γ α= =

1n/

2n

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

2 3 4 5 2 2 6 2 2 3 3 7 2 2 3 3 3 8 2 3 3 3 4 4 9 2 3 3 4 4 5 5 10 2 3 3 4 5 5 5 6 11 2 3 4 4 5 5 6 6 7 12 2 2 3 4 4 5 6 6 7 7 7 13 2 2 3 4 5 5 6 6 7 7 8 8 14 2 2 3 4 5 5 6 7 7 8 8 9 9 15 2 3 3 4 5 6 6 7 7 8 8 9 9 10 16 2 3 4 4 5 6 6 7 8 8 9 9 10 10 11 17 2 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 18 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 19 2 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 20 2 3 4 5 6 6 7 8 9 9 10 10 12 12 13 13 13 13 14

167

Aneks D

Wartości krytyczne dla testu serii

spełniające warunek ( )1 2, ,n nP S Sγ γ≤ = , dla 1 2 0.975γ α= − =

1n

/

2n

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

2 4 3 5 6 4 5 7 8 5 5 7 8 9 6 5 7 8 9 10 7 5 7 9 10 11 12 8 5 7 9 10 11 12 13 9 5 7 9 11 12 13 13 14 10 5 7 9 11 12 13 14 15 15 11 5 7 9 11 12 13 14 15 16 16 12 5 7 9 11 12 13 15 15 16 17 18 13 5 7 9 11 13 14 15 16 17 18 18 19 14 5 7 9 11 13 14 15 16 17 18 19 19 20 15 5 7 9 11 13 14 15 17 17 18 19 20 21 21 16 5 7 9 11 13 15 16 17 18 19 20 20 21 22 22 17 5 7 9 11 13 15 16 17 18 19 20 21 22 22 23 24 18 5 7 9 11 13 15 16 17 18 19 20 21 22 23 24 24 25 19 5 7 9 11 13 15 16 17 19 20 21 22 22 23 24 25 25 26 20 5 7 9 11 13 15 16 17 19 20 21 22 23 24 24 25 26 26 27

168

Aneks E

Wartości krytyczne dla testu Durbina–Watsona dla 0.05α =

n k=1 k=2 k=3 k=4 k=5 Ld Ud Ld Ud Ld Ud Ld Ud Ld Ud

6 0.61 1.40 7 0.70 1.36 0.47 1.90 8 0.73 1.33 0.56 1.78 9 0.82 1.32 0.63 1.70 10 0.88 1.32 0.70 1.64 11 0.93 1.32 0.76 1.60 12 0.97 1.33 0.81 1.58 13 1.01 1.34 0.86 1.56 14 1.05 1.35 0.91 1.55 15 1.08 1.36 0.95 1.54 0.82 1.75 0.69 1.97 0.56 2.21 16 1.10 1.37 0.98 1.54 0.86 1.73 0.74 1.93 0.62 2.15 17 1.13 1.38 1.02 1,54 0.90 1,71 0/78 1.90 0.67 2.10 18 1.16 1.39 1.05 1.53 0.93 1.69 0.82 1.87 0.71 2.06 19 1.18 1.40 1.08 1.53 0.97 1.68 0.86 1.85 0.75 2.02 20 1.20 1.41 1.10 1.54 1.00 1.68 0.90 1.83 0.79 1.99 21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96 22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 24 1.27 1.45 1.19 1.55 1.10 1.66 1.01 1.78 0.93 1.90 25 1.29 1.45 1.21 1.55 1.12 1.66 1.04 1.77 0.95 1.89 26 1.30 1.46 1.22 1.55 1.14 1.65 1.06 1.76 0.98 1.88 27 1.32 1.47 1.24 1.56 1.16 1.65 1.08 1.76 1.01 1.86 28 1.33 1.48 1.26 1.56 1.18 1.65 1.10 1.75 1.03 1.85 29 1.34 1.48 1.27 1.56 1.20 1.65 1.12 1,74 1.05 1.84 30 1.35 1.49 1.28 1.57 1.21 1.65 1.14 1.74 1.07 1.83 31 1.36 1.50 1.30 1.57 1.23 1.64 1.16 1.74 1.09 1.83 32 1.37 1.50 1.31 1.57 1.24 1.65 1.18 1.73 1.11 1.82 33 1.38 1.51 1.32 1.58 1.26 1.65 1.19 1.73 1.13 1.81 34 1.39 1.51 1.33 1.58 1.27 1.65 1.21 1.73 1.15 1.81 35 1.40 1.52 1.34 1.58 1.28 1.65 1.22 1.73 1.16 1.80 36 1.41 1.52 1.35 1.59 1.29 1.65 1.24 1.73 1.18 1.80 37 1.42 1.53 1.36 1.59 1.31 1.66 1.25 1.72 1.19 1.80 38 1.43 1.54 1.37 1.59 1.32 1.66 1.26 1.72 1.21 1.79 39 1.43 1.54 1.38 1.60 1.33 1.66 1.27 1.72 1.22 1.79 40 1.44 1.54 1.39 1.60 1.34 1.66 1.29 1.72 1.23 1.79 45 1.48 1.57 1.43 1.62 1.38 1.67 1.34 1.72 1.29 1.78 50 1.50 1.59 1.46 1.63 1.42 1.67 1.38 1.72 1.34 1.77 55 1.53 1.60 1.49 1.64 1.45 1.68 1.41 1.72 1.38 1.77 60 1.55 1.62 1.51 1.65 1.48 1.69 1.44 1.73 1/41 1.77 65 1.57 1.63 1.54 1.66 1.50 1.70 1,47 1.73 1.44 1.77 70 1.58 1.64 1.55 1.67 1.52 1.70 1,49 1.74 1.46 1.77 75 1.60 1.65 1.57 1.68 1.54 1.71 1,51 1.74 1.49 1.77 80 1.61 1.66 1.59 1.69 1,56 1.72 1.53 1.74 1.51 1.77 85 1.62 1.67 1.60 1.70 1.57 1.72 1.55 1.75 1.52 1.77 90 1.63 1.68 1.61 1.70 1.59 1.73 1,57 1.75 1.54 1.78 95 1.64 1.69 1.62 1.71 1.60 1.73 1.58 1.75 1.56 1.78 100 1.65 1.69 1.63 1.72 1.61 1.74 1.59 1.76 1.57 1.78

169

Aneks F

Współczynniki ,n iα dla testu Shapiro–Wilka

2 3 4 5 6 7 8 9 10 1 0.707 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5888 0.5739 2 – 0.0000 0.1677 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291 3 – – – 0.0000 0.0875 0.1401 0.1743 0.1976 0.2141 4 0.0000 0.0561 0.0947 0.1224 5 0.0000 0.0399

Ciąg dalszy tabeli 11 12 13 14 15 16 17 18 19 20 1 0.5601 0.5475 0.5359 0.5251 0.5150 0.5656 0.4968 0.4886 0.4808 0.4734 2 0.3315 0.3325 0.3325 0.3318 0.3306 0.3290 0.3273 0.3253 0.3232 0.3211 3 0.2260 0.2347 0.2412 0.2460 0.2495 0.2521 0.2540 0.2553 0.2561 0.2565 4 0.1429 0.1586 0.1707 0.1802 0.1878 0.1939 0.1988 0.2027 0.2059 0.2085 5 0.0695 0.0922 0.1099 0.1240 0.1353 0.1447 0.1524 0.1587 0.1641 0.1686 6 0.0000 0.0303 0.0539 0.0727 0.0880 0.1005 0.1109 0.1197 0.1271 0.1334 7 0.0000 0.0240 0.0433 0.0593 0.0725 0.0837 0.0932 0.1013 8 0.0000 0.0196 0.0359 0.0496 0.0612 0.0711 9 0.0000 0.0016 0.0303 0.0422 10 0.0000 0.0140

Ciąg dalszy tabeli

21 22 23 24 25 26 27 28 29 30 1 0.4643 0.4590 0.4542 0.4493 0.4450 0.4407 0.4366 0.4328 0.4291 0.4254 2 0.3185 0.3156 0.3126 0.3098 0.3069 0.3043 0.3018 0.2992 0.2968 0.2944 3 0.2578 0.2571 0.2563 0.2554 0.2543 0.2533 0.2522 0.2510 0.2499 0.2487 4 0.2129 0.2131 0.2139 0.2145 0.2148 0.2151 0.2152 0.2151 0.2150 0.2148 5 0.1736 0.1764 0.1787 0.1807 0.1822 0.1836 0.1848 0.1857 0.1864 0.1870 6 0.1399 0.1445 0.1480 0.1512 0.1539 0.1563 0.1584 0.1601 0.1616 0.1630 7 0.1092 0.1150 0.1201 0.1245 0.1283 0.1316 0.1346 0.1372 0.1395 0.1415 8 0.0804 0.0878 0.0941 0.097 0.1046 0.1089 0.1128 0.1162 0.1192 0.1219 9 0.0530 0.0618 0.0696 0.0764 0.0823 0.0876 0.0923 0.0965 0.1002 0.1036 10 0.0263 0.0368 0.0453 0.0539 0.0610 0.0672 0.0728 0.0778 0.0822 0.0862 11 0.0000 0.0122 0.0228 0.0321 0.0403 0.0476 0.0540 0.0598 0.0650 0.0697 12 0.0000 0.0107 0.0200 0.0284 0.0358 0.0424 0.0483 0.0237 13 0.0000 0.0094 0.0178 0.0253 0.0320 0.0381 14 0.0000 0.0084 0.0159 0.0227 15 0.0000 0.0076

170

Ciąg dalszy tabeli

31 32 33 34 35 36 37 38 39 40 1 0.4220 0.4188 0.4156 0.4127 0.4096 0.4068 0.4040 0.4015 0.3989 0.3964 2 0.2921 0.2898 0.2876 0.2854 0.2834 0.2813 0.2794 0.2774 0.2755 0.2737 3 0.2475 0.2463 0.2451 0.2439 0.2427 0.2415 0.2403 0.2391 0.2380 0.2368 4 0.2145 0.2141 0.2137 0.2132 0.2127 0.2121 0.2116 0.2110 0.2104 0.2098 5 0.1874 0.1878 0.1880 0.1882 0.1883 0.1883 0.1883 0.1881 0.1880 0.1878 6 0.1641 0.1651 0.1660 0.1667 0.1673 0.1678 0.1683 0.1688 0.1689 0.1691 7 0.1433 0.1449 0.1463 0.1475 0.1487 0.1496 0.1505 0.1513 0.1520 0.1526 8 0.1243 0.1265 0.1284 0.1301 0.1317 0.1331 0.1344 0.1356 0.1366 0.1376 9 0.1066 0.1093 0.1118 0.1140 0.1160 0.1179 0.1196 0.1211 0.1225 0.1237 10 0.899 0.0931 0.0961 0.0988 0.1013 0.1036 0.1055 0.1075 0.1092 0.1108 11 0.0739 0.0777 0.0812 0.0844 0.0873 0.0900 0.0924 0.0947 0.0967 0.0986 12 0.0585 0.0629 0.0669 0.0706 0.0739 0.0770 0.0798 0.0824 0.0848 0.0870 13 0.0453 0.0485 0.0530 0.0572 0.0610 0.0645 0.0677 0.0706 0.0733 0.0759 14 0.0289 0.0344 0.0395 0.0441 0.0484 0.0523 0.0559 0.0592 0.0622 0.0651 15 0.0144 0.0206 0.0262 0.0314 0.0361 0.0404 0.0444 0.0481 0.0515 0.0546 16 0.0000 0.0068 0.0131 0.0187 0.0239 0.0287 0.0331 0.0372 0.0409 0.0444 17 0.0000 0.0062 0.0119 0.0172 0.0220 0.0264 0.0305 0.0343 18 0.0000 0.0057 0.0110 0.0158 0.0203 0.0244 19 0.0000 0.0053 0.0101 0.0146 20 0.0000 0.0049

Ciąg dalszy tabeli

41 42 43 44 45 46 47 48 49 50 1 0.3940 0.3917 0.3894 0.3872 0.3850 0.3830 0.3008 0.3789 0.3770 0.3751 2 0.2719 0.2701 0.2684 0.2667 0.2651 0.2635 0.2620 0.2604 0.2589 0.2574 3 0.2357 0.2345 0.2334 0.2323 0.2313 0.2302 0.2291 0.2281 0.2271 0.2260 4 0.2091 0.2085 0.2078 0.2072 0.2065 0.2058 0.2052 0.2045 0.2038 0.2032 5 0.1876 0.1874 0.1871 0.1868 0.1865 0.1862 0.1859 0.1855 0.1851 0.1847 6 0.1693 0.1694 0.1695 0.1695 0.1695 0.1695 0.1695 0.1693 0.1692 0.1691 7 0.1531 0.1535 0.1539 0.1542 0.1545 0.1548 0.1550 0.1551 0.1553 0.1554 8 0.1384 0.1392 0.1398 0.1405 0.1410 0.1415 0.1420 0.1423 0.1427 0.1430 9 0.1249 0.1259 0.1269 0.1278 0.1286 0.1293 0.1300 0.1306 0.1312 0.1317 10 0.1123 0.1136 0.1149 0.1160 0.1170 0.1180 0.1189 0.1197 0.1205 0.1212 11 0.1004 0.1020 0.1035 0.1049 0.1062 0.1073 0.1085 0.1095 0.1105 0.1113 12 0.0891 0.0909 0.0927 0.0943 0.0959 0.0972 0.0986 0.0998 0.1010 0.1020 13 0.0782 0.0804 0.0824 0.0842 0.0860 0.0876 0.0892 0.0906 0.0919 0.0932 14 0.0677 0.0701 0.0724 0.0745 0.0765 0.0783 0.0801 0.0817 0.0832 0.0846 15 0.0575 0.0602 0.0628 0.0651 0.0673 0.0694 0.0713 0.0731 0.0748 0.0764 16 0.0476 0.0506 0.0534 0.0560 0.0584 0.0607 0.0628 0.0648 0.0667 0.0685 17 0.0379 0.0411 0.0442 0.0471 0.0497 0.0522 0.0546 0.0568 0.0588 0.0608 18 0.0283 0.0318 0.0352 0.0383 0.0412 0.0439 0.0465 0.0489 0.0511 0.0532 19 0.0188 0.0227 0.0263 0.0296 0.0328 0.0357 0.0385 0.0411 0.0436 0.0459 20 0.0094 0.0136 0.0175 0.0211 0.0245 0.0275 0.0307 0.0335 0.0361 0.0386 21 0.0000 0.0045 0.0087 0.0126 0.0163 0.0197 0.0229 0.0259 0.0288 0.0314 22 0.0000 0.0042 0.0081 0.0118 0.0153 0.0185 0.0215 0.0244 23 0.0000 0.0039 0.0076 0.0111 0.0143 0.0174 24 0.0000 0.0037 0.0071 0.0104 25 0.0000 0.0035

171

Aneks G

Wartości krytyczne dla testu Shapiro–Wilka

n 0.01α = 0.02α = 0.05α = 0.10α = 0.50α = 3 0.753 0.756 0.767 0.789 0.959 4 0.687 0.707 0.748 0.792 0.935 5 0.686 0.715 0.762 0.806 0.927 6 0.713 0.743 0.788 0.826 0.927 7 0.730 0.760 0.803 0.838 0.928 8 0.749 0.778 0.818 0.851 0.932 9 0.764 0.791 0.829 0.859 0.935 10 0.781 0.806 0.842 0.869 0.938 11 0.792 0.817 0.850 0.876 0.940 12 0.805 0.828 0.859 0.883 0.943 13 0.814 0.837 0.866 0.889 0.945 14 0.825 0.846 0.874 0.895 0.947 15 0.835 0.855 0.881 0.901 0.950 16 0.844 0.863 0.887 0.906 0.952 17 0.851 0.869 0.892 0.910 0.954 18 0.858 0.874 0.897 0.914 0.956 19 0.863 0.879 0.901 0.917 0.957 20 0.868 0.884 0.905 0.920 0.959 21 0.873 0.888 0.908 0.923 0.960 22 0.878 0.892 0.911 0.926 0.961 23 0.881 0.895 0.914 0.928 0.962 24 0.884 0.898 0.916 0.930 0.963 25 0.888 0.901 0.918 0.931 0.964 26 0.891 0.904 0.920 0.933 0.965 27 0.894 0.906 0.923 0.935 0.965 28 0.896 0.908 0.924 0.936 0.966 29 0.898 0.910 0.926 0.937 0.966 30 0.900 0.912 0.927 0.939 0.967 31 0.902 0.914 0.929 0.940 0.967 32 0.904 0.915 0.930 0.941 0.968 33 0.906 0.917 0.931 0.942 0.968 34 0.908 0.919 0.933 0.943 0.969 35 0.910 0.920 0.934 0.944 0.969 36 0.912 0.922 0,935 0.945 0.970 37 0.914 0.924 0.936 0.946 0.970 38 0.916 0.925 0.938 0.947 0.971 39 0.917 0.927 0.939 0.948 0.971 40 0.919 0.928 0.940 0.949 0.972 41 0.920 0.929 0.941 0.950 0.972 42 0.922 0.930 0.942 0.951 0.972 43 0.923 0.932 0.943 0.951 0.973 44 0.924 0.933 0.44 0.952 0.973 45 0.926 0.934 0.945 0.953 0.973 46 0.927 0.935 0.945 0.953 0.974 47 0.928 0.936 0.946 0.954 0.974 48 0.929 0.937 0.947 0.954 0.974 49 0.929 0.937 0.947 0.955 0.974 50 0.930 0.938 0.947 0.955 0.974

172

Aneks H

Wartości krytyczne dla testu 2χ

spełniające warunek ( )2 2,P α νχ χ α> =

α /ν 0.10α =

0.05α =

0.01α =

1 2.706 3.841 6.635 2 4.605 5.991 9,210 3 6.251 7.815 11.345 4 7.779 9.488 13.277 5 9.236 11.070 15.086 6 10.645 12.592 16.812 7 12.017 14.067 18.475 8 13.362 15.507 20.090 9 14.684 16.919 21.666 10 15.987 18.307 23.209 11 17.275 19.675 24.725 12 18.549 21.026 26.217 13 19.812 22.362 27.688 14 21.064 23.685 29.141 15 22.307 24.996 30.578 16 23.542 26.296 32.000 17 24.769 27.587 33.409 18 25.989 28.869 34.805 19 27.204 30.144 36.191 20 28.412 31.410 37.566

173

Bibliografia

[1] Aczel A. D., Statystyka w Zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa 2000.

[2] Amemiya T., Nonlinear Regression Models. W: Handbook of Econometrics, red. Z. Grili-

ches, M.D. Intriligator, North Holland, Amsterdam 1983.

[3] Bard Y., Nonlinear Parameter Estimation, Academic Press, New York 1974.

[4] Borkowski B., Dudek H., Szczesny W., Ekonometria. Wybrane zagadnienia, Wydaw-

nictwo Naukowe PWN, Warszawa 2003.

[5] Box G. E. P., Jenkins G. M., Analiza szeregów czasowych prognozowanie i sterowanie,

PWN, Warszawa 1983.

[6] Brown R.G., Statistical Forecasting for Inventory Control, McGrow Hill, New York

1959.

[7] Chatfield C. The analysis of time series.. an introduction, CHAPMAN & HALL/CRC,

London, 2000.

[8] Chow G.C., Ekonometria / Przekład – W. Jurek, Wydawnictwo Naukowe PWN,

Warszawa 1995.

[9] Cieślak M., Prognozowanie gospodarcze. Metody i zastosowania, Wydawnictwo Nauko-

we PWN, Warszawa 2004.

[10] Czerwiński Z., Matematyka na usługach ekonomii, Wyd. 7, PWN, Warszawa 1984.

[11] Draper N. R., Smith H., Applied Regression Analysis, John Wiley&Sons, New York

1998.

[12] Dziechciarz J. (red.), Ekonometria: metody, przykłady, zadania, Wydawnictwo Akademii

Ekonomicznej im. Oskara Langego, Wrocław 2003.

[13] Enders W., Applied Econometric Time Series, Wiley 2010.

[14] Falk M., A First Course on Time Series Analysis Examples with SAS, udostępnione na

stronie http://opus.bibliothek.uni-wuerzburg.de/volltexte/2005/1259/

[15] Goldberger A.S., Teoria ekonometrii, PWE, Warszawa 1975.

[16] Golgfeld S.M., Quandt R.E., Nonlinear Methods in Econometrics, North Holland,

Amsterdam 1972.

[17] Goryl A., Jędrzejczyk Z., Kukuła K., Osiewalski J., Walkosz A., Wprowadzenie do eko-

nometrii, Wydawnictwo Naukowe PWN, Warszawa 2009.

[18] Górecki B. R., Ekonometria podstawy teorii i praktyki, KeyText, Warszawa 2010.

[19] Green W. H., Econometric Analysis, Prentice Hall, Inc., New Jersey 2000.

174

[20] Gruszczyński M., Podgórska M., Ekonometria, Szkoła Główna Handlowa, Warszawa

2000.

[21] Guzik B., Jurek W., Sikora W., Appenzeller D., Ekonometria I badania operacyjne.

Zagadnienia podstawowe, Wydawnictwo AE w Poznaniu, Poznań 2000.

[22] Hellwig Z., Schemat budowy prognozy statystycznej metodą wag harmonicznych,

Przegląd Statystyczny, z. 2, 1967.

[23] Holt C.C., Forecasting seasonals and trends by exponentially weighted moving averages,

International Journal of Forecasting, volume 20, 2004.

[24] http://www.nobelprize.org/nobel_prizes/economic-sciences/laureates/1980/

[25] Intriligator M.D., Econometric Models, Techniques and Applications, North-Holland

Publishing Company, Amsterdam-Oxford 1978.

[26] Jajuga K.(red) Ekonometria. Metody i analiza problemów ekonomicznych, Wydawnictwo

Akademii Ekonomicznej we Wrocławiu, Wrocław 1999.

[27] Judge G.G., Griffiths W.E., Hill R.C., Lutkepohl H., Lee T.-C., The Theory and Practice

of Econometrics, John Wiley, New York 1985.

[28] Kukuła K. (red.), Wprowadzenie do ekonometrii w przykładach i zadaniach, wyd. 2,

Wydawnictwo Naukowe PWN, Warszawa 2003.

[29] Lange O., Wstęp do ekonometrii, PWE, Warszawa 1976.

[30] Łuniewska M., Ekonometria finansowa. Analiza rynku kapitałowego, Wydawnictwo

Naukowe PWN, Warszawa 2008.

[31] Maddala G.S., Ekonometria, Wydawnictwo Naukowe PWN, Warszawa 2006.

[32] Marcinkowska-Lewandowska W., Plebaniak J., Podgórska M., Ekonometria w zada-

niach i ćwiczeniach, Szkoła Główna Handlowa w Warszawie, Warszawa 2005.

[33] Osińska M., Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa

2006.

[34] Pawełek B., Wanat S., Zeliaś A., Prognozowanie ekonomiczne. Teoria, przykłady,

zadania, Wydawnictwo Naukowe PWN, Warszawa 2004.

[35] Pawłowski Z., Ekonometria, Wyd. 5, PWN, Warszawa 1980.

[36] Ramanathan R. Introductory Econometrics with Applications, HBC Publishers, Fort

Worth 1998.

[37] Seber G.A.F., Wild C.J., Nonlinear Regression, John Wiley, New York 1989.

[38] Snarska A., Statystyka, Ekonometria, Prognozowanie. Ćwiczenia z Excelem, Placet,

2005.

175

[39] Szafrański G., Materiały do ekonometrii dynamicznej i finansowej udostępniane na

stronie http://gszafranski.w.interia.pl

[40] Sobczyk, M., Prognozowanie. Teoria, Przykłady, Zadania, Wydawnictwo Placet 2008.

[41] Welfe A., Ekonometria, PWE, Warszawa 1997.

[42] Welfe A., Ekonometria. Metody i ich zastosowanie, Polskie Wydawnictwo Ekono-

miczne, Warszawa 2009.

[43] Welfe W., Welfe A., Ekonometria stosowana, Polskie Wydawnictwo Ekonomiczne,

Warszawa 2004.

[44] Winters P. R., Forecasting Trends and Seasonal by Exponentially Weighted Averages,

Management Science, Vol. 6, No. 3, 1960.

176

1. Spis rysunków

Rys. 1.1. Klasyfikacja modeli ekonometrycznych ................................................................... 13 Rys. 1.2 Etapy budowania modelu ekonometrycznego ........................................................... 18 Rys. 1.3. Graf powiązań między zmiennymi objaśniającymi .................................................. 29 Rys. 1.4. Zależność kosztów całkowitych od wielkości produkcji ......................................... 36

Rys. 1.5. Rozrzut reszt ............................................................................................................. 54

Rys. 1.6. Wykres funkcji wykładniczej 0 1XY α α= ⋅ ................................................................ 60

Rys. 1.7. Wykres funkcji wykładniczej 0 1XY eα α+= ................................................................. 60 Rys. 1.8. Wykres funkcji wykładniczej 1

0XY eαα= ⋅ ............................................................... 61

Rys. 1.9. Wykres funkcji potęgowych ..................................................................................... 62

Rys. 1.10. Wykres funkcji logarytmicznej 0 1 logY Xα α= + ................................................. 63

Rys. 1.11. Wykres wielomianu stopnia 3 przy podanych warunkach dla parametrów ............ 64 Rys. 1.12. Wykres funkcji hiperbolicznej ................................................................................ 65 Rys. 1.13. Funkcja wykładnicza z odwrotnością ..................................................................... 66 Rys. 1.14. Funkcja logistyczna ................................................................................................. 66 Rys. 1.15. Pierwsza funkcja Tornquista ................................................................................... 67 Rys. 1.16. Druga funkcja Tornquista ....................................................................................... 68 Rys. 1.17. Trzecia funkcja Tornquista ..................................................................................... 68 Rys. 1.18. Zależność jednostkowego kosztu produkcji (ty ) od wielkości produkcji ( tx ) ...... 70

Rys. 1.19. Sprzedaż lodów w latach 2003-2009 (ton) ............................................................. 76 Rys. 2.1. Funkcje prognoz ........................................................................................................ 83

Rys. 2.2. Etapy prognozowania ................................................................................................ 85 Rys. 2.3. Zasady/reguły prognozy ............................................................................................ 88 Rys. 2.4 Metody prognostyczne ............................................................................................... 89 Rys. 2.5. Klasyczne modele trendu .......................................................................................... 96 Rys. 2.6. Wykres funkcji regresji liniowej wraz z danymi rzeczywistymi .............................. 99

Rys. 2.7. Dopasowanie poszczególnych składowych ai do danych. ...................................... 103 Rys. 2.8. Dopasowanie poszczególnych składowych bi do danych. ...................................... 103 Rys. 2.9. Harmoniki: druga oraz czternasta ........................................................................... 105 Rys. 2.10. Dane wyjściowe oraz wartości teoretyczne/prognozowane. ................................. 106 Rys. 2.11. Modele adaptacyjne .............................................................................................. 108 Rys. 2.12. Model średniej ruchomej ...................................................................................... 113

Rys. 2.13 Scentrowana średnia ruchoma. .............................................................................. 115 Rys. 2.14. Wygładzanie wykładnicze Browna ....................................................................... 119

Rys. 2.15. Wygładzanie wykładnicze Holta .......................................................................... 121 Rys. 2.16. Wygładzanie wykładnicze Wintersa ..................................................................... 124 Rys. 2.17. Trend pełzający z wagami harmonicznymi .......................................................... 129 Rys. 3.1. Proces stochastyczny a) dyskretny, b) ciągły .......................................................... 131 Rys. 3.2. Zastosowanie filtru liniowego ................................................................................. 134 Rys. 3.3. Przykład procesu białego szumu ............................................................................. 137 Rys. 3.4. Wykres funkcji autokorelacji .................................................................................. 137 Rys. 3.5 Funkcja korelogram w Gretlu .................................................................................. 138 Rys. 3.6. Wykres i test funkcji ACF i PACF ......................................................................... 138 Rys. 3.7. Przykład błądzenia losowego .................................................................................. 139

Rys. 3.8. Proces Ma(1) ........................................................................................................... 141 Rys. 3.9 Funkcje ACF i PACF procesu AR(1) ...................................................................... 141

177

Rys. 3.10. Wykres szeregu AR(1) .......................................................................................... 143 Rys. 3.11. Wykres funkcji ACF i PACF ................................................................................ 143 Rys. 3.12. Wartości testu Ljunga-Boxa .................................................................................. 144 Rys. 3.13. Ekran dostępu do modelu MNK ........................................................................... 144 Rys. 3.14. Wybór zmiennych modelu MNK .......................................................................... 145 Rys. 3.15. Ocena parametrów modelu ................................................................................... 145 Rys. 3.16. Wykres obserwacji ................................................................................................ 150 Rys. 3.17. Wykresy ACF i PACF .......................................................................................... 151 Rys. 3.18. Specyfikacja modelu ARIMA(1,1,2) .................................................................... 151 Rys. 3.19. Specyfikacja modelu ARIMA(1,1,1) .................................................................... 152 Rys. 3.20. Porównanie szeregów ........................................................................................... 152 Rys. 3.21. Modyfikacja szeregu ............................................................................................. 157 Rys. 3.22. Wykresy ACF i PACF dla szeregu log ceny miedzi ............................................. 157 Rys. 3.23. Wybór postaci modelu ARIMA ............................................................................ 158 Rys. 3.24 Ocena parametrów modelu .................................................................................... 158 Rys. 3.25. Wykres normalności ............................................................................................. 159

Rys. 3.26. ACF i PACF reszt modelu .................................................................................... 159

178

2. Spis Tabel

Tabela 1.1. Miesięczne wydatki na żywność ........................................................................... 11 Tabela 1.2. Wydatki na żywność 10 gospodarstw domowych w marcu 2012 r. ..................... 11 Tabela 1.3. Wydatki na żywność 10 gospodarstw domowych w kolejnych miesiącach 2012 r. ............................................................................................... 12 Tabela 2.1. Dane dotyczące płacy minimalnej ......................................................................... 98 Tabela 2.2. Prognozowanie za pomocą regresji liniowej ......................................................... 98 Tabela 2.3. Prognozowanie metodą harmoniki ...................................................................... 102 Tabela 2.4. Wyliczenie udziału w zmienności Y ................................................................... 104 Tabela 2.5. Wartości prognozowane modelem analizy harmonicznej ................................... 105

Tabela 2.6. Prognozowanie kursu akcji BUDIMEX za pomocą średniej ruchomej .............. 112 Tabela 2.7. Dane eksportu towarów w milionach PLN ......................................................... 114 Tabela 2.8. Prognozowanie kursu akcji BUDIMEX za pomocą wygładzania wykładniczego .................................................................................................. 118 Tabela 2.9. Prognozowanie eksportu towarów za pomocą wygładzania wykładniczego Holta ......................................................................................... 120 Tabela 2.10. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą wygładzania wykładniczego Wintersa ................................................................. 123 Tabela 2.11. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą trendu pełzającego ................................................................................................ 127 Tabela 2.12. Estymatory parametrów .................................................................................... 128 Tabela 2.13. Prognozowanie metodą wag harmonicznych .................................................... 128 Tabela 3.1. Początkowe wartości szeregu .............................................................................. 143 Tabela 3.2. Początkowe wartości cen miedzi ......................................................................... 150 Tabela 3.3. Klasyfikacja podstawowych modeli procesów stochastycznych ........................ 154