Natalia Iwaszczuk, Piotr Drygaś, Piotr Pusz, Radosław Pusz
PROGNOZOWANIE
GOSPODARCZE
Wyd-wo, Rzeszów 2013
2
dr hab., prof. nadzw. Natalia Iwaszczuk, AGH Akademia Górniczo-Hutnicza
im. Stanisława Staszica w Krakowie
dr Piotr Drygaś, Uniwersytet Rzeszowski
dr Piotr Pusz, Uniwersytet Rzeszowski
mgr Radosław Pusz, Bank Pekao SA
Recenzenci:
prof. dr hab. Wladimir Mitiuszew, Uniwersytet Pedagogiczny
im. Komisji Edukacji Narodowej w Krakowie
dr hab., prof. nadzw. Mariusz Kudełko, AGH Akademia Górniczo-Hutnicza
im. Stanisława Staszica w Krakowie
3
Spis treści Wstęp …………………………………………………………………………………………7 ROZDZIAŁ I Modele ekonometryczne podstawowym instrumentem prognozowania gospodarczego……...9
1.1. Ekonometria jako dyscyplina naukowa ........................................................................... 9
1.2. Rola i rodzaje danych statystycznych wykorzystywanych w ekonometrii ................... 10
1.3. Modele ekonometryczne i ich klasyfikacja ................................................................... 12
1.3.1. Modele jedno- i wielorównaniowe ......................................................................... 13
1.3.2. Modele statyczne i dynamiczne .............................................................................. 14
1.3.3. Modele stochastyczne i deterministyczne ............................................................... 14
1.3.4. Modele liniowe i nieliniowe ................................................................................... 15
1.3.5. Modele przyczynowo-skutkowe, symptomatyczne i modele tendencji rozwojowej ......................................................................................... 16
1.3.6. Etapy budowania modelu ........................................................................................ 17
1.4. Modele liniowe .............................................................................................................. 19
1.4.1. Postać modelu regresji liniowej .............................................................................. 20
1.4.2. Wybór zmiennych objaśniających do modelu ekonometrycznego ......................... 21
Metoda pojemności informacyjnej Hellwiga ............................................................. 22
Metoda analizy grafów .............................................................................................. 26
1.4.3. Estymacja modelu ................................................................................................... 30
Założenia klasycznego modelu regresji liniowej ....................................................... 30
Klasyczna metoda najmniejszych kwadratów ........................................................... 31
Klasyczna metoda najmniejszych kwadratów w zapisie macierzowym .................... 32
Twierdzenie Gaussa-Markowa .................................................................................. 32
Macierz wariancji i kowariancji ocen parametrów strukturalnych ............................ 33
Współczynniki dopasowania modelu do danych obserwacji ..................................... 34
Przedział ufności dla parametrów strukturalnych modelu ......................................... 35
1.4.4. Weryfikacja modelu ................................................................................................ 41
Ogólne zasady weryfikacji statystycznej ................................................................... 42
Ocena jakości ocen parametrów strukturalnych ........................................................ 43
Badanie założeń o składnikach losowych .................................................................. 48
4
1.4.5. Merytoryczna interpretacja parametrów strukturalnych oszacowanych modeli .... 57
1.5. Modele nieliniowe ......................................................................................................... 58
1.5.1. Rodzaje modeli nieliniowych .................................................................................. 59
1.5.2. Charakterystyka wybranych modeli nieliniowych .................................................. 59
Funkcja wykładnicza ................................................................................................. 59
Funkcja potęgowa ...................................................................................................... 61
Funkcja logarytmiczna ............................................................................................... 62
Wielomiany ................................................................................................................ 63
Funkcja hiperboliczna ................................................................................................ 64
Funkcja wykładnicza z odwrotnością ........................................................................ 65
Funkcja logistyczna ................................................................................................... 66
Pierwsza funkcja Tornquista ...................................................................................... 67
Druga i trzecia funkcje Tornquista ............................................................................ 67
1.5.3. Estymacja metodą najmniejszych kwadratów modeli transformowalnych do postaci liniowej ............................................................................ 69
Modele transformowalne do postaci liniowej ............................................................ 69
Modele ściśle nieliniowe ............................................................................................ 80
ROZDZIAŁ II
Prognozowanie na podstawie modeli szeregów czasowych …………………………………81
Wstęp .................................................................................................................................... 81
2.1. Teoretyczne podstawy prognozowania ......................................................................... 82
2.2. Organizacja procesu prognostycznego .......................................................................... 84
2.3. Zasady i metody prognozowania ................................................................................... 86
2.3.1. Zasady prognozowania ........................................................................................... 86
2.3.2. Metody prognozowania .......................................................................................... 89
2.4. Rodzaje błędów prognoz i rodzaje jakości prognoz ...................................................... 91
2.4.1. Rodzaje błędów prognoz ......................................................................................... 91
2.4.2. Rodzaje jakości prognoz ......................................................................................... 94
2.5. Prognozowanie na podstawie klasycznych modeli trendu ............................................ 95
2.5.1 Klasyczny model regresji liniowej ........................................................................... 96
2.5.2. Metoda harmoniki ................................................................................................... 99
2.5.3. Metoda Kleina ....................................................................................................... 107
2.6. Prognozowanie na podstawie modeli adaptacyjnych szeregów czasowych ............... 107
2.7. Modele naiwne ............................................................................................................ 109
5
2.8. Modele średniej ruchomej ........................................................................................... 110
2.9. Modele wygładzania wykładniczego .......................................................................... 115
2.9.1. Modele wygładzania wykładniczego Browna ...................................................... 116
2.9.2. Modele wygładzania wykładniczego Holta .......................................................... 119
2.9.3. Modele wygładzania wykładniczego Wintersa .................................................... 122
2.10. Trend pełzający ......................................................................................................... 125
ROZDZIAŁ III
Budowa i prognozowanie na podstawie modeli autoregresji i średniej ruchomej ................. 130
3.1. Proces stochastyczny ................................................................................................... 130
3.2. Filtrowanie szeregów .................................................................................................. 133
3.3. Stacjonarność procesu stochastycznego ...................................................................... 135
3.4. Biały szum ................................................................................................................... 136
3.5. Proces średniej ruchomej ............................................................................................ 140
3.6. Proces autoregresyjny ................................................................................................. 142
3.7. Proces ARMA ............................................................................................................. 146
3.8. Stopień zintegrowania modelu .................................................................................... 147
3.9. Procedura Boxa – Jenkinsa ......................................................................................... 149
3.10. Model SARIMA ........................................................................................................ 153
3.11. Prognozy w modelach ARIMA ................................................................................. 154
Podsumowanie ....................................................................................................................... 161
Tablice statystyczne ............................................................................................................... 173
Bibliografia ............................................................................................................................. 173
1. Spis rysunków ................................................................................................................. 176
2. Spis Tabel ........................................................................................................................ 178
6
7
WSTĘP
Prognozowanie procesów gospodarczych jest ważną częścią planowania działalności
zarówno na poziomie mikro jak i makroekonomicznym. Na podstawie sporządzonych
prognoz podejmuje się wiele decyzji w finansach, bankowości, handlu, marketingu,
ubezpieczeniach etc. Opracowanie zatytułowane „Prognozowanie gospodarcze” jest
wynikiem skorelowania rozważań teoretycznych z praktycznym zastosowaniem
oprogramowania komputerowego w tworzeniu modeli prognostycznych. Modele te mogą być
budowane na potrzeby zarówno instytucji międzynarodowych, rządów i ministerstw (w
gospodarkach krajowych), jak i poszczególnych przedsiębiorstw. Metody omawiane tutaj są
nadal z powodzeniem stosowane w badaniach dotyczących skali mikro, makro, mezo i
megaekonomicznej.
W niniejszym opracowaniu przedstawiono te metody prognozowania, które
najczęściej stosuje się w praktyce. W celu wyznaczenia prognozy zjawisk zmieniających się
w czasie bardzo istotną rolą jest znalezienie odpowiedniego modelu matematycznego
opisującego przebieg danego procesu. Nie zagłębiając się w metodologię możemy wyróżnić
dwa typy modeli: czyste – przedstawiamy równanie lub układ równań najczęściej
różniczkowych opisujących dane zjawisko, lub statystyczne – metodami statystyki
matematycznej dobieramy właściwe współczynniki modelu.
Autorzy podzielili prezentowany materiał na trzy rozdziały.
8
Rozdział pierwszy zatytułowany „Modele ekonometryczne podstawowym
instrumentem prognozowania gospodarczego” przedstawia nam sposób budowy i weryfikacji
modelu ekonometrycznego. Wszelkie prognozy powinny być oparte na dobrze zbudowanym i
dopasowanym modelu. W rozdziale tym poruszono zagadnienia dotyczące budowy modeli
ekonometrycznych ze szczególnym uwzględnieniem modeli liniowych. Najważniejszą
częścią budowy modelu jest jego weryfikacja oraz merytoryczna interpretacja uzyskanych
wyników. Przedstawiono zatem sposoby testowania hipotez dotyczących parametrów
strukturalnych i istotności współczynników, a także badanie składnika losowego.
Kolejny rozdział pt. „Prognozowanie na podstawie modeli szeregów czasowych”
dotyczy tematyki związanej przede wszystkim z organizacją i zasadami procesu
prognostycznego. Wprowadzono matematyczne wzory na wyznaczanie błędów prognoz.
W rozdziale omówiono metody prognozowania na podstawie klasycznych modeli trendu,
modeli adaptacyjnych szeregów czasowych.
Rozdział trzeci niniejszego opracowania zatytułowany „Budowa i prognozowanie na
podstawie modeli autoregresji i średniej ruchomej” dotyczy modeli zaproponowanych przez
Boxa i Jenkina a nazywanych modelami autoregresyjnymi i średniej ruchomej. Modele te są
dzisiaj coraz bardziej rozwijane, wprowadzane są do nich informacje o trendzie czy
sezonowości. Są one wykorzystywane obecnie przez instytucje finansowe nie tylko do
tworzenia prognoz ale również analizy przeszłości.
Praca w jasny i wyczerpujący sposób definiuje i przedstawia zagadnienie dotyczące
budowy modeli prognostycznych oraz ich praktycznego zastosowania. W niniejszym
opracowaniu wykorzystano najnowsze materiały i zaktualizowane dane. W opracowaniu tym
zawarto również informacje o możliwości skorzystania z dostępnego oprogramowania jak
podstawowy arkusz MS Excel, ale też zaawansowane Statistica czy Gretl. Opracowanie to
podaje nie tylko informacje teoretyczne, ale umożliwia również czytelnikowi samodzielne
zastosowanie poprzez dokładne omówienie i prezentację możliwości wykorzystania
oprogramowania statystycznego.
9
ROZDZIAŁ I
MODELE EKONOMETRYCZNE PODSTAWOWYM
INSTRUMENTEM PROGNOZOWANIA GOSPODARCZEGO
1.1. Ekonometria jako dyscyplina naukowa
Ekonometria jako nauka powstała stosunkowo niedawno, bo w drugiej połowie ubiegłego
wieku. Jednak jej dynamiczny rozwój nastąpił w ostatnich trzech dekadach, co wiążę się
zarówno z globalną komputeryzacją i informatyzacją współczesnego społeczeństwa, jak i
rozwojem globalnej sieci Internet. Jeśli chodzi o zakres badań, to ogólnie można powiedzieć,
że ekonometria bada ilościowe zależności występujące między zjawiskami ekonomicznymi
wykorzystując przy tym różne metody i narzędzia matematyczne. Jednak najczęściej w
ekonometrii wykorzystywane są metody statystyczne. Dlatego niektórzy naukowcy traktują
ekonometrię jako pochodną statystyki matematycznej, która powstała znacznie wcześniej niż
ekonometria. Ten związek powstał na skutek tego, że w zjawiskach ekonomicznych bardzo
często mamy do czynienia z losowością zdarzeń, których badanie wymaga stosowania
sprawdzonych metod statystycznych.
Ekonometria jest również dyscypliną ściśle związaną z różnymi dziedzinami nauk
ekonomicznych, dostarczających wiedzy teoretycznej nt. badanych zjawisk gospodarczych.
Ponadto obserwuje się wzmocnienie związku między ekonometrią a informatyką, która
dostarcza narzędzi ułatwiających wykonanie różnego rodzaju, dość skomplikowanych
obliczeń liczbowych oraz ilustrowania otrzymanych wyników.
Termin ekonometria powstał ze złożenia dwóch słów pochodzących z języka
greckiego: „oeconomia”, czyli gospodarka, oraz „metreo”, czyli mierzyć. Razem wzięte
10
pozwalają interpretować ekonometrię jako naukę podejmującą zadanie pomiaru zależności
zachodzących w gospodarce. Zatem nie chodzi tu o mierzenie bezpośrednio, np. wielkości
produkcji, sprzedaży czy innych kategorii ekonomicznych, lecz o uchwycenie relacji, jakie
zachodzą między zjawiskami ekonomicznymi oraz o ich wykorzystanie w analizie i
przewidywaniu, a niekiedy w symulacji [17, s. 13]. Po raz pierwszy termin „ekonometria”
pojawił się w 1910 roku w tytule pracy Pawła Ciompy Przegląd ekonometrii i rzeczywistej
teorii buchalterii wydanej we Lwowie [20, s. 9].
Przytoczymy kilka definicji ekonometrii. „Ekonometria to nauka zajmująca się
ustalaniem za pomocą metod statystycznych konkretnych, ilościowych prawidłowości
zachodzących w życiu gospodarczym” [29, s. 11].
„Ekonometria jest nauką o metodach badania ilościowych prawidłowości
występujących w zjawiskach ekonomicznych za pomocą odpowiednio wyspecjalizowanego
aparatu matematyczno–statystycznego” [35, s.15].
Zatem ekonometria jako nauką koncentruje się na następujących zadaniach [4]:
• ilościowej ocenie relacji pomiędzy zjawiskami ekonomicznymi,
• konfrontacji teorii ekonomii z praktyką gospodarczą,
• prognozowaniu wyników działalności gospodarczej.
Badania ekonometryczne składają się z wielu etapów, które najogólniej możemy
określić jako [36]:
1. Sformułowanie modelu ekonometrycznego.
2. Zgromadzenie danych empirycznych.
3. Estymacja parametrów modelu.
4. Weryfikacja merytoryczna i statystyczna modelu.
5. Interpretacja ekonomiczna uzyskanych wyników.
1.2. Rola i rodzaje danych statystycznych wykorzystywanych w ekonometrii
Podstawę badań ekonometrycznych stanowią dane statystyczne, które po ich opracowaniu za
pomocą metod ekonometrycznych dostarczają badaczom informacji niezbędnych do
wyciągnięcia odpowiednich wniosków w stosunku do badanego zjawiska ekonomicznego.
Dane statystyczne dotyczą głównie pewnych zbiorowości (populacji), których elementami są
obiekty materialne, zjawiska gospodarcze, technologiczne i inne. Zbiory dowolnych obiektów
11
(osób, przedmiotów, faktów) podobnych pod względem określonych cech nazywa się
zbiorowościami statystycznymi lub populacjami.
Próba jest to podzbiór populacji generalnej, obejmujący część jej elementów –
wybranych w określony sposób. Próba dostatecznie liczna, wybrana w sposób losowy, jest
próbą reprezentatywną. Wyniki badań próby reprezentatywnej można uogólnić na całą
populację (z dużym prawdopodobieństwem można sądzić, że struktura próby będzie zbliżona
do struktury populacji) [4].
Elementy populacji (obiekty) mogą mieć różne właściwości (cechy), które podlegają
obserwacji statystycznej. Dane statystyczne mają najczęściej postać szeregów czasowych,
danych przekrojowych lub danych przekrojowo-czasowych [25; 5].
Szeregi czasowe składają się z liczb odpowiadających wartościom, jakie przybrała
dana cecha (zmienna) w kolejnych, jednakowo odległych momentach czasu (np. latach,
kwartałach, miesiącach). Przykład szeregu czasowego jest podany w tabeli 1.1 [4]. Z kolei
dane przekrojowe dotyczą wielkości obiektów w tym samym momencie (por. tabela 1.2) [4].
Tabela 0.1. Miesięczne wydatki na żywność wybranego gospodarstwa domowego w 2012 r.
Miesiąc Wydatki na żywność (zł) styczeń luty marzec kwiecień maj czerwic lipiec sierpień wrzesień październik listopad grudzień
1400 1500 1460 1550 1470 1520 1450 1380 1340 1450 1580 1600
Źródło: dane umowne
Tabela 0.2. Wydatki na żywność 10 gospodarstw domowych w marcu 2012 r.
Gospodarstwo domowe
1 2 3 4 5 6 7 8 9 10
Wydatki (zł) 1460 1500 1580 1630 1300 1290 1310 1400 1545 1960
Źródło: dane umowne
12
Dane przekrojowo-czasowe stanowią połączenie dwóch poprzednich rodzajów
danych. Szczególnym rodzajem danych przekrojowo-czasowych są dane panelowe. Dotyczą
one szeregów czasowych zawierających wartości pomiarów tej samej zmiennej (cechy)
zaobserwowanych przekrojowo w przypadku wielu obiektów (tabela 1.3) [4].
Tabela 0.3. Wydatki na żywność 10 gospodarstw domowych w kolejnych miesiącach 2012 r.
Miesiąc Gospodarstwa domowe
1 2 3 4 5 6 7 8 9 10
styczeń
luty
marzec
kwiecień
maj
czerwiec
lipiec
sierpień
wrzesień
październik
listopad
grudzień
1400
1500
1460
1550
1470
1520
1450
1380
1340
1450
1580
1600
1480
1590
1500
1390
1400
1280
1345
1400
1450
1525
1600
1580
1610
1700
1580
1510
1460
1380
1370
1390
1380
1600
1570
1680
1570
1690
1630
1450
1495
1380
1400
1390
1390
1450
1550
1700
1280
1150
1300
1260
1200
1205
1170
1200
1240
1280
1340
1450
1200
1260
1290
1350
1320
1200
1130
1100
1200
1370
1350
1475
1300
1200
1310
1425
1310
1390
1435
1510
1400
1370
1450
1620
1580
1450
1400
1500
1400
1365
1400
1420
1510
1490
1520
1910
1690
1500
1545
1600
1550
1580
1490
1440
1375
1400
1525
1700
1800
1720
1690
1765
1700
1650
1590
1540
1600
1680
1740
1800
Źródło: dane umowne
1.3. Modele ekonometryczne i ich klasyfikacja
Podstawowym narzędziem ekonometrii jest model ekonometryczny. Według Zbigniewa
Pawłowskiego „Model ekonometryczny jest to konstrukcja formalna, która za pomocą
pewnego równania lub układu równań przedstawia zasadnicze powiązania występujące
pomiędzy rozpatrywanymi zjawiskami ekonomicznymi” [35].
Wiadomo, że na badane zjawisko ekonomiczne oddziaływać może wiele różnych
czynników, zarówno pochodzenie zewnętrznego, jak i tkwiących w badanym obiekcie. Przy
czym działanie to jest bardzo zróżnicowane, tzn. niektóre czynniki wpływają na dane
zjawisko w sposób decydujący (jest to działanie silne i trwałe), natomiast działanie innych
jest znikome (czyli słabe i nietrwałe). Poza tym na badane zjawisko wpływ mogą mieć
również czynniki nieprzewidywalne nazywane czynnikami losowymi. Ich działanie bywa
13
sporadyczne i nieregularne. Jednak w modelu ekonometrycznym uwzględnia się tylko
czynniki główne, pomijając czynniki słabo oddziałujące oraz czynniki losowe.
Ze względu na różne kryteria klasyfikacji modele ekonometryczne można podzielić na
takie grupy (por. rys. 1.1):
Rys. 0.1. Klasyfikacja modeli ekonometrycznych Źródło: opracowanie własne
1.3.1. Modele jedno- i wielorównaniowe
W zależności od tego ile równań zawiera model ekonometryczny rozróżniamy:
� modele jednorównaniowe,
� modele wielorównaniowe.
Modele jednorównaniowe służą do opisu konkretnych zjawisk bądź fragmentów
rzeczywistości gospodarczej (np. model produkcji, model popytu na konkretne dobro, model
kształtowania się kosztów, wydajności, pracochłonności).
Z kolei modele wielorównaniowe wykorzystywane są zazwyczaj w przypadku
modelowania bardziej złożonych zjawisk gospodarczych (np. mikroekonomiczny model
Modele ekonometryczne
Kryterium: ilość równań
w modelu
Kryterium: postać anali
tyczna modelu
Kryterium: udział czyn
nika losowego
Kryterium: okres badań
jednorów naniowe
liniowe stocha styczne
staty czne
nie liniowe
wielorów naniowe
determini styczne
dynamicz czne
Kryterium: walory
poznawcze
tendencji rozwojowej
sympto matyczne
przyczynowo-opisowe
modele trendu modele autoregresyjne
modele autoregresyjne
modele trendu
modele autoregresyjne
14
funkcjonowania podmiotu gospodarczego lub makroekonomiczny model funkcjonowania
gospodarki krajowej).
1.3.2. Modele statyczne i dynamiczne
Ze względu na to czy zjawisko jest badane w pewnym okresie czy też w jednym konkretnym
momencie czasu rozróżniamy:
• modele dynamiczne,
• modele statyczne.
Modele dynamiczne opisują zmiany parametrów obserwowanego zjawiska w czasie.
Dlatego w modelach tego typu pojawia się subskrypt t , który wyznacza określone przedziały
czasowe podlegające badaniu. Upraszczając zagadnienie, można stwierdzić, że w modelach
dynamicznych zmienna czasowa t występuje albo jako zmienna objaśniająca w modelach
tendencji rozwojowej, albo jako subskrypt przy wszystkich zmiennych objaśniających
( 1 2, ,...,t t KtX X X ) oraz przy zmiennej objaśnianej ( tY ) w innych modelach.
Z kolei modele statyczne opisują współzależności między różnymi zjawiskami
ekonomicznymi występującymi w gospodarce jednocześnie. Dlatego w tych modelach
najczęściej wykorzystywane są subskrypty i lub j .
1.3.3. Modele stochastyczne i deterministyczne
W postaci ogólnej jednorównaniowy model ekonometryczny można zapisać za pomocą
następującego wzoru:
( )1,..., ;KY f X X ε= , (1.1)
gdzie:
Y – zmienna objaśniana (endogeniczna) reprezentująca zjawisko modelowane;
1,..., KX X – zmienne objaśniające (egzogeniczne);
ε – zmienna losowa (tzw. zakłócenie losowe);
f – postać analityczna modelu;
K – liczba zmiennych objaśniających ( 1,...,j K= ).
15
Ponieważ równanie (1.1) zawiera składnik losowy, model ekonometryczny ma cechy
modelu stochastycznego. Oznacza to, iż wnioskowanie na podstawie oszacowanych
parametrów będzie miało charakter przybliżony.
Natomiast pominięcie składnika losowego w modelu pozwala go zapisać w tak zwanej
postaci deterministycznej:
( )1,..., KY f X X= , (1.2)
gdzie Y – zmienna zależna,
1,..., KX X – zmienne niezależne.
Otóż ze względu na udział czynnika losowego w modelach ekonometrycznych
możemy je podzielić na:
� modele stochastyczne,
� modele deterministyczne.
Modele stochastyczne najczęściej wykorzystywane są do opisu zjawisk sfery
ekonomicznej i społecznej. Natomiast modele deterministyczne występują zwykle w
modelach opisujących współzależności zjawisk fizycznych i chemicznych.
1.3.4. Modele liniowe i nieliniowe
Uwzględniając postać analityczną opisującą badane zjawisko, modele ekonometryczne można
podzielić na kolejne dwie grupy:
� modele liniowe,
� modele nieliniowe.
Liniowy model ekonometryczny możemy zapisać w takiej ogólnej postaci:
0 0 1 1 2 2 ... K KY X X X Xα α α α ε= + + + + + , (1.3)
gdzie: 0 1 2, , ,..., Kα α α α – parametry strukturalne modelu, które należy oszacować;
Y – zmienna objaśniana;
1,..., KX X – zmienne objaśniające;
ε – zmienna losowa;
K – liczba zmiennych objaśniających ( 1,...,j K= ).
Natomiast nieliniowych postaci modeli ekonometrycznych jest nieskończenie wiele.
Bardzo często dla przykładu modelu nieliniowego posługuje się postacią potęgową typu:
16
1 20 1 2 ... tK
KY X X X eεα α αα= ⋅ ⋅ ⋅ ⋅ ⋅ , (1.4)
gdzie: e – stała (liczba Eulera).
Wybór postaci modelu ekonometrycznego odgrywa bardzo ważną rolę, gdyż
przesądza on skuteczność wykorzystania zbudowanego modelu w przyszłości do celów
praktycznych, między innymi do budowania prognoz badanego zjawiska ekonomicznego.
Wśród modeli nieliniowych wyróżniamy dwie podgrupy:
� modele, które można transformować do postaci liniowej (czyli linearyzować),
� modele, których linearyzować się nie da.
1.3.5. Modele przyczynowo-skutkowe, symptomatyczne i modele tendencji rozwojowej
Z punktu widzenia ogólnopoznawczych właściwości modeli ekonometrycznych możemy je
podzielić na [17]:
o modele przyczynowo-opisowe,
o modele tendencji rozwojowej,
o modele symptomatyczne.
Modele przyczynowo-opisowe stanowią grupę odgrywającą zasadniczą rolę wśród
wszystkich modeli ekonometrycznych. W modelach tych rolę przyczyn pełnią zmienne
objaśniające, które opisują zmienną objaśnianą Y . Zatem zmienna objaśniana odgrywa rolę
skutku. Wśród tej klasy spotykamy zarówno modele statyczne, jak i dynamiczne.
Drugą co do ważności grupę modeli podzielonych według kryterium walorów
poznawczych stanowią modele tendencji rozwojowej. Modele te opisują ilościowe zmiany
zmiennej objaśnianej ( tY ) zachodzące w czasie. Stąd jedyną zmienną objaśniającą jest w tym
przypadku zmienna czasowa t . Zmienna ta przybiera kolejne wartości liczb całkowitych
zwiększające sie o jeden w miarę następowania kolejnych okresów czasu (lat, kwartałów,
miesięcy, dni, godzin etc.). Zatem w modelach tych nie występują żadne więzi przyczynowo-
skutkowe, właściwe modelom przyczynowo-opisowym. W opisie wahań zmiennej
objaśnianej za pomocą modelu tendencji rozwojowej można wyodrębnić trzy elementy [4]:
1) trend – ( )f t ,
2) wahania regularne (cykliczne) – ( )g t ,
3) wahania losowe – tε .
17
Zatem model tendencji rozwojowej można zapisać w następującej ogólnej postaci:
( ) ( ), , tY F f t g t ε = (1.5)
Pomijając klasę modeli tendencji rozwojowej, we wszystkich pozostałych
przypadkach – przy budowie modelu – zawsze staramy się o to, by między zmienną
objaśnianą a zmiennymi objaśniającymi zachodził związek przyczynowy. Są jednak sytuacje,
kiedy nie można spełnić tego postulatu. Na przykład może się zdarzyć, iż brak jest
odpowiednich danych o wytypowanych zmiennych objaśniających do modelu przyczynowo-
opisowego. Wówczas można wykorzystać przypadek, w którym interesująca nas zmienna
endogeniczna jest silnie skorelowana z inną lub innymi zmiennymi bez zaistnienia związku
przyczynowego. Zatem model, w którym zmienne objaśniające nie pozostają w związku
przyczynowym ze zmienną objaśnianą, są jedynie silnie z nią skorelowane, jest modelem
symptomatycznym. Modele symptomatyczne spełniają marginalną rolę wśród modeli
ekonometrycznych ze względu na rzadkość ich stosowania. Stanowią rezerwę na przypadek
braku możliwości budowania modeli przyczynowo-opisowych; mogą być wykorzystywane
do celów predykcji [4, s. 19].
1.3.6. Etapy budowania modelu
Według wielu autorów proces modelowania ekonometrycznego składa się z następujących
etapów (por. rys. 1.2):
� ustalenie celu i zakresu badań ekonometrycznych;
� zbieranie danych statystycznych;
� specyfikacja modelu (ustalenie zmiennych objaśniających
i postaci matematycznej modelu);
� estymacja (szacowanie parametrów modelu);
� weryfikacja modelu (sprawdzanie), praktyczne wykorzystanie modelu.
Celem modelowania ekonometrycznego jest zwykle badane zjawisko gospodarcze,
opisywane przez zmienną objaśnianą Y . W modelach wielorównaniowych natomiast mamy
szereg takich zmiennych (np. 1,..., nY Y ) opisujących kilka zjawisk jednocześnie.
Zakres badań z kolei wyznacza granicy czasowe obserwacji (w modelach
dynamicznych) lub jeden konkretny moment czasu, w którym badane będzie zjawisko
gospodarcze (w modelach statycznych), a także ustala obiekty przestrzenne, w których
dokonuje się obserwacji (np. przedsiębiorstwa, regiony, państwa).
18
Na drugim etapie dokonuje się zbierania danych statystycznych, które posłużą
szacowaniu parametrów modelu. Dane powinny być w miarę rzetelne, kompletne i liczne,
gdyż im większa liczba obserwacji tym większa dokładność szacowania parametrów modelu.
Rys. 0.2 Etapy budowania modelu ekonometrycznego Źródło: opracowanie własne na podstawie [17]
Specyfikacja modelu wymaga ustalenia optymalnej ilości zmiennych objaśniających
oraz doboru odpowiedniej postaci analitycznej modelu. W celu ustalenia zbioru zmiennych
objaśniających należy najpierw uwzględnić wiedzę płynącą z osiągnięć teorii ekonomii. Przy
potrzebie można także wykorzystać statystyczne metody wyboru zmiennych objaśniających.
Następnie wybiera się postać analityczna modelu (liniowa, nieliniowa, o jednej lub o wielu
zmiennych).
Estymacja modelu przewiduje szacowanie parametrów strukturalnych modelu oraz
szacowanie parametrów jego struktury stochastycznej. Szacowania parametrów równania
Czy weryfikacja modelu przeszła
pomyślnie?
ustalenie celu i zakresu badań
zbieranie danych
specyfikacja modelu
estymacja modelu
wykorzystanie modelu
tak
nie
weryfikacja modelu
19
opisującego zjawisko gospodarcze dokonuje się na podstawie zebranych danych
statystycznych w drodze porównania modelowanego zjawiska z rzeczywistym procesem
ekonomicznych. Z kolei szacowanie parametrów struktury stochastycznej jest sprawdzaniem
jakości zbudowanego modelu.
Weryfikacja modelu sprowadza się do merytorycznego sprawdzania parametrów
strukturalnych tzn. czy parametry strukturalne przyjmują rozsądne wartości i czy znaki przy
ocenach są zgodne ze wskazaniami teorii ekonomii. Na tym etapie również dokonuje się
kontroli dokładności oszacowania, która to kontrola obejmuje analizę kilku parametrów
struktury stochastycznej, co pozwala ustalić, czy błędy estymacji nie przekraczają ustalonego
poziomu, a także czy oceny parametrów strukturalnych są statystycznie istotne. Jeśli
stwierdzimy na tym etapie istotne nieprawidłowości, to należy powrócić do etapu czwartego
(estymacji modelu).
W praktyce model ekonometryczny może być wykorzystany w celu analizy relacji
zachodzących w przeszłości i formułowania płynących stąd wniosków, do prognozowania
wielkości opisanego przez model zjawiska oraz do symulacji różnych sytuacji zarówno w
przedsiębiorstwie, jak i na rynku.
1.4. Modele liniowe
Podstawowym i zarazem najprostszym modelem ekonometrycznym jest jednorównaniowy
model liniowy postaci:
0 0 1 1 2 2 ... K KY X X X Xα α α α ε= + + + + + , (1.6)
gdzie Y – zmienna objaśniana,
0,..., KX X – zmienne objaśniające,
0,..., Kα α – współczynniki regresji liniowej,
ε – zmienna losowa.
Należy zaznaczyć, że w modelu tym zależność zmiennej objaśnianej Y od zmiennych
objaśniających 0,..., KX X ma charakter liniowy, tzn. funkcja Y jest liniową.
Współczynniki jα ( 0,...,j K= ) nazywane także parametrami strukturalnymi modelu
charakteryzują ilościowy i jakościowy wpływ zmiennych objaśniających na zmienną
objaśnianą. Przy czym pierwsza ze zmiennych objaśniających 0α (nazywana wyrazem
wolnym modelu lub stałą regresji) jest definiowana jako tożsamościowo równa jedności
20
( 0 1X ≡ ). Podstawowym zadaniem w modelowaniu ekonometrycznym jest oszacowanie
parametrów 0,..., Kα α na podstawie danych statystycznych charakteryzujących zmienną
objaśnianą i zmienne objaśniające.
1.4.1. Postać modelu regresji liniowej
Dysponując n-elementowymi ciągami obserwacji na wszystkich tych zmiennych (objaśnianej
i objaśniających), a więc ciągiem wektorów ( 1, ,...,t t tKy x x ) ( 1,...,t n= ), każdą realizację ty
zmiennej objaśnianej Y możemy, zgodnie z założonym modelem, przedstawić jako sumę:
kombinacji liniowej 0 1 1 ...t K tKx xα α α+ + + odpowiednich realizacji zmiennych objaśniających
oraz nieobserwowalnej realizacji tε składnika losowego ε [17].
Zatem dla wszystkich obserwacji otrzymujemy układ:
1 0 1 11 2 12 1 1
2 0 1 21 2 22 2 2
0 1 1 2 2
...
...
............................................................
...
K K
K K
n n n K nK n
y x x x
y x x x
y x x x
α α α α εα α α α ε
α α α α ε
= + + + + += + + + + +
= + + + + +
.
Układ ten w symbolice macierzowo-wektorowej można zapisać jako:
= +y Xα ε , (1.7)
gdzie:
1
2
n
y
y
y
=
yM
,
11 1
21 2
1
1
1
1
K
K
n nK
x x
x x
x x
=
X
L
L
M M M M
L
,
0
1
K
αα
α
=
α
M,
1
2
n
εε
ε
=
ε
M.
wektor obserwacji na macierz obserwacji na wektor parametrów wektor składników
zmiennej objaśnianej zmiennych objaśniających strukturalnych losowych
Zapis (1.6) możemy nazwać postacią strukturalną jednorównaniowego liniowego
modelu ekonometrycznego, natomiast zapis (1.7) nazywamy postacią strukturalno-
statystyczną tegoż modelu.
21
1.4.2. Wybór zmiennych objaśniających do modelu ekonometrycznego
Wybór zmiennych objaśniających do modelu ekonometrycznego opiera się zarówno na
wiedzy ekonomicznej, jak i matematyczno-statystycznej.
Przed wyborem potencjalnych zmiennych objaśniających należy wytypować
wszystkie zmienne objaśniające, które mogą mieć wpływ na badane zjawisko gospodarcze. W
tym procesie może być pomocna wiedza z zakresu teorii ekonomii, finansów, marketingu etc.
dotycząca badanego zjawiska. Ze zbioru wytypowanych zmiennych objaśniających należy
wyeliminować te zmienne, które mają charakter niemierzalny, których brak jest danych lub
kompletnych danych i te, które charakteryzują się małą zmiennością, a więc w niewielkim
stopniu oddziałują na badane zjawisko, a tym samym na zmienną objaśnianą.
Następnym etapem będzie wybór właściwych zmiennych objaśniających przy
wykorzystaniu metod statystycznych, które opierają się na założeniu, że zmienne objaśniające
uwzględnione w modelu powinny być stosunkowo silnie skorelowane ze zmienną objaśnianą
oraz nieskorelowane lub słabo skorelowane z pozostałymi zmiennymi objaśniającymi
uwzględnionymi w modelu. W tym celu należy obliczyć współczynniki korelacji między
zmienną objaśnianą i potencjalnymi zmiennymi objaśniającymi, a także współczynniki
korelacji między parami potencjalnych zmiennych objaśniających.
Obliczone współczynniki korelacji zestawia się zwykle w postaci wektora 0R
(wektora współczynników korelacji zmiennej endogenicznej z potencjalnymi zmiennymi
objaśniającymi) i macierzy R (macierz współczynników korelacji pomiędzy parami
zmiennych objaśniających; macierz R jest symetryczna):
01
020
0L
r
r
r
=
RM
,
12 1
21 2
1 2
1
1
1
L
L
L L
r r
r r
r r
=
R
L
L
M M M M
L
, (1.8)
gdzie 0 jr – współczynniki korelacji między zmienną objaśnianą i zmiennymi objaśniającymi
( 1,2,...,j L= ),
L – liczbą potencjalnych zmiennych objaśniających,
ijr – współczynniki korelacji między zmiennymi objaśniającymi ( 1,2,...,j L= ).
Przy czym współczynnik korelacji zmiennej z nią samą jest równy 1 ( 1iir = ) oraz
występuje symetria współczynników typu ij jir r= .
22
Spośród wielu metod statystycznych wykorzystywanych w celu wyboru właściwych
zmiennych objaśniających omówimy metodę Hellwiga oraz metodę analizy grafów.
Metoda pojemności informacyjnej Hellwiga
Metoda ta jest zwana metodą pojemności informacyjnej bądź metodą pojemności nośników
informacji, w której to metodzie potencjalne zmienne objaśniające są nośnikami informacji.
Na początku ze wstępnie wytypowanych L zmiennych objaśniających tworzy się
kombinacje jedno-, dwu-, L -elementowe. Liczba wszystkich możliwych kombinacji jest
równa 2 1L − . Potem dla każdej zmiennej w każdej kombinacji oblicza się indywidualną
pojemność nośnika informacji ( kjh ) według wzoru [17]:
20
k
jkj
iji I
rh
r∈
=∑
, (1.9)
gdzie: kjh – indywidualna pojemność j -tej zmiennej w k -tej kombinacji,
0 jr – współczynnik korelacji j -tej potencjalnej zmiennej objaśniającej
ze zmienną objaśnianą,
{ };k i kI i X K= ∈ – zbiór indeksów (numerów) zmiennych wchodzących
w skład k -tej kombinacji, tj. kombinacji kK ,
k
iji I
r∈∑ – suma wartości bezwzględnych współczynników korelacji j -tej
zmiennej z pozostałymi zmiennymi występującymi z nią w danej kombinacji.
Dla każdej kombinacji zmiennych objaśniających oblicza się integralną (łączną)
pojemność nośników informacji kH jako sumę pojemności indywidualnych zmiennych
objaśniających występujących w danej kombinacji:
k kjj
H h=∑ . (1.10)
Jako zmienne objaśniające do modelu wybiera się tę ich kombinację, dla której
pojemność integralna H przyjmuje wartość największą (przy czym kjh ; [ ]0,1kH ∈ , tzn.
zarówno pojemności indywidualne, jak i integralne przyjmują wartości z przedziału [ ]0,1 ).
23
Przykład 1.1.
Badanych jest 8 przedsiębiorstw wytwarzających jogurty. Budowany będzie model
kosztów całkowitych przedsiębiorstwa (Y ) w zależności od wielkości jego produkcji ( 1X )
oraz zawartości wsadu owocowego w jogurcie (2X ).
Przedsiębiorstwo ( t )
Y [mln zł] 1X [mln ton] 2X [%]
1 9.89 1.67 48.3 2 10.78 2.78 47.2 3 12.44 3.33 43.3 4 15.39 6.11 40.6 5 15.72 6.67 46.1 6 17.06 6.66 45.0 7 19.06 8.33 40.5 8 19.44 8.89 44.4 ∑ 119.78 44.44 355.4
Źródło: obliczenia własne
Obliczymy współczynnik korelacji zmiennych objaśniających ze zmienną objaśnianą:
( ) ( )
( ) ( )
8
1 11
01 8 82 2
1 11 1
t tt
t tt t
y y x xr
y y x x
=
= =
− ⋅ −=
− ⋅ −
∑
∑ ∑
; ( ) ( )
( ) ( )
8
2 21
02 8 82 2
2 21 1
t tt
t tt t
y y x xr
y y x x
=
= =
− ⋅ −=
− ⋅ −
∑
∑ ∑
;
( ) ( )
( ) ( )
8
1 1 2 21
12 8 82 2
1 1 2 21 1
t tt
t tt t
x x x xr
x x x x
=
= =
− ⋅ −=
− ⋅ −
∑
∑ ∑
;
Dla ułatwienia poszczególnych obliczeń obliczymy oddzielnie elementy ze wzorów na
01r oraz 02r i zapiszemy je w postaci tabelek. Wartości średnie obliczyć można za pomocą
wzorów:
8
1 119.7814.97
8 8
tt
yy == = =
∑;
8
11
1
44.445.55
8 8
tt
xx == = =
∑;
8
21
2
355.444.43
8 8
tt
xx == = =
∑;
24
ty y− 1 1tx x− ( ) ( )1 1t ty y x x− ⋅ − ( )2
ty y− ( )2
1 1tx x−
-5.08 -3.88 19.71 25.81 15.05 -4.19 -2.77 11.61 17.56 7.67 -2.53 -2.22 5.62 6.40 4.93 0.42 0.56 0.24 0.18 0.31 0.75 1.12 0.84 0.56 1.25 2.09 1.11 2.32 4.37 1.23 4.09 2.78 11.37 16.73 7.73 4.47 3.34 14.93 19.98 11.16 Suma 66.64 91.59 49.33 Źródło: obliczenia własne
( ) ( )
( ) ( )
8
1 11
01 8 82 2
1 11 1
66.64 66.64 66.640.99
67.2291.59 49.33 4518.14
t tt
t tt t
y y x xr
y y x x
=
= =
− ⋅ −= = = = ≈
⋅− ⋅ −
∑
∑ ∑
;
ty y− 2 2tx x− ( ) ( )2 2t ty y x x− ⋅ − ( )2
ty y− ( )2
2 2tx x−
-5.08 3.87 -19.66 25.81 14.98 -4.19 2.77 -11.61 17.56 7.67 -2.53 -1.13 2.52 6.40 1.28 0.42 -3.83 -1.61 0.18 14.67 0.75 1.67 1.25 0.56 2.79 2.09 0.57 1.19 4.37 0.33 4.09 -3.93 -16.07 16.73 15.44 4.47 0.01 0.04 19.98 0.00 Suma -43.95 91.59 57.16 Źródło: obliczenia własne
( ) ( )
( ) ( )
8
2 21
02 8 82 2
2 21 1
43.95 43.95 43.950.61
72.3691.59 57.16 5235.28
t tt
t tt t
y y x xr
y y x x
=
= =
− ⋅ −− − −= = = = ≈ −
⋅− ⋅ −
∑
∑ ∑
.
Korzystając z poprzedniej metody obliczymy również współczynnik korelacji między
zmiennymi objaśniającymi.
25
1 1tx x− 2 2tx x− ( ) ( )1 1 2 2t tx x x x− ⋅ − ( )2
1 1tx x− ( )2
2 2tx x−
-3.88 3.87 -15.02 15.05 14.98 -2.77 2.77 -7.67 7.67 7.67 -2.22 -1.13 2.51 4.93 1.28 0.56 -3.83 -2.14 0.31 14.67 1.12 1.67 1.87 1.25 2.79 1.11 0.57 0.63 1.23 0.33 2.78 -3.93 -10.93 7.73 15.44 3.34 0.01 0.03 11.16 0.00 Suma -30.72 49.33 57.16
Źródło: obliczenia własne
( ) ( )
( ) ( )
8
1 1 2 21
12 8 82 2
1 1 2 21 1
30.72 30.72 30.720.58
53.1049.33 57.16 2819.70
t tt
t tt t
x x x xr
x x x x
=
= =
− ⋅ −− − −= = = = ≈ −
⋅− ⋅ −
∑
∑ ∑
.
Otóż mamy trzy współczynniki korelacji: 01 0.99r = , 02 0.61r = − , 12 21 0.58r r= = − .
Można to zapisać również w takiej postaci:
010
02
0.99
0.61
r
r
= = −
R ; 12
21
1 1 0.58
1 0.58 1
r
r
− = = −
R .
Teraz możemy przystąpić do wyboru optymalnej kombinacji zmiennych
objaśniających w modelu. W tym celu zastosujemy metodę Hellwiga.
Mając dwie zmienne objaśniające możemy utworzyć ( )2 1L − kombinacji, gdzie L –
liczba potencjalnych zmiennych objaśniających. Dla 2L = liczba kombinacji wynosi
( )22 1 4 1 3− = − = . Będą to następujące kombinacje:
1) { }1 1K X= ,
2) { }2 2K X= ,
3) { }3 1 2,K X X= .
Dla każdej z tych kombinacji obliczymy integralne pojemności nośników informacji:
1) dla kombinacji 1K :
2 201
11
0.990.9801
1 1
rh = = = ,
1 11 0.9801H h= = ,
26
2) dla kombinacji 2K :
( )2202
22
0.610.3721
1 1
rh
−= = = ,
2 22 0.3721H h= = ,
3) dla kombinacji 3K :
2 201
3112
0.990.6203
1 1 0.58
rh
r= = =
+ + −,
( )2202
3221
0.610.2355
1 1 0.58
rh
r
−= = =
+ + −,
3 31 32 0.6203 0.2355 0.8558H h h= + = + = .
Z obliczeń wynika, że największą integralną pojemność informacji ma kombinacja
pierwsza, co oznacza, że do wyjaśnienia zmienności kosztów całkowitych produkcji jogurtów
wystarczy uwzględnić tylko wielkość produkcji (zmienną 1X ).
Metoda analizy grafów
Metoda analizy grafów, jak i poprzednia metoda, opiera się na założeniu, że zmienne
objaśniające powinny być silnie skorelowane ze zmienną objaśnianą i słabo skorelowane
między sobą. W metodzie tej na początku dokonuje się weryfikacji statystycznej istotności
współczynników korelacji między potencjalnymi zmiennymi objaśniającymi ijr . Dla każdego
ze współczynników należy zweryfikować hipotezę [17]:
0 : 0ijH r = dla i j≠ wobec hipotezy alternatywnej 1 : 0ijH r ≠ .
W tym celu obliczana jest wartość statystyki:
2
2
1
ij
ij
r nt
r
−=
−, (1.11)
którą porównuje się z wartością krytyczną tα . Wartości krytyczne można odczytać z tablic
rozkładu t Studenta (Aneks A) dla przyjętego poziomu istotności α oraz 2n− stopni
swobody, przy czym n oznacza liczbę obserwacji, na podstawie których obliczono
współczynniki korelacji. Stwierdzenie, że t tα≤ nie daje podstaw do odrzucenia hipotezy
27
zerowej, a więc świadczy, że współczynnik korelacji między zmiennymi jest statystycznie
nieistotny.
Często w praktyce obliczany jest modyfikowany współczynnik korelacji r ∗ :
( )( ) 2
2
1 2 2
t n tr
t n n tα α
α α
∗ −= =
+ − − + , (1.12)
którego wartość porównuje się z rzeczywistą wartością współczynnika korelacji ijr . W
przypadku, gdy ijr r ∗≤ uznaje się, że związek pomiędzy zmiennymi jest statystycznie
nieistotny i w macierzy R wartości ijr zastępuje zerami. W ten sposób otrzymuje się macierz
′R , której elementami są zera i statystycznie istotne współczynniki korelacji.
Otrzymana macierz ′R jest podstawą budowy grafu powiązań między zmiennymi.
Wierzchołkami grafu są potencjalne zmienne objaśniające, a łączącymi je krawędziami –
statystycznie istotne współczynniki korelacji.
W rezultacie można otrzymać graf spójny lub graf składający się z podgrafów
spójnych i tzw. wierzchołków izolowanych, czyli wierzchołków (zmiennych), które nie
połączyły się z innymi.
Zasadą jest, że do modelu wybiera się tyle zmiennych, w ile grup połączyły się
potencjalne zmienne objaśniające. Będą to wszystkie wierzchołki izolowane oraz jedna
zmienna z każdego podgrafu spójnego, która ma najwyższy rząd wierzchołka (czyli jest
powiązana – istotnie skorelowana – z największą liczbą potencjalnych zmiennych
objaśniających, a więc będzie reprezentować je wszystkie). Jeżeli więcej niż jeden
wierzchołek ma ten sam, najwyższy rząd, to wybiera się tę zmienną, która jest najsilniej
skorelowana ze zmienną endogeniczną (objaśnianą) i dopiero wówczas korzystamy z
informacji zawartych w wektorze 0R [17].
Przykład 1.2.
Na podstawie danych z 30 obserwacji (30n = ) zmiennej objaśnianej Y i 8
potencjalnych zmiennych objaśniających ( 1 2 3 4 5 6 7 8, , , , , , ,X X X X X X X X) obliczono
następujące współczynniki korelacji:
28
0
0.47
0.54
0.66
0.78
0.50
0.69
0.74
0.58
− − − = − −
R ,
1 0.33 0.40 0.28 0.17 0.26 0.36 0.34
1 0.19 0.35 0.23 0.62 0.29 0.31
1 0.32 0.24 0.32 0.19 0.51
1 0.38 0.18 0.22 0.18
1 0.31 0.34 0.28
1 0.35 0.26
1 0.20
1
− − − − − − − − − = −
−
R .
Wykorzystując metodę grafów, wybierzemy optymalną kombinację zmiennych
objaśniających do modelu ekonometrycznego. W tym celu zbadamy statystyczną istotność
otrzymanych współczynników korelacji korzystając ze wzoru (12).
Na początku musimy odczytać wartość krytyczną statystyki t z tablic rozkładu t
Studenta (Aneks A) dla poziomu istotności 0.05α = oraz 2 30 2 28n− = − = stopni swobody.
Wartość ta wynosi 2.0484 (0,05;28 2.0484t = ). Zatem
2
2
2.0484 4.200.13 0.36
30 2 2.0484 28 4.20r ∗ = = = ≈
− + +.
To znaczy, że współczynniki korelacji, których wartość absolutna jest mniejsza lub
równa r ∗ ( 0.36ijr ≤ ) uznajemy za statystycznie nieistotnie różniące się od zera i w macierzy
R zastępujemy zerami. W rezultacie otrzymujemy macierz:
1 0 0.40 0 0 0 0 0
1 0 0 0 0.62 0 0
1 0 0 0 0 0.51
1 0.38 0 0 0
1 0 0 0
1 0 0
1 0
1
− − ′ =
R .
Na podstawie danej macierzy możemy zbudować graf powiązań między zmiennymi
objaśniającymi (rys. 1.3).
29
Rys. 0.3. Graf powiązań między zmiennymi objaśniającymi
Potencjalne zmienne połączyły się w cztery grupy, co oznacza, że do naszego modelu
wystarczy wybrać cztery zmienne objaśniające.
Z pierwszego podgrafu (1 3 8, ,X X X ) wybieramy zmienną 3X ze względu na to, że ona
wniesie do modelu także informacje o zmiennych 1X i 8X . Wierzchołek 3X ma najwyższy
rząd.
Z drugiego podgrafu ( 2 6,X X ) widać, że obydwa wierzchołki mają taki sam rząd. W
tej sytuacji należy wybrać tą zmienną objaśniającą, która jest silniej skorelowana ze zmienną
Y . Jest to zmienna 6X .
Na podobnych zasadach dokonujemy wyboru właściwej zmiennej z podgrafu
trzeciego, czyli ( 4 5,X X ). Ze względu na to, że 04 05r r> wybieramy 4X .
Czwartą zmienną objaśniającą będzie 7X , która nie jest w sposób istotny skorelowana
z żadną inną zmienną objaśniającą, tzn. informacje, które ona niesie w sobie nie zostaną
wniesione do modelu przez inne zmienne objaśniające.
Podsumowując nasze rozważania możemy zaproponować uwzględnienie w modelu
ekonometrycznym następujących zmiennych: 3X , 4X , 6X i 7X , czyli będzie to model
( )3 4 6 7, , ,Y f X X X X= .
X1 X3
X8 X6
X2
X5
X4 X7
30
1.4.3. Estymacja modelu
Założenia klasycznego modelu regresji liniowej Wiadomo, że każdy model jest uproszczeniem rzeczywistości. Dlatego zawiera on pewny
zestaw założeń. Model liniowy w zapisie macierzowo-wektorowym wraz z założeniami
można zapisać następująco [15, s. 215-216]:
1. 1 11 n k k nn × × ××
= ⋅ +y X α ε (każda obserwacja ty jest liniową funkcją obserwacji tjx oraz składnika
losowego tε , czyli model, którego parametry szacujemy, jest modelem liniowym).
2. X jest macierzą nielosową, zatem zmienne objaśniające są zmiennymi nielosowymi
(ustalonymi w powtarzalnych próbach; dla każdego 1,...,t n= na poziomie 1,...,t tKx x ).
3. ( )rz 1K n= + <X (tzn. macierz X ma pełny rząd kolumnowy); wektory wartości
poszczególnych zmiennych objaśniających (kolumny macierzy X ) są liniowo
niezależne (nie występuje współliniowość zmiennych objaśniających); liczba
zmiennych objaśniających (ze stałą 1) jest mniejsza od liczby obserwacji.
4. ( )1n×
=E ε 0 – składnik losowy ma wartość oczekiwaną równą zeru (czyli zakłócenia
różnokierunkowe kompensują się).
5. Macierz wariancji i kowariancji składników losowych jest równa:
( ) ( )T 2nσ= =V ε E εε I , gdzie 20 σ≤ < +∞ ,
co oznacza, że:
• 2 2tEε σ= – wariancja składnika losowego jest stała dla wszystkich obserwacji
(dla każdego t ); własność ta nazywana jest jednorodnością, stałością lub homo-
skedatycznością wariancji,
• 0t sEε ε = dla wszystkich s t≠ – składniki losowe poszczególnych obserwacji są
nieskorelowane (nie występuje autokorelacja składników losowych).
Zestaw założeń 1-5 nazywamy klasycznym modelem regresji liniowej (KMRL).
Jeśli dodamy założenie:
6. nNε ∼ (składnik losowy ε ma n -wymiarowy rozkład normalny),
to otrzymamy zestaw założeń 1-6, nazywany klasycznym modelem normalnej regresji
liniowej (KMNRL).
31
Klasyczna metoda najmniejszych kwadratów
Jak już wspominaliśmy, estymacja modelu polega na oszacowaniu parametrów
strukturalnych, parametrów rozkładu składnika losowego i innych miar dopasowania modelu
do obserwacji.
Dla obserwacji zmiennej objaśnianej Y ( ; 1,...,ty t n= ) i K zmiennych objaśniających
1,..., KX X ( 1,..., ; 1,...,t tKx x t n= ) należy ustalić model typu (1.6), dla którego suma kwadratów
odchyleń danych obserwacji od danych, obliczonych zgodnie z modelem, jest najmniejsza.
Wówczas model taki będą wyznaczały wartości teoretyczne ˆty , w których nieznane
parametry ( 0,..., Kα α ) zastąpiono ich ocenami (0,..., Ka a ) [17]:
0 1 1 2 2ˆ ...t t t K tKy a a x a x a x= + + + + , (1.13)
a odchylenia wartości teoretycznych od danych obserwacji stanowią reszty ( te ):
ˆt t te y y= − . (1.14)
Zatem funkcję kryterium Metody Najmniejszych kwadratów (MNK) można zapisać
skalarnie [17]:
( ) ( )
( )
0 0
0
20 ,..., ,...,
1 1
2
0 1 1 2 2,...,1
ˆ,..., min min
min ...
K K
K
n n
K t t ta a a a
t t
n
t t t K tKa at
S a a e y y
y a a x a x a x
= =
=
= = − =
= − − − − −
∑ ∑
∑
(1.15)
Po obliczeniu pochodnych cząstkowych funkcji ( )0,..., KS a a względem szukanych
ocen parametrów, przyrównania tych pochodnych do zera (warunek konieczny istnienia
ekstremum) i pewnych przekształceniach, otrzymamy (znany ze statystyki) układ równań
normalnych:
1 1 2 2
21 0 1 1 1 2 1 2 1
22 0 2 1 1 2 2 2 2
...
...
...
...............................................................................
t t t K tK
t t t t t t K t tK
t t t t t t K t tK
y na a x a x a x
y x a x a x a x x a x x
y x a x a x x a x a x x
= + + + +
= + + + +
= + + + +
∑ ∑ ∑ ∑
∑ ∑ ∑ ∑ ∑
∑ ∑ ∑ ∑ ∑
20 1 1 2 2
.............
...t tK tK t tK t tK K tKy x a x a x x a x x a x= + + + +∑ ∑ ∑ ∑ ∑
, (1.16)
którego rozwiązaniem są szukane oceny parametrów.
32
Klasyczna metoda najmniejszych kwadratów w zapisie macierzowym
W zapisie macierzowym – dla modelu (7) – = +y Xa ε wektor wartości teoretycznych
można zapisać jako ˆ =y Xa , a wektor reszt jako ˆ= −e y y , gdzie:
1
2
ˆ
ˆˆ
ˆn
y
y
y
=
yM
,
0
1
K
a
a
a
=
aM
,
1
2
n
e
e
e
=
eM
,
przy czym a jest szukanym wektorem ocen parametrów strukturalnych.
Kryterium MNK – minimalizacja sumy kwadratów reszt ma postać [17]:
( ) ( ) ( )TTmin minS = = −a a
a e e y - Xa y Xa (1.17)
i po dalszych przekształceniach:
( ) T T T T T2S = − +a y y a X y a X Xa .
Pochodną funkcji kryterium ( )S a względem szukanego wektora a przyrównujemy do zera:
( ) T T2 2S∂
= − + =∂
aX y X Xa 0
a.
Przekształcając dalej, otrzymujemy układ równań normalnych (w zapisie macierzowym):
T T T T2 2= ⇔ =X Xa X y X Xa X y ,
którego rozwiązaniem jest szukany wektor ocen parametrów strukturalnych:
( ) 1T T−=a X X X y . (1.18)
( )2T
22
S∂=
∂a
X Xa
jest macierzą określoną dodatnio, zatem spełniony jest też warunek
dostateczny istnienia minimum funkcji ( )S a , a także istnieje ( ) 1T −X X .
Twierdzenie Gaussa-Markowa
W klasycznym modelu regresji liniowej najlepszym, nieobciążonym estymatorem liniowym
wektora a jest wektor otrzymany metodą najmniejszych kwadratów [17]:
( ) 1T T−=a X X X y
o macierzy wariancji i kowariancji ( ) ( ) 12 Tσ−
=V a X X .
33
W KMNRL estymator MNK ma k -wymiarowy rozkład normalny, tj.
( )( )12 T,kN σ−
a α X X∼ .
Nieobciążonym estymatorem wariancji składnika losowego 2σ jest wariancja
resztowa 2eS . Wzór dla 2
eS można zapisać w takiej postaci macierzowej:
( ) ( ) ( ) ( )
( )
T T2 T
T T T
1 1 1ˆ ˆ
1
eSn k n k n k
n k
= = − − = − − =− − −
= −−
ε ε y y y y y Xa y Xa
y y a X y (1.19)
gdzie:
n – liczba obserwacji,
k – liczba szacowanych parametrów strukturalnych ( 1k K= + ),
n k− – liczba stopni swobody,
y Xa= – wektor wartości teoretycznych,
ˆe y y= − – wektor reszt.
Natomiast w postaci skalarnej 2eS można obliczyć za pomocą wzoru:
2 2
1
1 K
e tt
S en k =
=− ∑ . (1.20)
Pierwiastek kwadratowy z wariancji resztowej nazywamy odchyleniem
standardowym resztowym. Obliczamy go za pomocą prostego wzoru:
2e eS S= (1.21)
Odchylenie standardowe resztowe informuje nas o ile średnio wartości teoretyczne zmiennej
objaśnianej ˆty różnią się od jej wartości empirycznych ty .
Macierz wariancji i kowariancji ocen parametrów strukturalnych
Nieobciążonym estymatorem macierzy wariancji i kowariancji estymatora MNK, tj. macierzy
( ) ( ) 12 Tσ−
=V a X X jest macierz wariancji i kowariancji ocen parametrów
strukturalnych [17]:
( ) ( ) 12 2 TeS
−= ⋅D a X X . (1.22)
34
Pierwiastek kwadratowy z j -tego elementu diagonalnego macierzy ( )2D a
(oznaczamy go symbolem ( )jD a ) nazywamy błędem średnim szacunku oceny ja .
Informuje on o ile średnio wyznaczona metodą najmniejszych kwadratów ocena ja może
różnić sie od rzeczywistej wartości parametru jα . Innymi słowy, błąd średni szacunku oceny
ja jest indykatorem precyzji oszacowania danego współczynnika regresji.
Oznaczmy elementy macierzy ( ) 1T −X X przez ijd . Wówczas przez
( ) 2j jjV a dσ=
będziemy oznaczać wariancję j -tego parametru regresji, przez
( )2 2j e jjD a S d=
będziemy oznaczać ocenę wariancji j -tego parametru regresji, natomiast przez
( ) 2 2j e jj e jjD a S d S d= ⋅ =
będziemy oznaczać ocenę błędu średniego szacunku j -tego parametru regresji.
Współczynniki dopasowania modelu do danych obserwacji
W celu dokonania oceny dokładności dopasowania opracowanego modelu do danych
obserwacji oblicza się szereg współczynników. Mianowicie, należy obliczyć współczynnik
zmienności resztowej eV , współczynnik zbieżności 2ϕ oraz współczynnik determinacji 2R .
Do obliczenia w/w współczynników służą wzory [17]:
100ee
SV
y= ⋅ , (1.23)
( )( )
( )
22
2 1
2 2
1 1
n
tet
n n
t tt t
en k S
y y y yϕ =
= =
−= =
− −
∑
∑ ∑
, (1.24)
gdzie ( ) ( )22 2 1t t ty y y y
n− = −∑ ∑ ∑ , (1.25)
2 21R ϕ= − . (1.26)
Współczynnik zmienności resztowej wyjaśnia, jaką część wartości średniej zmiennej
endogenicznej stanowią odchylenia losowe.
35
Z kolei współczynnik determinacji informuje, jaka część całkowitej zaobserwowanej
zmienności zmiennej endogenicznej jest wyjaśniona przez model.
Natomiast współczynnik zbieżności informuje nas o tym, jaka część całkowitej
zaobserwowanej zmienności zmiennej endogenicznej nie została wyjaśniona przez model.
Dwa ostatnie współczynniki przyjmują wartości z przedziału [0;1].
Przedział ufności dla parametrów strukturalnych modelu
Należy zwrócić uwagę na ten fakt, iż otrzymane oceny parametrów strukturalnych (wektor a )
mają charakter ocen punktowych. Natomiast nas interesują prawdziwe wartości parametrów
odpowiadające założonemu poziomowi prawdopodobieństwa P , który może przyjmować
wartości 0.90 (90%), 0.95 (95%) lub 0.99 (99%). Najczęściej wybierany jest 95% poziom
prawdopodobieństwa.
W tym celu dla każdego parametru jα budujemy przedziały ufności zgodnie z
formułą [17]:
( ) ( ){ } 1j j j j jP a t D a a t D aα αα α− ⋅ < < + ⋅ = − . (1.27)
Rozpiętość przedziału ufności zależy od założonego prawdopodobieństwa 1P α= − , a
więc założonego poziomu istotności α (bowiem tα odczytuje się z tablic rozkładu t Studenta
(Aneks A) dla przyjętego α oraz dla n k− stopni swobody), a także od wielkości błędu
średniego szacunku parametru.
Przykład 1.3.
W przykładzie 1 ustaliliśmy, że koszty całkowite przedsiębiorstw wytwarzających
jogurty zależą do wielkości ich produkcji. Teraz spróbujemy oszacować parametry modelu
ekonometrycznego opisującego tę zależność.
Na początku dane obserwacji naniesiemy na układ współrzędnych (rys. 1.4).
36
Rys. 0.4. Zależność kosztów całkowitych od wielkości produkcji Źródło: dane umowne
Jak widać z powyższego rysunku może to być zależność liniowa. Zatem nasz model w
postaci ogólnej możemy zapisać:
1 1t tY Xα α ε= + + . (1.28)
Dalej sporządzimy tabelę, która umożliwi nam oszacowanie parametrów modelu:
Przedsiębiorstwo ty tx 2
tx t tx y⋅
1 9.89 1.67 2.79 16.52
2 10.78 2.78 7.73 29.97
3 12.44 3.33 11.09 41.43
4 15.39 6.11 37.33 94.03
5 15.72 6.67 44.49 104.85
6 17.06 6.66 44.36 113.62
7 19.06 8.33 69.39 158.77
8 19.44 8.89 79.03 172.82
∑ 119.78 44.44 296.21 732.01
Źródło: dane umowne
Parametry strukturalne modelu możemy oszacować korzystając ze wzoru (1.18):
( ) 1T T−=a X X X y ,
gdzie:
5
7
9
11
13
15
17
19
21
1,67 2,78 3,33 6,11 6,67 6,66 8,33 8,89
37
1
2
3
4
5
6
7
8
1 1 1.67
1 1 2.78
1 1 3.33
1 1 6.11
1 1 6.67
1 1 6.66
1 1 8.33
1 1 8.89
x
x
x
x
x
x
x
x
= =
X ,
1
2
3
4
5
6
7
8
9.89
10.78
12.44
15.39
15.72
17.06
19.06
19.44
y
y
y
y
y
y
y
y
= =
y ,
zatem
1
2
3
14T
1 2 3 4 5 6 5 2
1 16
1
1
1
1 1 1 1 1 1 1 1
1
1
1
n
tt
n nn
t tt t
n
x
x
xn x
x
x x x x x x x xx x
x
x
=
= =
= ⋅ =
∑
∑ ∑
X XL
L
M M
,
1
2
3
14T
1 2 3 4 5 6 5
16
1 1 1 1 1 1 1
n
tt
nn
t tt
n
y
y
yy
y
x x x x x x x yx y
y
y
=
=
= ⋅ =
∑
∑
X yL
L
M
.
Teraz podstawimy nasze dane do powyższych wzorów:
8
1T
8 82
1 1
88 44.44
44.44 296.21
tt
t tt t
x
x x
=
= =
= =
∑
∑ ∑
X X ,
8
1T
8
1
119.78
732.01
tt
t tt
y
x y
=
=
= =
∑
∑
X y .
Otrzymane macierze podstawimy do wzoru (1.18) i otrzymamy:
( )1
1T T 8 44.44 119.78
44.44 296.21 732.01
−−
= = ⋅
a X X X y .
38
Najpierw obliczymy macierz odwrotną do TX X za pomocą wzoru
( ) ( )1T
T
1
det
−= ⋅ TX X A
X X,
gdzie A jest macierzą algebraicznych dopełnień składającą się z elementów
( )1i j
ij ija d+= − ⋅ ,
przy czym ijd – podwyznacznik macierzy TX X po wykreśleniu i-tego wiersza
i j-tej kolumny.
Obliczymy wyznacznik macierzy TX X :
( )Tdet 8 296.21 44.44 44.44 2369.68 1974.9136 394.7664= ⋅ − ⋅ = − =X X .
Podwyznacznik macierzy TX X składa się z elementów:
11 296.21d = , 12 44.44d = ,
21 44.44d = , 22 8.00d = .
Dalej wyznaczymy elementy macierzy A :
( )1 1
11 1 296.21 296.21a+= − ⋅ = ,
( )1 2
12 1 44.44 44.44a+= − ⋅ = − ,
( )2 1
21 1 44.44 44.44a+= − ⋅ = − ,
( )2 2
22 1 8.00 8.00a+= − ⋅ = .
Zatem otrzymujemy
296.21 44.44
44.44 8.00
− = −
A oraz 296.21 44.44
44.44 8.00
− = −
TA ,
gdyż macierz A jest symetryczną odnośnie głównej przekątnej.
Teraz możemy wyznaczyć macierz odwrotną do macierzy TX X :
( ) 1T 296.21 44.44 0.75 0.1126144.44 8.00 0.1126 0.0203394.7664
− − − = ⋅ = − −
X X ,
co umożliwi nam obliczenie parametrów strukturalnych modelu ekonometrycznego
0a oraz 1a .
Podstawimy otrzymane rezultaty do wzoru (1.18):
0
1
0.75 0.1126 119.78 0.75 119.78 0.1126 732.01
0.1126 0.0203 732.01 0.1126 119.78 0.0203 732.01
a
a
− ⋅ − ⋅ = = ⋅ = − − ⋅ + ⋅
a
39
89.83 82.42 7.41
13.49 14.86 1.37
− = = − +
Otóż mamy oszacowany model, który przyjmuje postać:
ˆ 7.41 1.37t ty x= + ⋅ .
Obliczymy teraz wartości teoretyczne dla zmiennej objaśnianej:
1ˆ 7.41 1.37 1.67 9.70y = + ⋅ = ,
2ˆ 7.41 1.37 2.78 1.22y = + ⋅ = ,
3ˆ 7.41 1.37 3.33 11.97y = + ⋅ = ,
4ˆ 7.41 1.37 6.11 15.78y = + ⋅ = ,
5ˆ 7.41 1.37 6.67 16.55y = + ⋅ = ,
6ˆ 7.41 1.37 6.66 16.53y = + ⋅ = ,
7ˆ 7.41 1.37 8.33 18.82y = + ⋅ = ,
8ˆ 7.41 1.37 8.89 19.59y = + ⋅ = .
Po oszacowaniu parametrów strukturalnych modelu obliczymy parametry struktury
stochastycznej. Najpierw obliczymy odchylenia danych teoretycznych zmiennej objaśnianej
od danych faktycznych, tzn. obliczymy reszty według wzoru:
ˆt t te y y= − .
Obliczenia pomocnicze wpiszemy do poniższej tabeli:
P-wo ty 2
ty ˆty te 2te ty y− ( )2
ty y−
1 9.89 97.81 9.70 0.19 0.0361 -5.08 25.81 2 10.78 116.21 11.22 -0.44 0.1936 -4.19 17.56 3 12.44 154.75 11.97 0.47 0.2209 -2.53 6.40 4 15.39 236.85 15,78 -0.39 0.1521 0.42 0.18 5 15.72 247.12 16.55 -0.83 0.6889 0.75 0.56 6 17.06 291.04 16.53 0.53 0.2809 2.09 4.37 7 19.06 363.28 18.82 0.24 0.0576 4.09 16.73 8 19.44 377.91 19.59 -0.15 0.0225 4.47 19.98
Σ 119.78 1884.97 120.16 1.6526 91.59 Źródło: obliczenia własne
Wariancję resztową można obliczyć na podstawie wzoru (1.19) lub (1.20). Według
ostatniego wzoru otrzymamy:
40
82 2
1
1 11.6526 0.275
8 8 2e tt
S ek =
= ⋅ = ⋅ =− −∑ .
Ze wzoru (1.21) otrzymamy odchylenie standardowe:
2 0.275 0.524e eS S= = = ± .
To znaczy, że wartości teoretyczne kosztów całkowitych przedsiębiorstw
wytwarzających jogurty różnią się średnio o 0.524± mln zł od wartości zaobserwowanych w
rzeczywistości.
Na podstawie wzoru (1.22) obliczymy macierz wariancji i kowariancji ocen
parametrów strukturalnych:
( ) ( ) 12 2 T 0.75 0.1126 0.2063 0.03100.275
0.1126 0.0203 0.0310 0.0056eS− − −
= ⋅ = ⋅ = − − D a X X .
Pierwiastki z elementów diagonalnych macierzy (przekątna główna) dają możliwość
obliczenia błędów średnich szacunku parametrów:
( )0 0.2063 0.454D a = = ,
( )1 0.0056 0.075D a = = .
Na podstawie wzoru (1.23) obliczymy współczynnik zmienności resztowej:
0.524100% 100% 3.5%
14.97e
e
SV
y= ⋅ = ⋅ = ,
co oznacza, że odchylenia losowe stanowią 3.5% średniego poziomu zmiennej objaśnianej.
Ze wzoru (1.24) otrzymamy współczynnik zbieżności:
( )
82
2 18
2
1
1.65260.018
91.59
tt
tt
e
y yϕ =
=
= = =−
∑
∑
.
Wartość tego współczynnika informuje nas o tym, że tylko 1.8% całkowitej
zaobserwowanej zmienności zmiennej objaśnianej nie zostało wyjaśnione przez model
ekonometryczny, innymi słowy jest to wynikiem wpływu czynników losowych.
Na podstawie wzoru (1.26) możemy obliczyć współczynnik determinacji:
2 21 1 0.018 0.982R ϕ= − = − = ,
który informuje nas o tym, że 98.2% całkowitej zmienności zmiennej objaśnianej zostało
wyjaśnione przez model.
Uwzględniając parametry struktury stochastycznej, oszacowany model przyjmuje postać:
41
ˆ 7.41 1.37t ty x= + ⋅ , 0.524eS = , 3.5%eV = , 2 0.018ϕ = .
(0.454) (0.075)
Z naszego modelu widać, że koszt całkowity składa się z kosztu stałego (7.41) oraz
iloczynu jednostkowego kosztu zmiennego (1.37) i wielkości produkcji ( tx ), co potwierdza
nasza wiedza ekonomiczna.
Poza oszacowaniem parametrów modelu należy jeszcze wyznaczyć przedziały ufności
dla takich parametrów modelu jak koszt stały (0α ) oraz jednostkowy koszt zmienny (1α ).
W ekonometrii najczęściej ustala się 95%-owy przedział ufności dla parametrów
modelu. Oznacza to, że z tablic t Studenta (Aneks A) należy odczytać t statystyki dla
95%1 0.05
100%α = − = oraz 8 2 6n k− = − = stopni swobody. Jest to wartość 0.05;6 2.447t = .
Otóż dla parametru 0α otrzymujemy:
{ }07.41 2.447 0.454 7.41 2.447 0.454 1 0.05P α− ⋅ < < + ⋅ = − .
Natomiast dla 1α otrzymujemy:
{ }17.41 2.447 0.075 7.41 2.447 0.075 1 0.05P α− ⋅ < < + ⋅ = −
Otrzymane wyniki możemy skomentować w sposób następujący: z
prawdopodobieństwem 0.95 koszty stałe produkcji jogurtów mieszczą się w przedziale
(6.30;8.52) mln zł, a jednostkowy koszt zmienny – w przedziale (1.19;1.55) mln zł/mln ton.
1.4.4. Weryfikacja modelu
Następnym etapem jest weryfikacja zbudowanego modelu, tzn. sprawdzenie tego jak dobrze
model opisuje badane zjawisko. Na tym etapie dokonuje się dwóch rodzajów weryfikacji w
takiej kolejności: najpierw weryfikacja merytoryczna, później weryfikacja statystyczna. Jeśli
weryfikacja merytoryczna się powiodła, to można przejść do weryfikacji statystycznej. W
przeciwnym przypadku model należy dopracować.
Weryfikacja merytoryczna opiera się przede wszystkim na wiedzy ekonomicznej i
doświadczeniu. Należy tu ocenić czy otrzymane wyniki mają sens ekonomiczny i mogą
przyjmować takie wartości w rzeczywistości. Przy tym należy zwrócić uwagę na znaki „plus”
lub „minus” ocen parametrów strukturalnych, które to znaki wskazują nam charakter
zależności zmiennej objaśnianej od danej zmiennej objaśniającej.
42
Natomiast weryfikacja statystyczna jest weryfikacją formalną, która opiera się na
wiedzy matematycznej, tzn. należy przede wszystkim ocenić stopień zgodności modelu z
danymi empirycznymi, potem ocenić jakość ocen parametrów strukturalnych (statystyczną
istotność ocen parametrów strukturalnych) oraz sprawdzić spełnienie założeń o składnikach
losowych.
Ogólne zasady weryfikacji statystycznej
Na pierwszym etapie weryfikacji statystycznej należy sprawdzić, czy model w wystarczająco
wysokim stopniu wyjaśnia kształtowanie się zmiennej objaśnianej. W tym celu obliczamy
takie współczynniki, jak odchylenie standardowe resztowe eS , współczynnik zmienności
resztowej eV , współczynnik determinacji 2R lub współczynnik zbieżności 2ϕ . Dopasowanie
modelu do obserwacji jest tym lepsze, im wartości współczynnika zmienności resztowej są
niższe, wartości współczynnika determinacji bliższe 1, a wartości współczynnika zbieżności
są bliższe zeru.
Z kolei drugi etap statystycznej weryfikacji modelu obejmuje między innymi badanie
istotności ocen parametrów strukturalnych i/lub weryfikację istotności układu
współczynników regresji. W praktyce można także testować inne hipotezy dotyczące
parametrów strukturalnych.
Natomiast na etapie trzecim weryfikuje się czwarte i piąte założenia klasycznej
metody najmniejszych kwadratów, mianowicie, że: wartość oczekiwana składnika losowego
jest równa zeru ( ) 0E ε = , oraz macierz wariancji i kowariancji składników losowych jest
równa ( ) ( ) 2TnV E σ= =ε ε ε Ι , czyli wariancja składnika losowego 2 2
tσ σ= (jest stała i równa
2σ dla wszystkich obserwacji), a kowariancje składników losowych są równe zeru, czyli nie
występuje autokorelacja składników losowych.
Założenie czwarte można sprawdzić po oszacowaniu parametrów strukturalnych
modelu i obliczeniu reszt te , które traktowane są jako przybliżone realizacje składnika
losowego (przypomnijmy, że suma reszt jest równa zeru, a więc średnia reszt jest równa
zeru). Natomiast weryfikacja spełnienia założenia piątego wymaga zastosowania
odpowiednich testów statystycznych. Często sprawdza się także takie własności składnika
losowego, jak normalność i losowość.
43
Ocena jakości ocen parametrów strukturalnych
Weryfikacja statystycznej istotności ocen parametrów strukturalnych
Weryfikacja statystycznej istotności ocen 0 1, ,..., Ka a a parametrów strukturalnych liniowego
modelu ekonometrycznego ma na celu sprawdzenie czy parametry strukturalne 0 1, ,..., Kα α α
zostały oszacowane z dostateczną precyzją oraz czy zmienne objaśniające, przy których stoją
te parametry, istotnie wpływają na zmienną objaśnianą. Dla każdego parametru jα
( 0,1,...,j K= ) weryfikuje się hipotezę zerową
0 : 0jH α = wobec hipotezy alternatywnej 1 : 0jH α ≠ .
Sprawdzianem w tym teście jest statystyka [17]:
( ) ( )1j j
j
at a
D a
α−= , (1.29)
gdzie
ja – ocena j -tego parametru,
jα – prawdziwa, założona w 0H wartość parametru 0jα = ,
( )jD α – błąd średni szacunku j -tego parametru.
Przy prawdziwości hipotezy 0H statystyka ( )jt α będzie miała rozkład t Studenta o
n k− stopniach swobody. Dlatego po obliczeniu dla każdego z parametrów wartości
empirycznej statystyki Studenta – ( )jt α z tablic rozkładu t Studenta (Aneks A) dla
przyjętego poziomu istotności α ( 0.05α = , co odpowiada poziomowi prawdopodobieństwa
0.95) oraz dla n k− stopni swobody, odczytujemy wartość krytyczną tα .
W przypadku, gdy ( )jt tαα ≤ przyjmujemy hipotezę 0H , co oznacza, że ocena ja
statystycznie nieistotnie różni się od zera (jest nieistotna), a wobec tego zmienna objaśniająca
jX nie wywiera istotnego wpływu na zmienną objaśnianą Y . Natomiast, jeśli ( )jt tαα > , to
hipotezę 0H należy odrzucić i przyjąć hipotezę 1H , która oznacza, że ocena ja statystycznie
istotnie różni się od zera (jest istotna), a wobec tego zmienna objaśniająca jX oddziałuje w
sposób istotny na zmienną objaśnianą Y .
44
Hipotezy dotyczące układu współczynników regresji
Oprócz badania statystycznej istotności pojedynczych parametrów można także testować
hipotezę o istotnym wpływie na zmienną objaśnianą wszystkich uwzględnionych w modelu
zmiennych objaśniających (badanie istotności układu współczynników regresji, bez wyrazu
wolnego) lub wybranej ich grupy.
W przypadku testowania wpływu na zmienną objaśnianą wszystkich zmiennych
objaśniających hipoteza zerowa ma postać:
0 1 2: ... 0KH α α α= = = = .
Wówczas hipoteza alternatywna
1 1 2: ... 0KH α α α+ + + ≠
zakłada, że przynajmniej jeden ze współczynników regresji jest statystycznie istotny (nie
równy zeru), tzn. co najmniej jedna zmienna objaśniająca istotnie wpływa na zmienną
objaśnianą.
Sprawdzianem hipotezy zerowej jest w tym przypadku statystyka F:
2
21 1
n k RF
k R
−= ⋅− −
, (1.30)
która przy założeniu prawdziwości hipotezy zerowej ma rozkład F Fishera–Snedecora z
1 1n k= − oraz 2n n k= − stopniami swobody (n – liczbą obserwacji, k – liczbą parametrów
strukturalnych modelu włącznie z wyrazem wolnym) (Aneks B).
Obliczoną wartość statystyki F należy więc porównać z wartością krytyczną Fα ,
odczytaną z tablic rozkładu Fishera-Snedecora dla przyjętego poziomu istotności α oraz 1n i
2n stopni swobody.
Jeśli F Fα> , to hipotezę zerową należy odrzucić i przyjąć hipotezę 1H o tym, że co
najmniej jedna zmienna objaśniająca istotnie wpływa na zmienną endogeniczną. Natomiast w
przypadku, gdy F Fα< , hipoteza zerowa jest prawdziwa, a więc żadna z uwzględnionych w
modelu zmiennych nie oddziałuje istotnie na zmienną objaśnianą.
W praktyce jednak częściej weryfikuje się hipotezę dotyczącą podukładu
współczynników regresji (patrz. [17, s. 55]).
45
Testowanie innych hipotez dotyczących pojedynczych parametrów strukturalnych
Wśród innych hipotez najczęściej weryfikuje się hipotezę o tym, że wybrany parametr
przyjmuje pewną konkretną wartość jα ∗ , czyli hipotezę
0 : j jH α α ∗=
wobec hipotezy alternatywnej
1 : j jH α α ∗≠ (lub j jα α ∗> , lub j jα α ∗< )
W celu sprawdzenia hipotezy zerowej stosuje się t statystyka Studenta, tzn.
obliczamy wartość
( ) ( )j j
j
j
tD
α αα
α
∗−= , (1.31)
którą porównujemy z wartością krytyczną tα , odczytaną z tablic rozkładu t Studenta (Aneks
A) dla przyjętego poziomu istotności α oraz n k− stopni swobody.
W przypadku, gdy obliczona wartość t statystyki nie przekracza wartości krytycznej
tα (czyli ( )jt tαα ≤ ), przyjmujemy hipotezę 0H . Natomiast wartości t statystyki większe od
wartości krytycznej (tzn. ( )jt tαα > ) sugerują przyjęcie hipotezy 1H .
Wnioskowanie o liniowej funkcji wektora parametrów α
Załóżmy, że interesuje nas parametr γ , będący liniową kombinacją elementów wektora α , co
można zapisać [17]
Tγ = c α ,
gdzie c jest wektorem współczynników kombinacji liniowej [ ]T0... Kc c=c , czyli
T
0
K
j jj
cγ α=
= =∑c α . (1.32)
W klasycznym modelu regresji liniowej najefektywniejszym estymatorem liniowych
funkcji Tγ = c α jest estymator uzyskany metodą najmniejszych kwadratów:
( ) 1T T Tγ−
= c X X X y , (1.33)
którego wariancja jest równa:
( ) ( ) ( ){ }12 T 2 2 T TˆeD Sγ
−= =c D a c c X X c . (1.34)
46
Zatem błąd średni szacunku, można obliczyć ze wzoru:
( ) ( ) ( )1 1T 2 T T Tˆe eD S Sγ
− −= ⋅ ⋅ = ⋅ ⋅c X X c c X X c (1.35)
Mając błąd średni szacunku, można zbudować przedział ufności dla parametru γ
według wzoru:
( ) ( ){ }ˆ ˆ ˆ ˆ 1P t D t Dα αγ γ γ γ γ α− ⋅ ≤ ≤ + ⋅ = − . (1.36)
Można także weryfikować hipotezy dotyczące omówionej kombinacji liniowej
wektora parametrów (np., że jest ona równa pewnej liczbie 0c , gdzie 0c jest wyrazem
wolnym tej kombinacji). Hipoteza zerowa ma w tym przypadku postać 0 0:H cγ = , a hipoteza
alternatywna 1 0:H cγ ≠ . Przy prawdziwości 0H statystyka:
( )0ˆ
ˆc
tD
γγ
−= (1.37)
ma rozkład Studenta o n k− stopniach swobody. Obliczoną wartość statystyki t należy zatem
porównać z wartością krytyczną tα (Aneks A). 0H odrzuca się, jeżeli t tα> , natomiast nie
ma podstaw do jej odrzucenia, jeżeli t tα≤ .
Przykład 1.4.
Załóżmy, że model ekonometryczny ma postać:
1 2ˆ 54.4 12.7 8.2t t ty x x= − + ,
(2.23) (1.71) (0.92)
1.017eS = ± , 1.95%eV = , 2 0.977R = , 2k = , 14n = .
Zweryfikujmy najpierw hipotezę o tym, że każdy ze współczynników regresji jest
statystycznie istotny. Oznacza to, że dla każdego z parametrów należy zweryfikować hipotezę
0 : 0jH α = wobec hipotezy alternatywnej 1 : 0jH α ≠ ( 0,1,2j = ).
W tym celu dla każdego z parametrów obliczamy za pomocą wzoru (1.29) wartości:
( )0
54.4 024.39
2.23t a
−= = ,
( )1
12.7 07.43
1.71t a
− −= = − ,
( )2
8.2 08.91
0.92t a
−= = .
47
Dla porównania odczytujemy wartość krytyczną t statystyki z tablic rozkładu t
Studenta (Aneks A) dla 0.05α = i 14 2 12n k− = − = stopni swobody.
Jest to wartość
; 0.05;12 2.1788n kt tα − = = .
Porównujemy otrzymane wartości z wartością krytyczną, tzn. czy spełnione są
nierówności ( ) ;n kt tαα −> , czyli
24.39 2.1788> ,
7.43 2.1788− > ,
8.91 2.1788> .
Ten fakt, iż zostały spełnione wszystkie trzy nierówności upoważnia nas do
odrzucenia hipotezy zerowej na korzyść hipotezy alternatywnej. Oznacza to, że wszystkie
parametry strukturalne modelu są statystycznie istotne.
A teraz zweryfikujemy hipotezę o tym, że przynajmniej jedna ze zmiennych
objaśniających z naszego modelu wywiera istotny wpływ na zmienną objaśnianą, tzn.
przynajmniej jeden ze współczynników regresji jest statystycznie istotny. Innymi słowy
należy zweryfikować hipotezę
0 1 2: 0H α α= = wobec hipotezy 1 1 2: 0H α α+ ≠ ( 0,1,2j = ).
W tym celu wykorzystamy wzór:
2
2
14 2 0.977509.74
1 1 2 1 1 0.977
n k RF
k R
− −= ⋅ = ⋅ =− − − −
.
Dla porównania należy odczytać wartość krytyczną z tablic rozkładu F Fishera–
Snedecora (Aneks B) dla 0.05α = ; 1 1 2 1 1m k= − = − = ; 2 14 2 12m n k= − = − = stopni
swobody. Jest to wartość
1 2; ; 0.05;1;12 4.75m mF Fα = = .
Ponieważ 1 2; ;m mF Fα> (gdyż 509.74 4.75> ), to hipotezę zerową możemy odrzucić, co
jest równoznaczne z przyjęciem hipotezy alternatywnej. Oznacza to, iż przynajmniej jeden ze
współczynników regresji jest statystycznie istotny.
48
Badanie założeń o składnikach losowych
Badanie stałości wariancji składników losowych
Ponieważ w praktyce może występować sytuacja, gdy wariancja składnika losowego nie jest
stała (mamy wówczas do czynienia z niejednorodnością lub homoskedatycznością składnika
losowego), co niekorzystnie wpływa na zbudowany model, należy przeprowadzić badanie
stałości wariancji tego składnika za pomocą testu Goldfelda i Quandta.
Zastosowanie w/w testu polega na zweryfikowaniu hipotezy o równości wariancji
dwóch skrajnych grup obserwacji. W tym celu formujemy uporządkowane próby. W
przypadku danych zależnych od czasu sortujemy je według jednostek czasu, natomiast w
przypadku danych przekrojowych – według rosnących wartości jednej ze zmiennych
objaśniających. Badaniu poddaje się dwa podzbiory danych o liczebnościach 1n i 2n , co do
których istnieje przypuszczenie, że ich wariancja jest najmniejsza i największa. Przy czym
dopuszczalne jest pominięcie kilku środkowych obserwacji.
Weryfikacji podlega hipoteza o równości wariancji składników losowych w obu
podzbiorach 2 20 1 2:H σ σ= . Alternatywną do hipotezy zerowej jest hipoteza 2 2
1 1 2:H σ σ< , co
oznacza, że wariancja składnika losowego w drugiej podpróbie jest statystycznie istotnie
większa od wariancji w pierwszym podzbiorze. Do sprawdzania hipotez służy F statystyka
Fishera–Snedecora (Aneks B), przy założeniu normalności składników losowych. W tym celu
obliczamy wartość statystyki:
2221
SF
S= , (1.38)
gdzie:
21S – wariancja resztowa regresji w pierwszym podzbiorze,
22S – wariancja resztowa regresji w drugim podzbiorze.
Otrzymaną wartość statystyki F porównujemy z wartościami krytycznymi Fα
odczytanymi z tablic rozkładu Fishera–Snedecora dla przyjętego poziomu istotności α oraz
dla 2n k− i 1n k− stopni swobody (Aneks B). Jeśli F Fα≤ , to nie ma podstaw do odrzucenia
0H o jednorodności wariancji. Natomiast, gdy F Fα> , należy przyjąć hipotezę 1H .
49
Badanie autokorelacji składników losowych
Autokorelacja oznacza, że składniki losowe poszczególnych obserwacji są skorelowane ze
sobą. To zjawisko najczęściej występuje wtedy, gdy model jest budowany na podstawie
danych zależnych od czasu (tzn. przedstawionych w postaci szeregów czasowych). Do
mierzenia autokorelacji służy współczynnik τ , który mierzy zależność między zmiennymi
losowymi tε o wskaźnikach t różniących się od siebie (odległych od siebie) o τ jednostek.
Współczynnik autokorelacji z próby (ˆτρ ) oblicza się jako współczynnik korelacji
między resztami odległymi o τ jednostek (czyli między te i te τ− ; przy czym e i e τ− są,
odpowiednio, średnia reszt i reszt opóźnionych) [17]:
( ) ( )( ) ( )2 2
ˆ t tt
t t
e e e e
e e e e
τ τ
τ τ
ρ − −
− −
− ⋅ −=
− ⋅ −
∑
∑, 1,2,...τ = (1.39)
Jeśli mamy dane w postaci szeregów czasowych i dodatkowo założymy, że składniki
losowe tworzą proces autoregresyjny rzędu pierwszego, tzn.
1 1t t tε ρ ε ξ−= + , (1.40)
gdzie 1ρ jest współczynnikiem autokorelacji rzędu pierwszego, to można pokazać, że
współczynnik autokorelacji rzędu τ jest równy 1τρ . Zatem wystarczy zbadać, czy występuje
autokorelacja rzędu pierwszego.
W celu zweryfikowania hipotezy o nieistotności współczynnika autokorelacji (braku
autokorelacji) najczęściej korzysta się z testu Durbina–Watsona, przy czym hipotezę
alternatywną (występuje autokorelacja dodatnia lub ujemna) można doprecyzować dopiero po
obliczeniu statystyki:
( )2
12
2
1
n
t tt
n
tt
e ed
e
−=
=
−=∑
∑
. (1.41)
Statystyka d przyjmuje wartości z przedziału [0;4].
50
Jeżeli hipoteza zerowa jest prawdziwa (autokorelacja nie występuje), 2d = , wartości
2d < świadczą o autokorelacji dodatniej, natomiast wartości 2d > świadczą o autokorelacji
ujemnej.
Dalej należy sprawdzić, czy autokorelacja ta jest statystycznie istotną. Zatem w
zależności od otrzymanej wartości d można doprecyzować hipotezę alternatywną.
Weryfikujemy zatem hipotezę zerową o braku autokorelacji rzędu pierwszego
składników losowych:
0 1: 0H ρ =
wobec hipotezy konkurencyjnej:
1 1: 0H ρ > , gdy 2d < (występuje dodatnia korelacja rzędu pierwszego)
lub 1 1: 0H ρ < , gdy 2d > (występuje ujemna korelacja rzędu pierwszego).
W przypadku autokorelacji ujemnej dla porównania z wartościami krytycznymi należy
obliczyć 4d d′ = − .
Obliczoną wartość statystyki d (lub d′ w przypadku autokorelacji ujemnej)
porównuje się z wartościami krytycznymi Ld i Ud odczytanymi z tablic Durbina–Watsona
(Aneks E) dla przyjętego poziomu istotności α oraz n i K stopni swobody (n – liczba
obserwacji, K – liczba zmiennych objaśniających w modelu, bez zmiennej tożsamościowo
równej 1).
Jeśli Ud d> ( Ud d′ > ), nie ma podstaw do odrzucenia hipotezy o braku autokorelacji
dodatniej (ujemnej) rzędu pierwszego (a zatem i wyższych rzędów) na poziomie istotności
α . Przyjmujemy więc, że nie występuje dodatnia (ujemna) autokorelacja rzędu pierwszego.
Jeśli Ld d< ( Ld d′ < ), to 0H odrzucamy na rzecz 1H , a więc na poziomie istotności
α przyjmujemy, że występuje dodatnia (ujemna) autokorelacja rzędu pierwszego.
Jeśli L Ud d d≤ ≤ ( L Ud d d′≤ ≤ ), wpadamy w obszar nierozstrzygalności testu – nie
możemy przesądzić o występowaniu lub braku autokorelacji rzędu pierwszego. Należy
wówczas stosować testy alternatywne.
Warto dodać, że mając obliczoną statystykę d , można obliczyć zgodne oszacowanie
współczynnika autokorelacji rzędu pierwszego:
1ˆ 12
dρ = − . (1.42)
51
Badanie normalności rozkładu składników losowych
Mimo tego, że założenie normalności składników losowych nie występuje w klasycznym
modelu regresji liniowej, powinno być ono spełnione w przypadku stosowania testów
opartych na statystyce F Fishera–Snedecora (Aneks B). Należy zaznaczyć, że założenie
normalności składników losowych jest jednym z założeń klasycznego modelu normalnej
regresji liniowej.
Do badania normalności odchyleń losowych można wykorzystać np. test Shapiro–
Wilka, test Hellwiga etc. Jednak warunkiem koniecznym zastosowania wyżej wymienionych
testów jest uporządkowanie reszt niemalejąco. W tym przypadku weryfikacji podlega
hipoteza zerowa o tym, że składniki losowe mają rozkład normalny, co można zapisać jak
0 :H Nε ∼ .
Hipotezą alternatywną do niej będzie hipoteza o tym, że rozkład składników losowych
nie jest rozkładem normalnym, tzn.
( )1 :H Nε¬ ∼ .
Jeśli do sprawdzania hipotezy zerowej wykorzystamy test Shapiro–Wilka, to należy
obliczyć wartość statystyki W według wzoru:
( )[ ]
( )
22
1 11
2
1
n
n t n t tt
n
tt
a e e
We e
− + − +=
=
−
=−
∑
∑ , (1.43)
gdzie 1n ta − + są najlepszymi nieobciążonymi współczynnikami obliczonymi i stablicowanymi
przez S.S. Shapiro i M.B. Wilka (Aneks F). Przy czym [ ]2n (entier) jest częścią całkowitą
2n , a jeśli w modelu występuje wyraz wolny, to 0e = .
Otrzymaną wartość statystyki W porównujemy z wartością krytyczną Wα dla
poziomu istotności α (Aneks G). Jeśli W Wα≥ , nie ma podstaw do odrzucenia hipotezy 0H ,
natomiast jeśli W Wα< , należy przyjąć hipotezę alternatywną.
Natomiast w przypadku, gdy zdecydujemy się na zastosowanie testu Hellwiga, należy
przeprowadzić standaryzację reszt według wzoru [12, s. 154]:
tt
e
e ee
S
−′ = , 1,2,...,t n= , (1.44)
( )2
1
1 n
e tt
S e en =
= −∑ . (1.45)
52
gdzie
e – średnia arytmetyczna reszt,
eS – odchylenie standardowe reszt.
Po uporządkowaniu reszt niemalejąco, z tablic dystrybuanty rozkładu normalnego
odczytujemy wartości dystrybuant ( ) ( ) ( )1 2, ,..., nF e F e F e′ ′ ′ , a następnie wyznaczamy tak
zwane cele tI . Cele te są przedziałami liczbowymi o rozpiętości 1 n , powstałymi z
podzielenia odcinka [ ]0;1 na równe części, co można zapisać jak
[ ) [ ) ( )0;1 1 ;2 ... 1 ;1n n n n n ∪ ∪ ∪ − .
Wartości dystrybuanty ( )tF e′ przyporządkowuje się odpowiednim celom i określa
liczbę cel pustych (K ), tj. takich, do których nie trafia żadna wartość ( )tF e′ .
Z tablic testu zgodności Hellwiga dla liczby obserwacji n oraz przyjętego poziomu
istotności α odczytuje się wartości krytyczne 1K i 2K .
Jeśli 1 2K K K< < , nie ma podstaw do odrzucenia hipotezy zerowej, natomiast jeśli
1K K< lub 2K K> , to należy przyjąć hipotezę alternatywną (czyli odchylenia losowe nie
mają rozkładu normalnego).
Badanie losowości reszt
Badanie losowości reszt jest związane z prawidłowym wyborem postaci analitycznej modelu.
Jeśli model jest prawidłowy, oznacza to, że reszty będą miały charakter losowy. W celu
przeprowadzenia badania tego rodzaju należy zweryfikować hipotezę zerową
0H o tym, że reszty te mają rozkład losowy,
wobec hipotezy alternatywnej 1H , która przewiduje, że rozkład reszt nie ma charakteru
losowego. Do sprawdzenia w/w hipotez można wykorzystać test serii.
W teście serii dla danego ciągu reszt 1 2, ,..., ne e e resztom dodatnim ( 0te > )
przyporządkowuje się symbol a , z kolei resztom ujemnym ( 0te < ) – symbol b , natomiast
reszty równe zeru ( 0te = ) pomija się [12]. Potem należy ustalić liczbę serii S , która oznacza
liczbę podciągów jednakowych symboli a lub b , czyli podciągów złożonych z reszt
dodatnich lub ujemnych.
53
W przypadku testu jednostronnego empiryczną liczbę serii S porównuje się z
wartością krytyczną Sα dla przyjętego poziomu istotności α oraz 1n i 2n stopni swobody
(Aneks C, D). Przypomnijmy, że 1n jest liczbą reszt dodatnich (liczbą elementów a ), a 2n –
liczbą reszt ujemnych (liczbą elementów b ).
Zauważmy, że test jednostronny stosuje się w przypadku niewielkiej liczby
obserwacji. Jeśli S Sα> , nie ma podstaw do odrzucenia hipotezy zerowej, a więc postać
analityczna modelu jest dobrana prawidłowo. Natomiast jeżeli S Sα≤ , przyjmujemy hipotezę
alternatywną, co oznacza, że postać analityczna modelu jest źle dobrana, a więc należy
powrócić do etapu wyboru postaci analitycznej modelu ekonometrycznego.
W przypadku gdy korzystamy z testu dwustronnego, z tablic liczby serii odczytuje się
dwie wartości krytyczne 1S i 2S dla przyjętego poziomu istotności α (tj. dla 2α i 1 2α− )
oraz 1n i 2n stopni swobody. Podstawą do odrzucenia hipotezy zerowej jest 1S S< (zbyt
mała liczba serii) lub 2S S≥ (zbyt duża liczba serii). Zatem reszty mają rozkład losowy ( 0H
jest prawdziwa), jeżeli 1 2S S S< < .
Przykład 1.5.
Zweryfikujemy własności reszt modelu oszacowanego w przykładzie 1.3.
Najpierw uporządkujemy nasze dane statystyczne według rosnących wartości
zmiennej objaśniającej X, a także obliczymy wartości reszt:
t tx ty ˆty te
1 1.67 9.89 9.70 0.19 2 2.78 10.78 11.22 -0.44 3 3.33 12.44 11.97 0.47 4 6.11 15.39 15.78 -0.39 5 6.67 15.72 16.55 -0.83 6 6.66 17.06 16.53 0.53 7 8.33 19.06 18.82 0.24 8 8.89 19.44 18.59 -0.15
Σ 44.44 119.78 120.16 Źródło: dane umowne
Obliczone wartości reszt przedstawimy na wykresie (rys. 1.5).
54
Rys. 0.5. Rozrzut reszt Źródło: dane umowne
Jak widać na powyższym rysunku wartości reszt oscylują wokół zera. Dlatego
pominiemy badanie stałości wariancji. Gdyby reszty wykazywały tendencję wzrostową lub
spadkową należałoby takie badanie przeprowadzić.
Zbadamy autokorelację składników losowych.
Do obliczenia statystyki d Durbina–Watsona wykorzystamy wzór (1.41):
( )8
2
12
82
1
t tt
tt
e ed
e
−=
=
−=∑
∑
.
W celu ułatwienia obliczeń przeprowadzimy dodatkowe obliczenia, które
przedstawimy w postaci:
t te 1te− 1t te e−− ( )2
1t te e−− 2te
1 0.19 – – – 0.0361 2 -0.44 0.19 -0.63 0.3969 0.1936 3 0.47 -0.44 0.91 0.8281 0.2209 4 -0.39 0.47 -0.86 0.7396 0.1521 5 -0.83 -0.39 -0.44 0.1936 0.6889 6 0.53 -0.83 1.36 1.8496 0.2809 7 0.24 0.53 -0.29 0.0841 0.0576 8 -0.15 0.24 -0.39 0.1521 0.0225
Σ 4.244 1.6526 Źródło: obliczenia własne
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
1 2 3 4 5 6 7 8
55
Na podstawie danych z powyższej tabeli otrzymujemy
4.2442.568
1.6526d = = .
Ponieważ 2.568 2d = > , więc mamy autokorelację ujemną. Zatem należy
zweryfikować hipotezę:
0 1: 0H ρ = wobec hipotezy alternatywnej 1 1: 0H ρ < .
Z wartościami krytycznymi odczytanymi z tablic Durbina–Watsona (Aneks E)
będziemy porównywać wartość
4 4 2.568 1.432d d′ = − = − = .
Wartości krytyczne dla 0.05α = ; 8n = i 1K = (jedna zmienna objaśniająca)
wynoszą:
0.73Ld = , 1.33Ud = .
Ponieważ Ud d′ > (1.432 1.33> ), więc nie ma podstaw do odrzucenia hipotezy o
braku autokorelacji ujemnej rzędu pierwszego (a zatem i wyższych rzędów).
Wykorzystując test Shapiro–Wilka zweryfikujemy hipotezę o normalności rozkładu
reszt, czyli hipotezę:
( )0 :H Nε ∼ wobec hipotezy ( )1 :H Nε¬ ∼ .
Hipoteza alternatywna mówi o tym, że reszty nie mają rozkładu normalnego. Na
podstawie wzoru (1.43) dla 10n = (10 obserwacji) obliczymy
( )
( )
25
10 1 10 11
102
1
t t tt
tt
a e e
We e
− + − +=
=
− =
−
∑
∑
.
Potrzebne będą nam obliczenia pomocnicze, które przedstawimy w postaci tabeli
(poniżej). Przy czym wartość średnią dla reszt obliczymy według wzoru:
10
1 1.010.10
10 10
tt
ee == = ≈∑
.
Zauważmy, że współczynniki 1n ta − + odczytujemy z tablic Shapiro–Wilka (Aneks F)
dla 10n = . Są to dane z kolumny 3.
56
t te
uporządkowane 10 1ta − + 10 1t te e− + − ( )10 1 10 1t t ta e e− + − +⋅ − te e− ( )2
te e−
1 2 3 4 5 6 7
1 -0.83 0.5739 1.54 0.8838 -0.93 0.8649 2 -0.44 0.3291 1.12 0.3686 -0.54 0.2916 3 -0.39 0.2141 0.92 0.1970 -0.49 0.2401 4 -0.15 0.1224 0.62 0.0759 -0.25 0.0625 5 0.19 0.0399 0.05 0.0020 0.09 0.0081 6 0.24 0.14 0.0196 7 0.47 0.37 0.1369 8 0.53 0.43 0.1849 9 0.68 0.58 0.3364 10 0.71 0.61 0.3721
Σ 1.01 1.5273 2.5171 Źródło: obliczenia własne
Zatem 21.5273 2.3326
0.92672.5171 2.5171
W = = = .
Wartość krytyczna W odczytana z tablic Shapiro–Wilka (Aneks G) dla poziomu
istotności 0.05α = i 10 obserwacji ( 10n = ) wynosi 0.842Wα = .
Porównujemy tą wartość z obliczoną wartością W . Ponieważ W Wα> (gdyż
0.9267 0.842> ), więc nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, że reszty
mają rozkład normalny.
Za pomocą testu serii zweryfikujemy hipotezę zerową o tym, że reszty mają
charakter losowy, wobec hipotezy alternatywnej. Dla przykładu weźmiemy taki ciąg reszt:
0.19; -0.44; 0.47; -0.39; -0.83; 0.53; -0.24; -0.15.
Resztą o wartościach dodatnich przypiszemy symbol a, natomiast resztą o wartościach
ujemnych – symbol b. W rezultacie otrzymamy taki ciąg symboli:
a b a bb a bb.
Zatem w powyższym ciągu mamy 6 serii ( 6S = ).
Policzymy ilość wartości dodatnich i tą liczbę oznaczymy 1 3n = . To samo zrobimy i
dla wartości ujemnych, tzn. 2 5n = .
Zakładamy, że wystarczającym jest poziom istotności 0.05α = . Zatem należy
obliczyć:
0.05 0.0252 2α = = ,
57
0.051 1 0.9752 2α− = − = .
Wartości krytyczne z testu serii dla powyższych danych wynoszą (Aneks C, D):
1 2S = , 2 7S = .
Ponieważ 2 7S< < , więc nie ma podstaw do odrzucenia hipotezy zerowej, czyli
hipotezy o losowości reszt. Oznacza to, że oszacowany model prawidłowo opisuje
modelowane zjawisko (proces) ekonomiczne.
1.4.5. Merytoryczna interpretacja parametrów strukturalnych
oszacowanych modeli
Merytoryczna interpretacja parametrów zbudowanego modelu jest nieodłączną częścią
badania ekonometrycznego, która to interpretacja pomaga w zrozumieniu charakteru związku
przyczynowo–skutkowego zachodzącego pomiędzy zmienną objaśnianą a poszczególnymi
zmiennymi objaśniającymi.
Na przykład w funkcji jednej zmiennej
0 1Y Xα α= + (1.46)
ocenę parametru 0α można interpretować jako średni poziom zmiennej objaśnianej Y przy
zerowym poziomie zmiennej objaśniającej X . Jeśli ocena tego parametru jest ujemna, co
często jest uzasadnione, interpretację się pomija. Natomiast wzrost wartości zmiennej
objaśniającej X o jednostkę powoduje zmianę (wzrost lub spadek) wartości zmiennej
objaśnianej przeciętnie o 1α jednostek.
Z kolei w funkcji liniowej wielu zmiennych
0 1 1 2 2 ... K KY X X Xα α α α= + + + + (1.47)
ocenę parametru 0α interpretuje się jako przeciętny poziom zmiennej objaśnianej Y , gdy
wszystkie zmienne objaśniające przyjmą wartość zerową ( 1 2 ... 0KX X X= = = = ). Jeśli ocena
tego parametru jest ujemna, wtedy trudno mówić o jego sensownej interpretacji
ekonomicznej. Natomiast wzrost wartości j -tej zmiennej objaśniającej ( jX ) o jednostkę
powoduje zmianę wartości zmiennej objaśnianej Y średnio o jα jednostek, przy
niezmienionych pozostałych zmiennych.
58
1.5. Modele nieliniowe
Rozpatrzyliśmy przypadek liniowej zależności między zmienną objaśnianą a zmiennymi
objaśniającymi. W rzeczywistości zależność ta może mieć również charakter nieliniowy.
Zatem po dokonaniu wyboru zmiennych objaśniających modelu należy dobrać odpowiednią
do tej zależności funkcję matematyczną. Wśród najczęściej spotykanych funkcji nieliniowych
należy wymienić funkcję wykładniczą, potęgową, logarytmiczną, hiperboliczną, logistyczną,
wielomiany i inne.
Postać analityczną modelu można dobrać kilkoma sposobami [17, s. 120]:
1. W przypadku modelu z jedną zmienną objaśniającą najłatwiej jest zastosować analizę
graficzną rozrzutu punktów empirycznych na układzie współrzędnych (taki wykres może
być łatwo wykonany w Excelu). Jeżeli w modelu występuje kilka zmiennych
objaśniających, można analizować graficznie zależność między zmienną objaśnianą
a każdą zmienną objaśniającą.
2. Bardzo często korzysta się z apriorycznej wiedzy o typie związku, który może
podpowiadać bądź teoria ekonomii, bądź też dogłębna znajomość prawidłowości
kształtujące badane związki.
3. Metodą prób i błędów, polegającą na tym, że do zebranych danych empirycznych
dopasowuje się kilka funkcji o różnych postaciach analitycznych, a następnie wybiera
najlepszą w oparciu o wnioski z weryfikacji wszystkich modeli.
4. W przypadku modeli tendencji rozwojowej (trendu) do wyboru postaci analitycznej
można wykorzystać analizę przyrostów – analizuje się przyrosty zmiennej objaśnianej
przypadające na jednostkę przyrostu zmiennej objaśniającej. Mianowicie, jeżeli
jednostkowym przyrostom zmiennej objaśnianej odpowiadają statystycznie stałe (nie
wykazujące tendencji do wzrostu lub spadku):
• pierwsze przyrosty absolutne 1 1t t ty y y−∆ = − , to właściwa jest funkcja liniowa;
• drugie przyrosty absolutne 2 1 1 1t t ty y y−∆ = ∆ − ∆ (czyli przyrosty pierwszych
przyrostów), to odpowiedni jest wielomian stopnia 2, trzecie przyrosty absolutne –
wielomian stopnia 3 itd.;
• przyrosty względne 1t t t
t t
y y y
y y+ − ∆= lub stopy zmian 1t
t
y
y+ , to właściwa jest funkcja
wykładnicza.
59
1.5.1. Rodzaje modeli nieliniowych
Wszystkie modele nieliniowe można podzielić na dwie podstawowe grupy:
I. Modele transformowalne do postaci liniowej, czyli takie, które za pomocą pewnych
przekształceń można doprowadzić do postaci liniowej, której parametry szacuje się za
pomocą metody najmniejszych kwadratów. Modele z tej grupy z kolei można
podzielić na dwie podgrupy, mianowicie:
a) modele nieliniowe względem zmiennych, liniowe względem parametrów,
b) modele nieliniowe względem zmiennych i parametrów.
II. Modele ściśle nieliniowe, do estymacji których należy stosować techniki estymacji
nieliniowej.
1.5.2. Charakterystyka wybranych modeli nieliniowych
Funkcja wykładnicza Funkcja wykładnicza często jest wykorzystywana w modelach tendencji rozwojowej lub jako
czynnik wykładniczy w innej funkcji, na przykład potęgowej. Może ona przyjmować różne
postaci, np. [17]:
0 1XY α α= ⋅ , 1 0α > . (1.48)
Przy czym ocena parametru 0α interpretowana jest jako poziom zmiennej objaśnianej
Y , gdy 0X = . Natomiast 1 1α − jest charakterystyczną dla tej funkcji stałą stopą zmian
zmiennej objaśnianej; wzrost ( )X t o jednostkę powoduje zmiany zmiennej objaśnianej o
( )1 1 100%α − ⋅ .
Wartości parametru 1 1α > świadczą, że wraz ze wzrostem zmiennej objaśniającej X
zmienna objaśniana Y rośnie, natomiast wartości 10 1α< < świadczą, że wzrostowi zmiennej
objaśniającej towarzyszy spadek wartości zmiennej objaśnianej (rys. 1.6).
60
Rys. 0.6. Wykres funkcji wykładniczej 0 1XY α α= ⋅
W praktyce stosowane także funkcje wykładnicze o innych postaciach, jak na przykład
przedstawione na rysunkach 1.7 i 1.8 funkcje:
0 1XY eα α+= , (1.49)
10
XY eαα= ⋅ . (1.50)
Rys. 0.7. Wykres funkcji wykładniczej 0 1XY eα α+=
61
Rys. 0.8. Wykres funkcji wykładniczej 10
XY eαα= ⋅
W przypadku funkcji (1.49), gdy zmienna objaśniająca 0X = , wartość zmiennej
objaśnianej wynosi 0Y eα= . Przy czym stała stopa zmian Y jest równa ( )1 1 100%eα − ⋅ .
Zauważmy, że w tym przypadku wzrostowi X towarzyszy wzrost Y , jeżeli 1 0α > ,
natomiast Y wykazuje tendencję spadkową, jeżeli 1 0α < . Natomiast w funkcji (1.50) poziom
1 0α > , gdy 0X = , jest równy 0α , a stopa zmian jest równa ( )1 1 100%eα − ⋅ .
Funkcja potęgowa
Funkcja potęgowa jest bardzo często wykorzystywana w modelach ekonometrycznych,
opisujących zarówno zależności o charakterze nieliniowym, jak i liniowym. Funkcja
potęgowa o jednej zmiennej objaśniającej ma postać:
10Y Xαα= ⋅ (1.51)
W przypadku tej funkcji ocenę parametru 0α interpretuje się jako poziom zmiennej
objaśnianej Y , gdy zmienna objaśniająca X przyjmuje wartość 1 (rys. 1.9).
Z kolei od parametru 1α zależy przebieg funkcji, bowiem parametr ten jest stałą
elastycznością zmiennej objaśnianej Y względem zmiennej objaśniającej X i oznacza w
przybliżeniu procentową zmianę Y spowodowaną zmianą X o 1%.
62
Rys. 0.9. Wykres funkcji potęgowych
Natomiast funkcja potęgowa o wielu zmiennych objaśniających ma postać:
1 20 1 2 ... K
KY X X Xα α αα= ⋅ ⋅ ⋅ ⋅ . (1.52)
W tym przypadku ocena parametru 0α jest poziomem zmiennej objaśnianej Y , gdy
wszystkie zmienne objaśniające przyjmą wartość równą 1 ( 1 2 ... 1KX X X= = = = ).
Z kolei oceny parametrów jα ( 1,...,j K= ) interpretuje się jako stałe elastyczności
zmiennej objaśnianej Y względem poszczególnych zmiennych objaśniających jX . Oznacza
to, że wzrost jX o 1% powoduje zmianę Y o około %jα , przy niezmienionych pozostałych
zmiennych.
Funkcja logarytmiczna
Funkcję logarytmiczną można zapisać w takiej ogólnej postaci:
0 1 logY Xα α= + , 0X > . (1.53)
W przypadku tej funkcji ocenę 0α interpretuje się jako poziom zmiennej objaśnianej
Y , gdy zmienna objaśniająca 1X = . Funkcję tę stosuje się wtedy, gdy jednostkowym
63
przyrostom zmiennej objaśniającej towarzyszą coraz mniejsze przyrosty zmiennej objaśnianej
(por. rys. 1.10)
Rys. 0.10. Wykres funkcji logarytmicznej 0 1 logY Xα α= +
Wielomiany
W modelowaniu ekonometrycznych oprócz wielomianu stopnia 1, który jest funkcją liniową,
najczęściej stosowane są wielomiany stopnia 2 i 3.
Wielomian stopnia 2 (nazywany też parabolą) można zapisać w postaci:
20 1 2Y X Xα α α= + + . (1.54)
Jego parametry nie mają interpretacji ekonomicznej. Funkcja ta znajduje najczęściej
zastosowanie w ekonomicznej analizie kosztów, a także wykorzystywana jest jako model
tendencji rozwojowej.
Z kolei wielomian stopnia 3 można zapisać w takiej postaci:
2 30 1 2 3Y X X Xα α α α= + + + . (1.55)
Może on przyjmować różne kształty, w zależności od wartości parametrów. Jedną z
najczęściej stosowanych w praktyce postaci wielomianu stopnia 3 (rys. 1.11) jest funkcja
64
zależności kosztów całkowitych od wielkości produkcji. W tym przypadku na parametry
nakłada się następujące warunki: 0 1 3, , 0α α α > ; 2 0α < ; 22 1 33α α α< ⋅ ⋅ .
Rys. 0.11. Wykres wielomianu stopnia 3 przy podanych warunkach dla parametrów
Funkcja hiperboliczna
Kolejną funkcją, która znalazła zastosowanie w modelowaniu ekonometrycznym jest funkcja
hiperboliczna. Funkcję tą można zapisać w takiej ogólnej postaci:
0 1
1Y
Xα α= + . (1.56)
Najczęściej jest ona stosowana, albo jako funkcja wyrażająca zależność
jednostkowego kosztu produkcji od wielkości produkcji, albo jako funkcja zależności popytu
na jakieś dobro od jego ceny. Wówczas ocena parametru 1α powinna przyjmować wartości
dodatnie ( 1 0α > ). Na rysunku 1.12 przedstawiono możliwe przebiegi funkcji hiperbolicznej
w zależności od parametru wartości oceny parametru 1α .
W przypadku tej funkcji interpretujemy tylko wyraz wolny (na rysunku jest to
asymptota pozioma). Wraz ze wzrostem zmiennej objaśniającej X , zmienna objaśniana Y
zbliża się do asymptoty poziomej w taki sposób: rośnie, gdy 1 0α < , i maleje, gdy 1 0α > ).
65
Rys. 0.12. Wykres funkcji hiperbolicznej
Funkcja wykładnicza z odwrotnością
Oddzielną grupę wśród funkcji nieliniowych stanowią funkcje sigmoidalne albo „S-
kształtne”. Do tej grupy należą między innymi: funkcja wykładnicza z odwrotnością, funkcja
logistyczna oraz krzywe Gompertza.
Funkcję wykładniczą z odwrotnością można zapisać w takiej postaci ogólnej:
1expY
Xα β = + ⋅
, 0α > , 0β < . (57)
Funkcja ta ma asymptotę poziomą (poziom nasycenia) Y eα= , natomiast 2
Xβ= −
jest współrzędną punktu przegięcia: przy 2
Xβ= − , 2Y eα −= (rys. 1.13).
66
Rys. 0.13. Funkcja wykładnicza z odwrotnością
Funkcja logistyczna
Funkcja logistyczna często jest stosowana jako funkcja trendu, czyli jedną ze zmiennych
objaśniających jest czas t [10]. Należy zaznaczyć, że trend logistyczny bardzo dobrze opisuje
zjawiska, w rozwoju których wyraźnie można wyodrębnić trzy etapy: I – bardzo szybki
wzrost, II – wzrost coraz wolniejszy, III – stabilizacja na poziomie bliskim poziomowi
nasycenia α .
Funkcję logistyczną można zapisać w takiej postaci matematycznej:
1 XY
e γα
β −=+ ⋅
, 0α > , 0β > , 0γ > . (1.58)
Interpretację ma tylko parametr α . Jest on asymptotą poziomą zwaną poziomem
nasycenia (rys. 1.14).
Rys. 0.14. Funkcja logistyczna
67
Pierwsza funkcja Tornquista
Poza wymienionymi wyżej standardowymi funkcjami matematycznymi w modelowaniu
ekonometrycznym można spotkać również funkcje o charakterze specjalnym. Do grupy tych
funkcji należą m.in. funkcje Tornquista, których nazwa pochodzi od nazwiska szwedzkiego
ekonomisty.
Funkcje te są najczęściej wykorzystywane w ekonomicznej analizie popytu
konsumpcyjnego. Opisują one zależność popytu (Y ) na różne dobra od wielkości dochodów
konsumentów (X ). Znane są trzy funkcje o tej nazwie.
I funkcja Tornquista ma taką postać matematyczną:
XY
X
αβ
=+
, 0α > , 0β > , (1.59)
Jej przebieg przedstawia rysunek 1.15, przy czym Y α= jest asymptotą poziomą tej
funkcji, tak zwanym poziomem nasycenia, natomiast X β= − jest asymptotą pionową
wykresu funkcji.
Rys. 0.15. Pierwsza funkcja Tornquista
Druga i trzecia funkcje Tornquista
II funkcj ę Tornquista można zapisać w takiej postaci:
( )XY
X
α γβ
−=
+, 0α > , 0β > , 0γ > , (1.60)
gdzie parametry α i β mają interpretację analogiczną jak w pierwszej funkcji Tornquista,
natomiast γ jest poziomem zmiennej objaśniającej X , przy którym pojawia się objaśniane
zjawisko (Y ) (rys. 1.16).
68
Rys. 0.16. Druga funkcja Tornquista
III funkcja Tornquista ma taką postać matematyczną:
( )X XY
X
α γβ−
=+
, 0α > , 0β > , 0γ > . (1.61)
W przypadku tej funkcji interpretacji podlegają tylko dwa parametry: β i γ .
Mianowicie, parametr β jest asymptotą pionową funkcji, a parametr γ – poziomem
zmiennej objaśniającej X , przy którym pojawia się objaśniane zjawisko Y (rys. 1.17).
Rys. 0.17. Trzecia funkcja Tornquista
69
1.5.3. Estymacja metodą najmniejszych kwadratów
modeli transformowalnych do postaci liniowej
Estymację modelu nieliniowego należy rozpocząć od ustalenia czy zakłócenia losowe ( )tε
mają charakter rzeczywisty. Chodzi tu przede wszystkim o to, czy zakłócenia losowe
nakładają się addytywnie (przez dodanie), czy multiplikatywnie (przez pomnożenie).
Dokładniej mówiąc zakłócenia losowe mogą być nałożone:
• jeśli amplituda wahań jest stała – addytywnie: tε+ ,
• jeśli odchylenia losowe są proporcjonalne do poziomu zmiennej objaśnianej (Y ) –
multiplikatywnie, przy czym są dwie możliwości: tε× lub teε× ( 10 tε× ).
Zazwyczaj stosuje się tę drugą możliwość, bowiem po sprowadzeniu do postaci
liniowej zakłócenia losowe nie ulegają transformacji.
Modele transformowalne do postaci liniowej
Modele liniowe względem parametrów
Model ( ),Y f= X α jest liniowy względem parametrów, jeżeli zmienną objaśnianą można
przedstawić jako liniową funkcję jednoznacznych przekształceń zmiennych objaśniających
X , przy czym współczynniki tych przekształceń są znane, czyli model można zapisać w
postaci [17]:
0 1 10
...K
j j K Kj
Y X X Xα α α α=
= = + + +∑ % % % , (1.62)
gdzie
( )j jX X=% . (1.63)
Zatem zmienne pomocnicze jX% są pewnymi funkcjami (przekształceniami)
oryginalnych zmiennych objaśniających jX , a model (1.62) nazywany jest pomocniczym
modelem liniowym
Parametry strukturalne modelu pomocniczego (1.62) szacuje się za pomocą metody
najmniejszych kwadratów, czyli wykorzystując wzór:
( ) 1T T−= ⋅a X X X y% % % , (1.64)
70
przy czym X% jest macierzą obserwacji pomocniczych zmiennych objaśniających, a y –
wektorem obserwacji na zmiennej objaśnianej.
Dla modelu pomocniczego szacuje się następnie parametry struktury stochastycznej,
model pomocniczy poddaje się weryfikacji i jeżeli weryfikacja wypadnie pomyślnie, to
przyjmuje się, że również oryginalny model jest dobrze dopasowany do obserwacji.
Spośród omówionych wcześniej modeli nieliniowych do modeli liniowych względem
parametrów należą m.in.: model hiperboliczny, wielomiany i model logarytmiczny. W tych
modelach zakłócenie losowe nakładane zazwyczaj addytywnie.
Przykład 1.6.
Ustalimy postać analityczną modelu zależności jednostkowego kosztu produkcji (ty )
od wielkości produkcji ( tx ). Ponad to oszacujemy parametry dobranego modelu. Dane
potrzebne do badania dla 10 obserwacji (t ) przedstawiono w poniższej tabeli:
Obserwacja t
1 2 3 4 5 6 7 8 9 10
ty (zł) 44.62 40.77 26.92 24.62 17.69 16.15 15.38 14.62 13.08 11.54
tx
(tys.sztuk) 0.060 0.075 0.150 0.150 0.300 0.375 0.600 0.750 1.500 3.000
Źródło: dane umowne
Na podstawie danych obserwacji z powyższej tabeli sporządzimy wykres (rys. 1.18).
Rys. 0.18. Zależność jednostkowego kosztu produkcji (ty ) od wielkości produkcji ( tx ) Źródło: dane umowne
Jak widać na rysunku 1.18 do opisu badanej zależności można wykorzystać hiperbolę
(1.56), która po uwzględnieniu zakłócenia losowego przyjmuje postać:
0
0,5
1
1,5
2
2,5
3
3,5
44,62 40,77 26,92 24,62 17,69 16,15 15,38 14,62 13,08 11,54
71
0 1
1t t
t
YX
α α ε= + ⋅ + .
W celu linearyzacji naszego modelu wprowadzimy zmienną pomocniczą
1t
t
XX
=% , przy czym 0tX ≠ .
Wówczas badany model liniowy będzie miał postać:
0 1t t tY Xα α ε= + ⋅ +% .
Korzystając ze wzoru (1.64) oszacujemy parametry naszego modelu, przy czym:
11
22
4
1 11
1 11
1 11 n
xx
xx
xx
= =
x
%
%%
M MM M
%
,
1
2
n
y
y
y
=
yM
,
( )
( ) ( )
1
12
21 2
1 1
1 11
1 1 1 1 1
1 1 11 1
1 1
n
tt
n nn
t tt tn
xn x
x
x x xx x
x
=
= =
= ⋅ =
∑
∑ ∑
TX XL
% %
L M M,
( )
1
12
1 2
1
1 1 1
1 1 11
n
tt
nn
t ttn
yy
y
x x xx y
y
=
=
= ⋅ = ⋅
∑
∑
TX yL
%
L M.
Rezultaty obliczeń pomocniczych zapiszemy w postaci poniższej tabeli:
t ty tx 1
tx
21
tx
1
tt
yx
⋅
1 44.62 0.600 16.67 277.89 743.82 2 40.77 0.075 13.33 177.69 543.46 3 26.92 0.150 6.67 44.49 179.56 4 24.62 0.150 6.67 44.49 164.22 5 17.69 0.300 3.33 11.09 58.91 6 16.15 0.375 2.67 7.13 43.12 7 15.38 0.600 1.67 2.79 27.35 8 14.62 0.750 1.33 1.77 19.44 9 13.08 1.500 0.67 0.45 8.76 10 11.54 3.000 0.33 0.11 3.81
Σ 225.39 6.960 53.34 567.90 1792.45 Źródło: obliczenia własne
72
Na ich podstawie otrzymujemy:
( )1
1 10 53.34 225.39
53.34 567.90 1792.45
−−
= ⋅ = ⋅
T Ta X X X y% % % ,
( ) ( )1 1
det
−= ⋅T T
TX X A
X X% %
% %,
( )det 10 567.90 53.34 53.34 5679.00 2845.16 2833.84= ⋅ − ⋅ = − =TX X% % .
Podwyznacznik macierzy TX X% % składa się z elementów:
11 567.90d = , 12 53.34d = ,
21 53.34d = , 11 10.00d = .
Teraz obliczymy elementy macierzy A :
( )1 1
11 1 567.90 567.90a+= − ⋅ = , ( )1 2
12 1 53.34 53.34a+= − ⋅ = − ,
( )2 1
21 1 53.34 53.34a+= − ⋅ = − , ( )2 2
22 1 10.00 10.00a+= − ⋅ = .
Stąd
567.90 53.34
53.34 10.00
− = −
A
i ze względu na symetrię
567.90 53.34
53.34 10.00
− = −
TA .
Zatem
( ) 1 567.90 53.34 0.2003 0.0188153.34 10.00 0.0188 0.00352833.84
− − − = ⋅ = − −
TX X% %
oraz
0
1
0.2003 0.0188 225.39 0.2003 225.39 0.0188 1792.45
0.0188 0.0035 1792.45 0.0188 225.39 0.0035 1792.45
a
a
− ⋅ − ⋅ = = ⋅ = = − − ⋅ + ⋅
a
45.1456 33.6981 11.4475 11.45
4.2373 6.2736 2.0363 2.04
− = = ≈ − +
.
Otóż mamy model
1ˆ 11.45 2.04 11.45 2.04t t
t
y xx
= + ⋅ = + ⋅% .
73
Korzystając z oszacowanego modelu możemy obliczyć wartości teoretyczne dla
zmiennej objaśnianej:
1ˆ 11.45 2.04 16.67 45.46y = + ⋅ = , 6ˆ 11.45 2.04 2.67 16.90y = + ⋅ = ,
2ˆ 11.45 2.04 13.33 38.64y = + ⋅ = , 7ˆ 11.45 2.04 1.67 14.86y = + ⋅ = ,
3ˆ 11.45 2.04 6.67 25.19y = + ⋅ = , 8ˆ 11.45 2.04 1.33 14.16y = + ⋅ = ,
4ˆ 11.45 2.04 6.67 25.19y = + ⋅ = , 9ˆ 11.45 2.04 0.67 12.82y = + ⋅ = ,
5ˆ 11.45 2.04 3.33 18.24y = + ⋅ = , 10ˆ 11.45 2.04 0.33 12.12y = + ⋅ = .
Dalej obliczymy parametry struktury stochastycznej. W tym celu należy obliczyć
wartość średnią dla zmiennej objaśnianej
10
1 225.3922.539 22.54
10 10
tt
yy == = = ≈
∑
i reszty
ˆt t te y y= − .
Obliczenia pomocnicze zapiszemy w postaci poniższej tabeli:
t ty ˆty te 2
te ty y− ( )2
ty y−
1 44.62 45.46 -0.84 0.7056 21.98 483.12 2 40.77 38.64 2.13 4.5369 18.23 332.33 3 26.92 25.19 1.73 2.9929 4.38 19.19 4 24.62 25.19 -0.57 0.3249 2.08 4.33 5 17.69 18.24 -0.55 0.3025 -4.85 23.52 6 16.15 16.90 -0.75 0.5625 -6.39 40.83 7 15.38 14.86 1.52 2/3104 -7.16 51.27 8 14.62 14.16 0.46 0.2116 -7.92 62.73 9 13.08 12.82 0.26 0.0676 -9.54 91.01 10 11.54 12.12 -0.58 0.3364 -11.00 121.00
Σ 225.39 12.3513 1229.32 Źródło: obliczenia własne
Teraz możemy obliczyć parametry struktury stochastycznej:
2 112.3513 1.5439
10 2eS = ⋅ ≈−
,
2 1.5439 1.2425e eS S= = ≈ ,
1.2425
100% 100% 5.51%22.54
ee
SV
y= ⋅ = ⋅ = ,
74
( )
102
2 110
2
1
12.35130.01 1%
1229.32
tt
tt
e
y yϕ =
=
= = = =−
∑
∑
,
2 21 1 0.01 0.99 99%R ϕ= − = − = = .
( ) ( ) 12 0.2003 0.0188 0.1297 0.01221.5439
0.0188 0.0035 0.0122 0.0023eS− − −
= ⋅ = ⋅ = − −
2 TD a X X% % ,
( )0 0.1297 0.3601D a = = , ( )1 0.0023 0.0480D a = = .
Na podstawie otrzymanych wartości parametrów struktury stochastycznej możemy
wywnioskować o dobrym dopasowaniu modelu do danych obserwacji, gdyż tylko 1%
zmienności zmiennej objaśnianej nie został wyjaśniony przez nasz model. Otóż możemy
zapisać:
1ˆ 11.45 2.04t
t
yx
= + ⋅ .
( )(0.3601) 0.0480
Teraz zweryfikujemy zbudowany model, mianowicie zweryfikujemy hipotezę o
statystycznej istotności współczynników regresji:
( )0
11.45 031.797
0.3601t a
−= ≈
( )1
2.04 042.500
0.0480t a
−= = ,
0.05;8 2.306t = (Aneks A).
Ponieważ ( )0 0.05;8t a t> i ( )1 0.05;8t a t> , więc przyjmujemy hipotezę alternatywną (do
hipotezy zerowej), tzn. wszystkie parametry strukturalne (współczynniki regresji) są
statystycznie istotne.
Przeprowadzimy również badanie losowości reszt korzystając z testu serii. Zapiszemy
ciąg reszt z naszego przykładu:
-0.84; 2.13; 1.73; -0.57; -0.55; -0.75; 1.52; 0.46; 0.26; -0.58;
któremu odpowiada następujący ciąg symboli:
b aa bbb aaa b.
75
Otóż w ciągu reszt występuje 5 serii, czyli 5S= , przy czym liczba wartości dodatnich
wynosi 1 5n = , a liczba wartości ujemnych 2 5n = . Zakładamy, że 0.05α = . Wartości
krytyczne dla 1n i 2n wynoszą 1 2S = i 2 9S = (Aneks C, D). Ponieważ 1 2S S S< < , więc
postać analityczna modelu jest właściwą.
Na podstawie naszego modelu możemy scharakteryzować taką zależność: wraz ze
wzrostem wielkości produkcji koszt jednostkowy maleje coraz wolniej – do asymptoty
poziomej 11.45Y = .
Modele nieliniowe względem zmiennych i parametrów
Model ( ),Y f= X α , nieliniowy względem zmiennych i parametrów, jest transformowalny do
postaci liniowej, jeśli za pomocą jednoznacznych przekształceń obu jego stron można go
zapisać w postaci liniowej.
Pomocniczy model liniowy przybiera w tym przypadku postać [17]:
0 1 10
...K
t j tj t t K tK tj
Y X X Xβ ε β β β ε=
= + = + + + +∑% % % % ,
gdzie ( )t tY G Y=% – pomocnicza zmienna objaśniana (pewna funkcja oryginalnej zmiennej
objaśnianej); ( )tj tjX g X=% – pomocnicze zmienne objaśniające (pewne funkcje oryginalnych
zmiennych objaśniających); ( )j jhβ α= – parametry modelu pomocniczego (zazwyczaj także
pewne funkcje parametrów modelu oryginalnego).
Po linearyzacji modelu nieliniowego – zapisaniu go w postaci modelu pomocniczego
– wyznacza się za pomocą metody najmniejszych kwadratów jego parametry strukturalne
korzystając ze wzoru:
( ) 1T T−= ⋅b X X X y% % % % , (1.65)
gdzie X% – macierz obserwacji pomocniczych zmiennych objaśniających; y% – wektor
obserwacji pomocniczej zmiennej objaśnianej.
Dla modelu pomocniczego oblicza się następnie parametry struktury stochastycznej i
model pomocniczy poddaje się weryfikacji. Jeżeli dopasowanie modelu pomocniczego do
obserwacji można uznać za dobre, wnioskuje się, że model oryginalny też jest dobrze
dopasowany. Można zatem zapisać model w postaci oryginalnej.
Najczęściej spotykane w praktyce modele nieliniowe względem parametrów i
zmiennych, które można linearyzować, to model wykładniczy, potęgowy oraz ich kombinacja
76
(potęgowo-wykładniczy). W tych modelach zakłócenie losowe nakłada się na funkcję
multiplikatywnie.
Przykład 1.7.
W pewnym przedsiębiorstwie produkującym lody zaobserwowano takie wielkości
sprzedaży ( ty ) w kolejnych latach (patrz tabelę poniżej).
Rok 2003 2004 2005 2006 2007 2008 2009
ty (ton) 7.300
7.320
8,915
12.680
16.245
21.930
29.600
Źródło: dane umowne
Należy oszacować parametry modelu trendu, tzn. zależności wielkości sprzedaży od
czasu (t ). Zauważmy, że w modelach trendu zmienna czasowa najczęściej przyjmuje
wartości kolejnych liczb naturalnych ( 1,2,..,t n= ).
Zanim wybierzemy postać analityczną modelu, najpierw zilustrujemy zależność ty od
t na wykresie (rys. 1.19), co ułatwi nam wybór właściwej postaci analitycznej modelu.
Rys. 0.19. Sprzedaż lodów w latach 2003-2009 (ton) Źródło: dane umowne
Jak widać na rysunku 1.19 zależność ta może mieć charakter funkcji wykładniczej.
Przyjmiemy więc funkcję typu (1.48) z multiplikatywnym zakłóceniem losowym:
0 1tt
tY eεα α= ⋅ ⋅ .
0
5
10
15
20
25
30
35
2003 2004 2005 2006 2007 2008 2009
77
Aby sprowadzić ją do postaci liniowej należy obie jej strony zlogarytmować, najlepiej
przy powyższej postaci funkcji wykorzystać logarytm naturalny:
0 1 0 1ln ln ln ln ln lntt t tY e tα α ε α α ε= + + ⋅ = + ⋅ + .
Zatem model pomocniczy (liniowy) przyjmuje postać:
0 1t t tY Xβ β ε= + ⋅ +% % ,
gdzie lnt tY Y=% , tX t=% , 0 0lnβ α= , 1 1lnβ α= .
Parametry struktury danego modelu możemy oszacować korzystając ze wzoru (1.65),
gdzie:
1
2
1
1
1 n
t
t
t
=
X%M M
,
1
2
ln
ln
ln n
y
y
y
=
y%M
,
1
22
1 2
1
1 1 1 1
1n
n
t
t n t
t t t t t
t
= ⋅ =
∑∑ ∑
TX XL
% %
L M M,
1
2
1 2
1 1 1 ln
lnt
n t
n
y
y y
t t t t y
y
= ⋅ = ⋅
∑∑
TX yL
%
L M.
Dalej obliczenia pomocnicze zapiszemy do poniższej tabeli:
tx t= ty lnt ty y=% 2t ln tt y⋅
1 7.300 1.9879 1 1.9879 2 7.320 1.9906 4 3.9812 3 8,915 2.1877 9 6.5631 4 12.680 2.5400 16 10.1600 5 16.245 2.7878 25 13.9390 6 21.930 3.0878 36 18.5268 7 29.600 3.3878 49 23.7146
Σ =28 17.9696 140 78.8726 Źródło: obliczenia własne
( )1
1T T 7 28 17.9696 140 28 17.96961
28 140 78.8726 28 7 78.8726196
−− −
= ⋅ = ⋅ = ⋅ ⋅ = − b X X X y% % % %
78
0.7149 0.1429 17.9696 0.7149 17.9696 0.1429 78.8726
0.1429 0.0357 78.8726 0.1429 17.9696 0.0357 78.8726
− ⋅ − ⋅ = ⋅ = = − − ⋅ + ⋅
12.8465 11.2709 1.5756 1.58
2.5679 2.8158 0.2479 0.25
− = = ≈ − +
.
Zatem 0
1
1.58
0.25
b
b
= =
b .
Jednak należy pamiętać, że 0 0lnb a= i 1 1lnb a= .
Oszacowany model pomocniczy (liniowy) będzie mieć postać:
ˆln 1.58 0.25ty t= + ⋅ .
Obliczymy za jego pomocą wartości teoretyczne:
1ˆln 1.58 0.25 1 1.83y = + ⋅ = , 5ˆln 1.58 0.25 5 2.83y = + ⋅ = ,
2ˆln 1.58 0.25 2 2.08y = + ⋅ = , 6ˆln 1.58 0.25 5 3.08y = + ⋅ = ,
3ˆln 1.58 0.25 3 2.33y = + ⋅ = , 7ˆln 1.58 0.25 7 3.33y = + ⋅ = .
4ˆln 1.58 0.25 4 2.58y = + ⋅ = ,
Obliczymy też wartość średnią
ln 17.9696ln 2.5671
7 7ty
y = = =∑ ,
reszty ˆln lnt t te y y= −% oraz inne dane pomocnicze, za pomocą których można obliczyć
parametry struktury stochastycznej. Pomocnicze dane przedstawimy w postaci tabeli:
Rok ln ty ˆln ty te% 2te% ln lnty y− ( )2
ln lnty y−
2003 1.9879 1.83 0.1579 0.0249 -0.5792 0.3355 2004 1.9906 2.08 -0.0894 0.0080 -0.5765 0.3324 2005 2.1877 2.33 -0.1423 0.0202 -0.3794 0.1439 2006 2.5400 2.58 -0.0400 0.0016 -0.0271 0.0007 2007 2.7878 2,83 -0.0422 0.0018 0.2207 0.0487 2008 3.0878 3.08 0.0078 0.0001 0.5207 0.2711 2009 3.3878 3.33 0.0578 0.0033 0.8207 0.6735
Σ 17.9696 0.0599 1.8058 Źródło: obliczenia własne
79
Teraz możemy obliczyć parametry struktury stochastycznej:
2 21 10.0599 0.012
7 2e tS en k
= = ⋅ ≈− −∑%
% , 0.012 0.1095eS = =%
,
0.1095
100% 100% 4.26%2.5671ln
ee
SV
y= ⋅ = ⋅ =%
%,
( )2
2 0.05990.0332 3.32%
1.8058ln ln
t
t
e
y yϕ = = = =
−∑
∑
%,
2 21 1 0.0332 0.9668 96.68%R ϕ= − = − = = ,
( ) ( ) 12 0.7149 0.1429 0.0086 0.00170.012
0.1429 0.0357 0.0017 0.0004eS− − −
= ⋅ = ⋅ = − −
2 TD b X X%
% % ,
( ) ( )( )0 0ln 0.0086 0.0927D b D a= = = ,
( ) ( )( )1 1ln 0.0004 0.02D b D a= = = .
Zatem możemy zapisać oszacowany model pomocniczy wraz z parametrami struktury
stochastycznej:
ˆln 1.58 0.25ty t= + ⋅ , 0.1095eS =%
, 4.26%eV =%
,
( ) ( )0.0927 0.02 2 3.32%ϕ = , 2 96.68%R = .
Zweryfikujemy statystyczną istotność otrzymanych parametrów strukturalnych
modelu:
( )0
1.58 017.0442
0.0927t b
−= = , ( )1
0.25 012.5
0.02t b
−= = .
Wartość krytyczna wynosi 0.05;5 2.447t = (Aneks A).
Ponieważ ( )0 0.05;5t b t> i ( )1 0.05;5t b t> , więc model został dobrany trafnie zwłaszcza,
że tylko 3.32% zmienności logarytmów zmiennej objaśnianej nie zostało wyjaśnione przez
nasz model, a odchylenia losowe stanowią zaledwie 4.26% średniej wartości logarytmów Y .
Dla testu serii wypiszemy ciąg reszt:
0.1579; -0.0894; -0.1423; -0.0400; -0.0422; 0.0078; 0.0578;
któremu odpowiada ciąg symboli:
a bbbb aa.
Otóż obserwujemy 3 serii, czyli 3S= . Dla 1 3n = i 2 4n =
1 2S = oraz 2 6S = (Aneks C, D).
80
Ponieważ 1 2S S S< < , więc reszty mają charakter losowy. To potwierdza właściwy
wybór postaci analitycznej modelu.
A teraz należy przejść do postaci oryginalnej modelu w taki sposób:
0 0lnb a= ⇒ 0 1.580 4.855ba e e= = = ,
1 1lnb a= ⇒ 1 0.251 1.284ba e e= = = .
Stąd oryginalny model ma postać:
ˆ 4.855 1.284tty = ⋅ .
Modele ściśle nieliniowe
To są modele, które nie da się transformować do postaci liniowej. Wśród najczęściej
wykorzystywanych w praktyce ekonometrycznej modeli ściśle nieliniowych należy wymienić
funkcje Tornquista oraz krzywe S-kształtne (m.in. funkcję logistyczną i krzywe Gompertza).
Ponad to linearyzacja modeli nieliniowych może czasami powodować dość znaczne
zniekształcenie uzyskanych wyników.
W przypadku estymacji modeli ściśle nieliniowych wykorzystywane są metody
numeryczne (por. [11], [19]). Najczęściej wykorzystuje się w tym celu metody iteracyjne
(por. [11], [19], [28]). W literaturze przedmiotu poleca się także zastosowanie segmentowej
estymacji parametrów modeli nieliniowych o segmentach liniowych (por. [21]).
Jedną z często stosowanych metod estymacji nieliniowej jest nieliniowa metoda
najmniejszych kwadratów, która wykorzystuje różne procedury iteracyjne. Do najbardziej
znanych i najczęściej stosowanych należą (por. [4, s. 151-152], [17, s. 139-145]):
• metoda Gaussa–Newtona,
• metoda najszybszego spadku,
• metoda Marquardta.
Otóż estymacja parametrów funkcji nieliniowych jest znacznie trudniejsza, ale, wraz z
dynamicznym rozwojem techniki komputerowej i oprogramowania w ostatnim 10-leciu,
zastosowanie postaci nieliniowych stało się dość powszechne [4, s.142].
Interesujące omówienie problemów, związanych z modelami nieliniowymi, można
znaleźć również w pracach T.Amemyi [2], G.G.Judge’a i in. [27, s. 195-223] oraz w
klasycznych monografiach autorstwa S.M.Goldfelda i R.E.Quandta [16] i Y.Barda [3], a
także G.A.Sebera i C.J.Wilda [37].
81
ROZDZIAŁ II
PROGNOZOWANIE NA PODSTAWIE MODELI
SZEREGÓW CZASOWYCH
Wstęp
Rozwój gospodarki powoduje, że prognozowanie gospodarcze znajduje coraz szersze
zastosowanie, nie tylko w naukach ekonomicznych do modelowania stanu gospodarki w
przyszłości, ale również w dziedzinie nauk społecznych, przyrodniczych, itp.
Ponieważ wiedza jest największą wartością, zatem, każdy podejmując decyzje, chce je
opierać o realne i rzetelne prognozy. Rządy państw chcą znać prognozy przychodów z
podatków i prognozy wydatków budżetowych, aby móc racjonalnie gospodarować budżetem
i utrzymywać dziurę budżetową na jak najniższym poziomie. Podobnie postępują samorządy
lokalne. Banki prognozują m.in. stopę procentową oraz kurs walutowy aby zabezpieczać się
przed ryzykiem spowodowanym przez te czynniki makroekonomiczne. Ryzyko jakie mogą
powodować te czynniki makroekonomiczne to ryzyko płynności banku lub
niebezpieczeństwo, że przy zbyt drastycznych wzrostach tych czynników, kredytobiorcy nie
będą w stanie wywiązać się ze swoich zobowiązań. Firmy produkcyjne również prognozują.
Starają się one zaprognozować dobrze produkcję na następne okresy, aby nie zostać z
nadwyżką towaru lub jego niedoborem w istotnych okresach. Firmy eksportujące lub
importujące muszą prognozować wartość kursów walutowych, aby dalej opłacało im się
handlować. Wszystkie te podmioty chcą znać prognozy gospodarcze aby wiedzieć, czy
zatrudnić nową siłę roboczą, bo gospodarka będzie się rozkręcać, czy też ciąć zatrudnienie ze
względu na zbliżający się kryzys. Osoby indywidualne przed każdym wyjściem z domu chcą
znać prognozę pogody, aby wiedzieć, czy wziąć parasol, czy nie. Osoby te starają się również
82
prognozować swoje oszczędności, aby wiedzieć, kiedy mogą sobie pozwolić na „odrobinę
luksusu” (np. wymiana samochodu lub egzotyczne wczasy).
Do prognozowania używanych jest wiele modeli matematycznych, poczynając od
modeli naiwnych poprzez regresje linowe, średnie ruchome i trendy pełzające, aż do
wygładzania wykładniczego. Używanych jest również wiele modeli opartych o wiedzę i
doświadczenie eksperckie. Oczywiście każdy podmiot gospodarczy czy też osoba fizyczna
prognozuje zgodnie ze swoją wiedzą. Większe instytucje używają bardziej skomplikowanych
modeli, gdyż mają specjalne zespoły zajmujące się prognozowaniem. Dodatkowo większe
instytucje przeznaczają na cel prognozowania znacznie większe fundusze. Natomiast
mniejsze firmy lub osoby fizyczne opierają się często na modelach bardzo prostych,
eksperckich lub zwykłym przeczuciu.
2.1. Teoretyczne podstawy prognozowania
Prognozowanie jest to przewidywanie przyszłości w sposób racjonalny z wykorzystaniem
metod naukowych. Jednak użycie tych metod nie gwarantuje niezawodności prognozy
(bardzo często jest to obserwowane zwłaszcza w prognozie pogody), ułatwia jednak
uzyskanie prognozy o bardzo dobrej jakości. Informacja o tym jak można zmierzyć jakość
prognozy zostanie opisane szerzej w kolejnych rozdziałach niniejszego opracowania.
Zgodnie ze słownikiem wyrazów obcych PWN prognoza to przewidywanie przyszłych
faktów, zdarzeń, itp. oparte na uzasadnionych przesłankach, obliczeniach.
Istnieje wiele typów prognoz. Rozróżniamy prognozy warunkowe, których realizacja
uzależniona jest lub powodowana jest przez pewne okoliczności oraz prognozy
bezwarunkowe, czyli takie, których realizacja nie jest uzależniona (lub nie jest powodowana)
od żadnych okoliczności.
Prognozy możemy też podzielić na prognozy proste oraz prognozy złożone. W
przypadku prognozy prostej, określa ona stan jednej zmiennej, natomiast w przypadku
prognozy złożonej, określa ona stan wielu zmiennych.
Innym podziałem prognozy jest podział ze względu na rodzaje zmiennych użytych do
prognozowania. Mogą to być zmienne ilościowe oraz zmienne jakościowe. Zmienne
ilościowe można zapisać za pomocą liczby. W innym przypadku mówimy o zmiennych
jakościowych. Idąc dalej tym tropem, również prognoza może być ilościowa lub jakościowa.
Jakościową prognozę możemy podzielić na punktową (gdy zmienna przyjmie określoną
wartość np. że przychody danej firmy wzrosną o 60%) oraz przedziałową (gdy zmienna
83
powinna przyjąć wartość z przedziału, np. że przychody danej firmy wzrosną pomiędzy 50%
a 70%). Natomiast prognoza jakościowa, jest to prognoza, której wynikiem jest stan zmiennej
jakościowej lub słownie opisana sytuacja dotycząca zmiennej ilościowej (przykładem
prognozy jakościowej jest np. zachmurzenie, które możemy określić jako małe, umiarkowane,
duże, itp.).
Ze względu na okres prognozy, rozróżniamy prognozy:
• krótkoterminowe,
• średnioterminowe,
• długoterminowe.
Należy zauważyć, że dla każdej osoby oraz podmiotu, innym horyzontem będzie się
odznaczać dana prognoza (np. prognoza krótkoterminowa meteorologii to jeden dzień,
natomiast dla rządu jest to z reguły rok).
Rola prognoz w ekonomii sprowadza się do dostarczenia informacji dotyczących
przewidywanego kształtowania się zjawisk ekonomicznych w przyszłości. Te informacją
muszą być obiektywne naukowo.
Błąd! Nie można odnaleźć źródła odwołania. przedstawia podstawowe funkcje
prognoz:
Rys. 0.1. Funkcje prognoz
Źródło: opracowanie własne
Funkcja preparacyjna uznawana jest za najważniejszą, gdyż zadaniem prognozy jest
wspomóc proces podejmowania racjonalnych decyzji gospodarczych. Osoba przygotowuje
prognozy dla podmiotu podejmującego decyzje, czyli decydenta. Osoba ta jest zwana
prognostą. Decydent podejmuje decyzje zarówno na poziomie mikro- jak
Funkcje prognoz
preparacyjna aktywizująca informacyjna
84
i makroekonomicznym. Przygotowanie prognoz, czyli stworzenie przesłanek do podjęcia
realnej decyzji, bardzo często uważa się za główny cel prognozowania.
Funkcja aktywizuj ąca polega na pobudzaniu do podejmowania działań sprzyjających
realizacji prognoz, gdy zapowiada ona zdarzenia korzystne lub przeciwstawiających się jej
realizacji, gdy przewidywane zdarzenia są oceniane jako niekorzystne. Kwalifikacja zdarzeń
jako korzystnych, czy też niekorzystnych jest zależna od społeczeństwa i ich systemu
wartości. Należy tutaj podkreślić, że to co dla jednych jest zdarzeniem korzystnym, dla
innych może być postrzegane jako niekorzystne. Funkcja aktywizująca prowadzi do
wyznaczania prognoz badawczych, których zadaniem jest wszechstronne oraz bezstronne
podejście do przewidywania przyszłości, co przejawia się przez ukazanie wielu możliwych
wersji przyszłości. Specyficznym rodzajem prognozy badawczej jest prognoza ostrzegawcza,
której zadaniem jest przewidywanie zdarzeń niekorzystnych dla danych odbiorców prognozy.
Ostatnim typem funkcji jest funkcja informacyjna . Polega ona na oswajaniu ludzi z
nadchodzącymi zmianami. Dzięki temu informowaniu, zmniejsza ona lęk społeczeństwa
przed przyszłością, powoduje uspokojenie, a w niektórych sytuacjach nawet akceptację.
2.2. Organizacja procesu prognostycznego
Prognozowanie jest pewnego rodzaju procesem. Od stworzenia/zbudowania tego procesu,
może zależeć jakość prognozy. Sformułowanie prognozy wymaga wielu kroków, które można
spróbować ułożyć w pewien ogólny schemat.
Błąd! Nie można odnaleźć źródła odwołania. przedstawia przykładowy schemat
etapów prognozowania.
85
Rys. 0.2. Etapy prognozowania
Źródło: opracowanie własne
W proces prognozy zaangażowane są dwie strony. Pierwsza strona zleca prognozę,
natomiast druga ją przeprowadza. Osoba zlecająca prognozę najczęściej jest decydentem,
która na podstawie tej prognozy będzie musiała podjąć jakąś decyzję. Warto wspomnieć, że
decydent nie musi być specjalistą w budowaniu prognoz. Jego głównym zadaniem jest
sformułowanie zadania prognostycznego. Dodatkowo powinien on wspierać osobę
przeprowadzającą prognozowanie również na innych etapach, gdyż jest on znawcą zjawiska,
które będzie prognozowane. W pierwszym etapie decydent powinien, określić obiekt lub
zjawisko, które będzie prognozowane, gdzie ono zachodzi i jakie jego zdaniem zmienne
najlepiej to zjawisko charakteryzują. Osoba zlecająca prognozę powinna wyznaczyć również
cel wyznaczenia prognozy, czyli to do czego jej ta prognoza będzie potrzebna. Istotnym
elementem dla osoby przeprowadzającej prognozę, jest horyzont czasowy tej prognozy, gdyż
liczba detali prognozy będzie malała wraz ze wzrostem horyzontu prognozy.
Podanie przesłanek prognostycznych wymaga współpracy obu stron. Jednak to
osoba przeprowadzająca prognozę powinna na tym etapie odgrywać rolę wiodącą. Powinna
ona zadawać osobie zlecającej pytania o realia zjawiska, konsultować z tą osobą opinie i
teorie uzyskane w wyniku analizy literatury naukowej przedmiotu oraz badań
dotychczasowych danego zjawiska. Analizując różne teorie, można wybrać te, które wydają
się najbardziej adekwatne w tym konkretnym przypadku prognostycznym. Analiza teorii
ułatwia również wybór modelu oraz danych wejściowych do modelu. Efektem tych prac
Sformułaowanie
zadania
Podanie
przesłanekWybór metody
Wyznaczenie
prognozy
Ocena
dopuszczalnościWeryfikacja
86
powinny być hipotezy o czynnikach kształtujących zjawisko, które będzie prognozowane, a
także określenie oraz zebranie zbioru danych potrzebnych do sporządzenia prognozy.
Wybór metody prognozowania jest po części wynikiem/konsekwencją uzgodnień z
osobą zlecającą prognozę. Wybór metody zależy od rodzaju posiadanych danych oraz
uzgodnionych z decydentem przesłanek prognostycznych. Warto jednak zwrócić uwagę, że
ostateczna decyzja o metodzie użytej do prognozowania, zależy wyłącznie od prognosty.
Wyznaczenie prognozy powinno przebiegać zgodnie z najlepszymi standardami
statystyki/ekonometrii oraz ogólnym schematem, którego wybór jest uzależniony od
wybranego modelu. W tym miejscu prognosta ma możliwość określenia dodatkowych
parametrów, takich jak stała wygładzania, przedział ufności prognozy, funkcja trendu, jeśli
występuje, itp.
Ocena dopuszczalności prognozy – jest to informacja, czy prognoście udało spełnić
się oczekiwania osoby zlecającej prognozę (horyzont czasowy, wymogi jakościowe, itp.).
Weryfikacja prognozy polega na oszacowaniu błędu ex post, gdy prognoza dotyczyła
zmiennej ilościowej lub na porównaniu prognozowanego stanu zmiennej ze stanem
faktycznym. O możliwych wyliczeniach błędów ex post będzie szerzej w następnych
rozdziałach niniejszego opracowania. Systematyczna weryfikacja prognoz nazywa się
monitoringiem i jest ona pożądana w przypadku istotnych decyzji gospodarczych, które nie są
przeprowadzane jednorazowo.
2.3. Zasady i metody prognozowania
W niniejszym rozdziale zostaną zaprezentowane najbardziej popularne zasady/reguły
prognozowania oraz przedstawione zostaną różne metody prognozowania.
2.3.1. Zasady prognozowania
Jak już zostało wspomniane, ideą prognozowania jest przewidzenie pewnego zjawiska w
przyszłości za pomocą różnego rodzaju metod oraz wiedzy i doświadczenia osoby
przeprowadzającej prognozę, a także analizy historycznej tego zjawiska. W metodzie
prognozowania można wyodrębnić dwie fazy: fazę diagnozowania przeszłości oraz fazę
określania przyszłości. Diagnozowanie przeszłości może odbywać się za pomocą budowy
formalnego modelu (np. ekonometrycznego) lub myślowego (tworzonego przez eksperta).
Sposób przejścia od danych do prognozy, czyli faza określania przyszłości nazywana jest
zasadą prognozy lub regułą prognozy. Należy pamiętać, że określonemu sposobowi
87
(metodzie) przetworzenia danych rzeczywistych mogą towarzyszyć różne zasady
wyznaczania prognozy. Błąd! Nie można odnaleźć źródła odwołania. obrazuje najczęściej
stosowane reguły/zasady prognozy.
Prognoza za pomocą metody podstawowej zakłada, że model będzie aktualny w
chwili na którą określa się prognozę. Parafrazując oznacza to, że w chwili obecnej budujemy
model na danych rzeczywistych (przeszłych) i zakładamy, że na chwilę przyszłą ten model
również będzie aktualny. Przyjecie tej reguły powoduje, że prognozę otrzymujemy w skutek
ekstrapolacji modelu. Reguła jest stosowana, gdy osoba przeprowadzająca prognozę uważa,
że model, który dość dobrze dopasował się do danych i opisywał przeszłość, będzie również
aktualny w przyszłym momencie, na który budowana jest prognoza. Najbardziej popularnym
modelem opartym o regułę podstawową jest klasyczny model regresji liniowej.
Prognoza za pomocą metody podstawowej z poprawką jest rozszerzeniem prognozy
za pomocą metody podstawowej. Korzystamy z tej reguły w przypadku, jeśli występują
uzasadnione przypuszczenia, że zaobserwowane ostatnio odchylenie danych empirycznych od
modelu utrzyma się w przyszłości. Jeśli osoba przeprowadzająca prognozę jest przekonana, że
odchylenie to będzie stałe, wtedy o wartość tego odchylenia powiększa prognozę modelu. W
przypadku, gdy odchylenie nie jest stałe i nastąpiło w kilku ostatnich obserwacjach, wtedy
jako poprawkę można przyjąć średnią arytmetyczną (jeśli osoba przeprowadzająca prognozę
uważa, że odchylenie dla każdej obserwacji jest tak samo istotne) lub średnią ważoną (jeśli
osoba przeprowadzająca prognozę uważa, że odchylenie w każdym momencie nie jest tak
samo istotne i np. chce przypisać większe wagi odchyleniom ostatnim).
88
Rys. 0.3. Zasady/reguły prognozy Źródło: opracowanie własne
Prognoza za pomocą metody największego prawdopodobieństwa zakłada, że
wartością przyszłą będzie stan zmiennej lub wartość, któremu odpowiada najwyższe
prawdopodobieństwo lub maksymalna wartość funkcji gęstości rozkładu. Reguła ta może być
stosowana, gdy zmienna prognozowana jest zmienną losową i znamy jej rozkład
prawdopodobieństwa, bądź jesteśmy w stanie oszacować go na podstawie rzeczywistych
danych (próbki). Reguła ta jest najczęściej stosowana, gdy zmienna prognozowana jest
skokowa lub niemierzalna. Upraszczając, można powiedzieć, że wartością prognozowaną jest
moda/dominanta rozkładu.
Prognoza za pomocą metody minimalnej straty zakłada, że wartością przyszłą
będzie wartość zmiennej, która spowoduje minimalną stratę. Metoda ta zakłada, że wielkość
straty jest funkcją błędu prognozy i aby wybrać prognozę, należy znaleźć minimum tej
funkcji. Z założenia, reguła ta powinna być powiązana z pewnego rodzaju negatywnym
skutkiem jak np. wysokie nakłady finansowe, prawdopodobieństwo niewykonania projektu,
ryzyko wystąpienia różnego rodzaju niepokojów społecznych, itp.
Zasady
prognozy
Podstawowa
Podstawowa
z poprawką
Największego
prawdopodo-
bieństwa
Minimalnej
straty
89
2.3.2. Metody prognozowania
Rysunek 2.4 przedstawia schemat obrazujący różne metody prognostyczne. Metody zostały
pogrupowane ze względu na rodzaj wykorzystywanych danych i sposób ich przetworzenia.
Rys. 0.4. Metody prognostyczne Źródło: opracowanie własne na podstawie [34]
Pierwszym podziałem metod prognostycznych jest podział na metody matematyczno-
statystyczne oraz metody niematematyczne.
Metody niematematyczne, zwane również heurystycznymi, polegają na
wykorzystaniu opinii grupy ekspertów, opartej na ich wiedzy, intuicji oraz wyobraźni.
Przewidywanie w przypadku modeli niematematycznych nie jest ekstrapolowaniem
wykrytych w danych rzeczywistych różnych prawidłowości, lecz bardziej prognozowaniem
możliwych wariantów rozwoju zjawisk i wskazywaniem tych najbardziej realistycznych.
Metody
prognostyczne
Matematyczno-
statystyczne
Oparte na
modelach deterministycznych
Oparte na
modelach ekonometrycznych
Jednorównaniowe
- Klasyczne modele trendu
- Adaptacyjne
- Przyczynowo-
skutkowe
- Autoregresyjne
Wielorównaniowe
- Proste
- Rekurencyjne
- O równaniach
współzależnych
Niematematyczne
- Ankietowe
- Intuicyjne
- Kolejnych przybliżeń
- Ekspertyz
- Delficka
- Refleksji
- Analogowe
- Burza mózgów
- Sieci neuronowe
90
Warto wyróżnić burzę mózgów i metodę delficką, które zakładają większą trafność prognozy
opartej o uzgodnienia miedzy grupą ekspertów, niż prognozy pojedynczego eksperta.
Wykorzystywane są do sporządzania prognoz długoterminowych, gdzie wykorzystanie
danych nie jest możliwe (np. odkrycia naukowe, rozwój techniki, itp.). Z innych bardziej
znanych metod niematematycznych warto wyróżnić sieci neuronowe. W wyniku procesu
uczenia się i adaptacji do nowych danych, sieci zdobywają wiedzę, którą potem wykorzystują
w procesie prognozowania. Metody analogii są często wykorzystywane w biologii, gdzie
zakłada się analogiczną drogę rozwoju dla niektórych podobnych zjawisk.
Drugą klasą są wszystkie metody matematyczno-statystyczne, które to oparte są o
modele matematyczne, statystyczne lub ekonometryczne. Są one znacznie bardziej popularne
i nie wymagają tak dogłębnej wiedzy eksperckiej przy ich budowaniu. Metody te bazują
bardziej na pewnych prawidłowościach w przeszłości, które starają się odzwierciedlić w
przyszłości. Warto jednak zaznaczyć, że metody te, nie ukazują przyczyn powstania tych
prawidłowości.
Metody matematyczno-statystyczne możemy następnie podzielić na metody oparte na
modelach deterministycznych oraz modelach ekonometrycznych.
Modele deterministyczne, są to modele, które pozwalają obliczyć prognozowaną
wartość bez żadnego błędu w dowolnym momencie w przyszłości. Do takich modeli możemy
zaliczyć m.in. wysokość prognozowanych odsetek na lokacie kapitałowej ze znanym
oprocentowaniem przy znanej metodzie kapitalizacji odsetek. Wtedy osoba znająca wzór na
kwotę odsetek oraz metodę kapitalizacji może bez żadnego błędu obliczyć kwotę odsetek.
Niestety większość zjawisk (ekonomicznych, finansowych, czy socjologicznych) nie
jest deterministyczna, co oznacza, że na wielkość tych zjawisk mają także wpływ inne
czynniki natury losowej. Owe czynniki wykluczają możliwość znalezienia modelu
deterministycznego, który mógłby w sposób dokładny opisać lub zaprognozować te zjawiska.
Należy wtedy zbudować model, który z pewnym prawdopodobieństwem pozwala wyznaczyć
przyszłą wielkość badanego zjawiska. Model taki nazywamy modelem ekonometrycznym.
W modelach ekonometrycznych, w odróżnieniu od modeli deterministycznych, przyszłą
wartość danego szeregu możemy wyznaczyć z pewnym błędem, który to odpowiada
czynnikowi losowemu badanego zjawiska. Oczywiście przy budowie modeli chcemy, aby ten
błąd był jak najmniejszy.
Modele ekonometryczne możemy następnie podzielić na jednorównaniowe oraz
wielorównaniowe.
91
Model jednorównaniowy jest to model, który do opisania danego zjawiska używa
wyłącznie jednego równania. Natomiast model wielorównaniowy jest to model, który do
opisania danego zjawiska używa wielu równań (układu równań). Modele wielorównaniowe są
znacznie bardziej skomplikowane, gdyż pomiędzy zmiennymi mogą występować różne
zależności albo sprzężenia zwrotne.
W niniejszym opracowaniu zostaną zaprezentowane modele z kategorii
matematyczno-statystycznej oparte o modele ekonometryczne jednorównaniowe.
2.4. Rodzaje błędów prognoz i rodzaje jakości prognoz
W niniejszym rozdziale zostaną zaprezentowane rodzaje błędów prognoz oraz rodzaje jakości
prognoz.
2.4.1. Rodzaje błędów prognoz Określając pojęcie prognozy zostało zaznaczone, że jest ona odzwierciedleniem modelu
ekonometrycznego obarczonego błędem losowym. W tym podrozdziale zostaną omówione
rodzaje błędów oraz metody ich pomiaru.
Błąd prognozy można określić jako różnicę pomiędzy wartościami prognozowanymi,
a wartościami rzeczywistymi. Matematycznie można to zapisać za pomocą następującego
wzoru:
�� = ��∗ − ��, (2.1)
gdzie:
• �� – zmienna rzeczywista Y w okresie t,
• ��∗ – prognoza zmiennej Y w okresie t.
Zauważmy, że błąd może być określony po upływie czasu na który prognoza była
ustalona, czyli gdy znana jest realizacja zmiennej prognozowanej na ten czas. Wtedy mówimy
o prognozie ex post, czyli o trafności prognozy.
Jeśli natomiast błąd jest określony przed upływem czasu na który prognoza była
ustalona, czyli gdy nie jest znana realizacja zmiennej prognozowanej, a jedynie jej
spodziewana realizacja na ten czas, wtedy mówimy o prognozie ex ante, czyli o dokładności
prognozy. Błąd prognozy ex ante jest szacowany w tym samym momencie co prognoza i
służy określeniu jej dopuszczalności.
Do najczęściej stosowanych metod pomiarów błędów ex post należą:
92
• bezwzględny błąd prognozy w okresie t – informuje jak duże było odchylenie
prognozy od wartości rzeczywistej zmiennej Y. Znak błędu wskazuje, czy rzeczywista
wartość była wyższa czy też niższa od prognozy. Matematycznie bezwzględny błąd
prognozy można zapisać za pomocą następującego wzoru
�� = ��∗ − �� . (2.2)
• średni błąd predykcji ex post (ang. mean error – ME) – informuje jak duży jest błąd
z ostatnich m wyrazów predykcji w porównaniu z danymi rzeczywistymi. W
przypadku prognozy nieobciążonej wartość średniego błędu predykcji ex post
powinna być równa 0. Przeważnie tak jednak nie jest. Wadą tego błędu jest to, że
odchylenia dodatnie i ujemnie znoszą się wzajemnie. Matematycznie średni błąd
predykcji ex post można zapisać za pomocą następującego wzoru [20]
�� = 1�����∗ − ���
���.
(2.3)
• względny błąd prognozy ex post w okresie t – informuje jak duże było odchylenie
prognozy od wartości rzeczywistej zmiennej Y liczonej w procentach wartości
rzeczywistej zmiennej Y. Znak błędu wskazuje, czy rzeczywista wartość była wyższa,
czy też niższa od prognozy. Matematycznie względny błąd prognozy ex post można
zapisać za pomocą następującego wzoru
Ψ� =
��∗ − ���� ∗ 100. (2.4)
• średni kwadratowy błąd prognozy ex post w przedziale weryfikacji – informuje o
przeciętnym odchyleniu prognoz od wartości rzeczywistej w przedziale empirycznej
weryfikacji prognoz. Pierwiastek błędu może być porównywalny z odchyleniem
standardowym reszt. Matematycznie średni kwadratowy błąd prognozy ex post można
zapisać za pomocą następującego wzoru
s∗�=
1
T − n� ���∗ − ����
����. (2.5)
• średni względny błąd prognozy ex post – informuje jaki procent rzeczywistej
zmiennej Y stanowiło przeciętne bezwzględne odchylenie prognozy od danych
rzeczywistych. Jest on wyrażony w procentach. Matematycznie średni względny błąd
prognozy ex post można zapisać za pomocą następującego wzoru [1]
93
Ψ =
1
T − n� ��∗ − ���� ∗ 100�
����. (2.6)
Do najczęściej stosowanych metod pomiarów błędów ex ante należą:
• wariancja prognozy w okresie t – informuje jak duże jest rozproszenie możliwych
prognoz wokół możliwych realizacji zmiennej prognozowanej. Matematycznie
wariancję prognozy można zapisać za pomocą następującego wzoru
��� = ����∗ − ���. (2.7)
• bezwzględny błąd prognozy ex ante w okresie t – informuje jak duże jest przeciętne
odchylenie realizacji zmiennej prognozowanej od prognozy. Błąd ten służy określeniu
dokładności prognozy. Prognoza jest tym dokładniejsza, im mniejsza jest wartość tego
błędu. Błąd ten jest wystarczający do wyboru kilku prognoz otrzymanych z różnych
modeli tej samej zmiennej. Bezwzględny błąd prognozy ex ante w okresie t jest równy
pierwiastkowi z wariancji prognozy w okresie t. Matematycznie bezwzględny błąd
prognozy ex ante można zapisać za pomocą następującego wzoru
�� = ���� = �����∗ − ���. (2.8)
• względny błąd prognozy ex ante w okresie t – informuje jak duże jest przeciętne
odchylenie realizacji zmiennej prognozowanej od prognozy liczonej w procentach
wartości prognozowanej. Błąd ten służy określeniu dokładności prognozy. Jest on
wystarczający do wyboru kilku prognoz otrzymanych z różnych modeli kilku
zmiennych. Matematycznie względny błąd prognozy ex ante można zapisać za
pomocą następującego wzoru
�� = ����∗. (2.9)
• prawdopodobieństwo realizacji prognozy jest kolejnym sposobem określania
dopuszczalności prognozy. Jeśli zmienna prognozowana jest losową zmienną
skokową, to możemy wyznaczyć prawdopodobieństwo, że zmienna Y przyjmie
wartość ��∗. Jeśli natomiast zmienna prognozowana jest zmienną losową ciągłą, to
��|��∗ − ��| < � = ��, (2.10)
gdzie ε jest dowolnie małą dodatnią liczbą otrzymana jako krotność błędu ex ante.
Wartość γt nazywana jest również wiarygodnością prognozy.
94
2.4.2. Rodzaje jakości prognoz Oprócz informacji o błędach i niedopasowaniu wartości prognozowanych modelu do wartości
rzeczywistych lub możliwych realizacji zmiennej prognozowanej, bardzo istotną informacją
jest informacja dotycząca jakości modelu. Jakość modelu jest traktowana jako jakość
prognozy, albo zgodność modelu z danymi empirycznymi. Jest wiele mierników, które mogą
określać rodzaj jakości prognozy. Do najważniejszych z nich możemy zaliczyć:
• współczynnik determinacji R2 – określa miarę dopasowania liniowego modelu
regresji do danych rzeczywistych. Współczynnik R2 przyjmuje wartości z przedziału
[0,1] w przypadku gdy model jest szacowany za pomocą metody najmniejszych
kwadratów. Im większa wartość współczynnika, tym większa część zmienności
zmiennej objaśnianej została wyjaśniona przez model, a co za tym idzie model jest
lepszej jakości. Matematycznie współczynnik determinacji można zapisać za pomocą
następującego wzoru
�� = ∑ ���∗ − ������∑ ��� − ������, (2.11)
gdzie �� jest wartością średnią zmiennej Y.
• skorygowany współczynnik determinacji, analogicznie jak współczynnik
determinacji pokazuje miarę dopasowania modelu do zmiennych rzeczywistych. W
odróżnieniu jednak od standardowego współczynnika determinacji, ma on pewną
zaletę. Standardowy współczynnik determinacji nie pozwala porównywać kilku
modeli z różną liczbą danych, gdyż każde dołożenie dowolnej zmiennej do modelu
powoduje zwiększenie standardowego współczynnika determinacji, natomiast
skorygowany współczynnik determinacji nie jest podatny na ten zabieg.
Matematycznie skorygowany współczynnik determinacji można zapisać za pomocą
następującego wzoru
��� = 1 − � − 1� −� − 1��, (2.12)
gdzie m jest liczbą zmiennych objaśniających w modelu (nie wliczając wyrazu
wolnego).
• odchylenie standardowe składnika resztowego informuje jakie są przeciętne
odchylenia wartości rzeczywistych zmiennej prognozowanej od teoretycznych. Im
mniejsza jest wartość tego odchylenia, tym lepsza jest jakość modelu. Matematycznie
95
odchylenie standardowe składnika resztowego można zapisać za pomocą
następującego wzoru
� = � 1� −� − 1����∗ − ���
���, (2.13)
• współczynnik wyrazistości informuje, jaka część średniej wartości zmiennej Y
stanowi jej odchylenie reszt. Jest to więc charakterystyka zmienności losowej
zmiennej Y (czyli tej części niewyjaśnionej przez model). Model jest tym lepszy, im
mniejsza wartość tego współczynnika. Matematycznie współczynnik wyrazistości
można zapisać za pomocą następującego wzoru
� = ��� ∗ 100. (2.14)
Oceny jakości modelu można również dokonać pośrednio patrząc, czy poszczególne
zmienne objaśniające istotnie wpływają na zmienną prognozowaną. W tym celu oblicza się
błąd oceny estymatora każdego parametru, który nazywany jest również średnim błędem
szacunku parametru.
2.5. Prognozowanie na podstawie klasycznych modeli trendu
Klasyczne modele zakładają prognozę za pomocą metody podstawowej, co jak wcześniej
zostało już opisane, zakłada, że model będzie niezmienny w czasie (budowany model na
danych rzeczywistych będzie aktualny również do prognozowania przeszłości). Z punktu
widzenia matematycznego oznacza to, ze szereg jest stacjonarny. W tym i następnych
rozdziałach będziemy się koncentrować na szeregach, które nie są deterministyczne, co
będzie jednym z założeń prezentowanych modeli. Oznacza to, że w analizowanych szeregach
będziemy wyróżniać dwie składowe:
• składową systematyczną związaną z procesem deterministycznym (tą zmienną
powinniśmy zaprognozować bez żadnego błędu),
• składową przypadkową (zwaną również składnikiem losowym lub wahaniem
przypadkowym) związaną z procesem stochastycznym szeregu czasowego.
Składowa systematyczna może wystąpić w postaci trendu lub wahań cyklicznych
(sezonowych). Trend jest to długookresowa skłonność do jednokierunkowej zmiany (wzrostu
lub spadku) wartości badanej zmiennej. Przy klasycznych modelach trendu nie zakładamy
96
zmiany trendu lub jego załamania. Trend jest konsekwencją zestawu czynników, które
działają na prognozowane zjawisko.
Wahania cykliczne (sezonowe) to okresowe zmiany wartości badanej zmiennej wokół
trendu. Zmiany te powtarzają się co pewien okres zwany cyklem.
Proces wyodrębniania poszczególnych składowych szeregu czasowego nazywa się
jego dekompozycją.
Rysunek 2.5 przedstawia najważniejsze modele, które możemy zaliczyć do kategorii
klasycznych modeli trendu.
Rys. 0.5. Klasyczne modele trendu Źródło: opracowanie własne
Poszczególne modele prognostyczne zostaną szczegółowo opisane w następnych
rozdziałach niniejszego opracowania.
2.5.1 Klasyczny model regresji liniowej
Klasycznym, a zarazem najbardziej znanym modelem trendu jest model klasycznej regresji
liniowej. W tym przypadku zakładamy, że trend jest liniowy. Klasyczny model regresji
Klasyczne modele trendu
Klasyczny
model regresji
liniowej
Metoda
harmonikiMetoda Kleina
97
liniowej stosuje się do danych bez elementów sezonowości. Matematycznie funkcje trendu
możemy zapisać za pomocą następującego wzoru [41]
�� = � + � ∙ � + �, (2.15)
gdzie:
• α, β są parametrami strukturalnymi funkcji regresji natomiast,
• ε jest błędem oszacowania całej funkcji (reszty modelu). Zakłada się, że ε ma rozkład
normalny o średniej zero.
Parametry α oraz β nie są znane. Osoba przeprowadzająca prognozę szacuje je na
podstawie próby. Metodą szacowania tych parametrów jest minimalizacja sumy kwadratów
reszt zwana Klasyczną Metodą Najmniejszych Kwadratów (KMNK). Nazwa tej metody
wzięła się stąd, że jej zasada działania to minimalizacja sumy kwadratów reszt, otrzymanych
po odjęciu od rzeczywistych wartości yt wartości funkcji regresji.
Estymatory parametrów α oraz β aproksymujemy odpowiednio za pomocą
parametrów a oraz b wyliczonych za pomocą następujących funkcji [41]:
� = �� �� , (2.16)
! = �� − � ∙ ". (2.17)
gdzie:
�� =��" − "�
��, (2.18)
�� =��" − "�� − ��.
�� (2.19)
Przykład 2.1.
Zastosujmy klasyczny model regresji liniowej do danych obrazujących płacę
minimalną w poszczególnych latach. Dane pochodzą z Głównego Urzędu Statystycznego od
początku roku 2003 do roku 2013.
Tabela 0.1 zawiera wartość płacy minimalnej w poszczególnych latach. Dodatkowo
tabela zawiera dodatkowe kolumny z wyliczeniami zmiennych pomocniczych niezbędnych do
oszacowania prostego modelu regresji. Następnie oszacujmy wartości parametrów prostej
regresji a oraz b posługując się odpowiednio wzorami (2.16) oraz (2.17) wiedząc, ze średnia x
wynosi 6, natomiast średnia y wynosi 1 137,55.
98
Tabela 0.1. Dane dotyczące płacy minimalnej
rok (x) płaca minimalna (y) �$� − $% �$� − $%� �&� − &% �$� − $%�&� − &% 2003 800 -5 25 -337,55 1 687,77 2004 824 -4 16 -313,55 1 254,22 2005 849 -3 9 -288,55 865,66 2006 899,1 -2 4 -238,45 476,91 2007 936 -1 1 -201,55 201,55 2008 1126 0 0 -11,55 0,00 2009 1276 1 1 138,45 138,45 2010 1317 2 4 179,45 358,89 2011 1386 3 9 248,45 745,34 2012 1500 4 16 362,45 1 449,78 2013 1600 5 25 462,45 2 312,23
Suma 110 9 490,80 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Otrzymamy następujące wartości:
� = �� �� = 9490,80110= 86,28, (2.20)
! = �� − � ∙ " = 1137,55 − 86,28 ∙ 6 = 619,87. (2.21)
Zatem wzór prostej regresji przyjmie postać:
�� = 619,87 + 86,28 ∙ �. (2.22)
Wyliczmy wartości prognozowane na poszczególne okresy zgodnie z powyższym
wzorem. Tabela 0.2 zawiera dane rzeczywiste wraz z wartościami płacy minimalnej
wyliczonymi za pomocą funkcji regresji – wzór (2.22).
Tabela 0.2. Prognozowanie za pomocą regresji liniowej
rok (x) płaca minimalna (y) wartość dopasowana (y*) 2003 800,00 706,15 2004 824,00 792,43 2005 849,00 878,71 2006 899,10 964,99 2007 936,00 1 051,27 2008 1 126,00 1 137,55 2009 1 276,00 1 223,83 2010 1 317,00 1 310,11 2011 1 386,00 1 396,39 2012 1 500,00 1 482,67 2013 1 600,00 1 568,95 2014 1 655,23
Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
99
Rysunek 2.6 podsumowuje dane z Tabela 0.2.
Rys. 0.6. Wykres funkcji regresji liniowej wraz z danymi rzeczywistymi Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Na podstawie tego wykresu można zauważyć, że model dość dobrze dopasował się do
danych. Współczynnik R2 wyniósł 96%, co oznacza, że 96% zmienności zmiennej
prognozowanej jest wyjaśnione przez model.
Warto zauważyć, że za pomocą klasycznego modelu regresji liniowej można
prognozować na znacznie więcej okresów niż tylko jeden. W takim przypadku, do funkcji
regresji należy wstawić rok, na który chcemy wyliczyć prognozę.
Dodatkowo warto wspomnieć, że model regresji liniowej możemy zbudować na
więcej niż jednej zmiennej objaśniającej. Parafrazując, za pomocą regresji liniowej możemy
prognozować wartości danego zjawiska używając kilku zmiennych objaśniających, jednak
jest to trudniejsze i wymaga lepszych narzędzi informatycznych.
2.5.2. Metoda harmoniki
Drugim dość popularnym modelem klasycznych modeli trendu jest metoda harmoniki zwana
inaczej analiza harmoniczną. Jest to swojego rodzaju rozszerzenie modelu klasycznej regresji
liniowej. Model można stosować do danych z wahaniami periodycznymi. Model ten daje dość
dobre rezultaty wyodrębniania sezonowości z szeregów czasowych. Metoda ta polega na
600,00
800,00
1 000,00
1 200,00
1 400,00
1 600,00
1 800,00
2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
wartość dopasowana (y*) płaca minimalna (y)
100
zbudowaniu modelu w postaci sumy tzw. harmonik, tj. funkcji sinusoidalnych lub
kosinusoidalnych o danych okresach. Pierwsza harmonika ma okres równy długości okresu
badanego, druga połowie tego okresu, trzecia jednej trzeciej okresu badanego, itd. Ogólnie w
przypadku n obserwacji, liczba wszystkich możliwych harmonik jest równa �.
Funkcję prognozującą, opisaną za pomocą modelu harmoniki, możemy zapisać
następującym równaniem matematycznym [38]
��� = '�( +�)� sin *2+� ,(- + � cos*2+� ,(-.�
��, (2.23)
gdzie, f(t) jest funkcją trendu, jeśli dany szereg posiada tendencję rozwojową. Natomiast
pozostały człon odpowiada za sezonowość w modelu. W przypadku braku sezonowości, wzór
ten możemy uprościć do postaci
��� = �� +�)� sin *2+� ,(- + � cos*2+� ,(-. .�
�� (2.24)
Estymatory parametrów α0, αi oraz βi, możemy otrzymać stosując metodę
najmniejszych kwadratów odpowiednio do następujących funkcji:
!� =��
��, (2.25)
! = 2���
��sin *2+� ,(- ,, = 1, 2, … ,�
2− 1, (2.26)
� = 2���
��cos *2+� ,(- ,, = 1, 2, … ,�
2− 1.
(2.27)
Dla ostatniej harmoniki, o numerze równej �, wartości estymuje sie z następujących
wzorów:
!� = 0, (2.28)
�� = 1���
��cos�+(. (2.29)
Zauważmy, że estymatorem wyrazu wolnego jest po prostu średnia z wszystkich
wyrazów, natomiast pozostałe wyrazy informują jak daleko od tej średniej się odsuwamy.
O składowych ai/bi możemy myśleć, jak o współczynnikach pokazujących, w którą
stronę odchyla się suma wartości yi wyskalowanych funkcji sinus lub cosinus o odpowiednim
101
okresie (składowa pierwsza uwzględnia jeden okres funkcji w obrębie danych, składowa
druga dwa okresy, trzecia trzy, itd.).
Następnie należy wyliczyć wartość amplitudy dla poszczególnych harmonik, którą to
wyraża się wzorem
/ � = ! � + � �. (2.30)
W celu zlokalizowania amplitud i faz na osi czasu, dla każdej harmoniki można
wyznaczyć wartości przesunięcia fazowego za pomocą następującego wzoru:
�!0(1ść2034�5�,ę6,!'!31�471 = � 8 , (2.31)
gdzie εi oraz θi odpowiednio wyznacza się za pomocą następujących wzorów:
� = !06(7 *! � -, (2.32)
8 = 2+� ,. (2.33)
Liczba harmonik, które należy wyznaczyć, jest tym większa, im dłuższy jest
wyjściowy szereg czasowy. Przeważnie nie ma potrzeby wyliczania wszystkich harmonik
możliwych do wyliczenia w modelu. Należy to zrobić wyłącznie dla zmiennych, których
składowe istotnie wpływają na wartość szeregu wyjściowego Y. Wymaga to określenia
udziału poszczególnych harmonik w ogólnej zmienności funkcji. Udział ten jest określony za
pomocą następującego ilorazu
� =/ �2�� , , = 1, 2, … ,�
2− 1. (2.34)
Dla ostatniej harmoniki, o numerze równej �, udział jest określony za pomocą
następującego wzoru
�� =/ ��� , , = �
2, (2.35)
gdzie s2 jest wariancją zmiennej Y.
Do prognozy używamy tylko tych wartości harmonik, dla których udział w ogólnej
zmienności jest największy. Warto tutaj zaznaczyć, że żadne dwie harmoniki, nie są ze sobą
skorelowane i nie mogą uwzględniać jednej i tej samej części ogólnej wariancji. Oznacza to,
że części ogólnej zmienności Y, które są uwzględniane przez różne harmoniki, można
sumować.
102
Przykład 2.2.
Zastosujmy metodę harmoniki do prognozy danych dotyczących zużycia energii w
poszczególnych miesiącach.
Tabela 0.3 zawiera wartości energii elektrycznej w kWh w poszczególnych
miesiącach (są to dane fikcyjne wygenerowane na potrzeby tego ćwiczenia) oraz wartości a1-
a3 oraz wartości b1-b3 wyliczone odpowiednio za pomocą wzorów (2.26) oraz (2.27) dla
danych obserwacji. Natomiast wiersz „ai/bi” zawiera wyliczona już sumę zgodnie z tymi
wzorami.
Tabela 0.3. Prognozowanie metodą harmoniki
Energia elektryczna w kWh
a1 a2 a3 b1 b2 b3
14,75 3,82 7,38 10,43 14,25 12,78 10,43 13,62 6,81 11,79 13,62 11,79 6,81 0,00 12,89 9,11 12,89 9,11 9,11 0,00 -9,11 11,38 9,86 9,86 0,00 5,69 -5,69 -11,38 11,84 11,44 5,92 -8,37 3,06 -10,25 -8,37 9,76 9,76 0,00 -9,76 0,00 -9,76 0,00 10,86 10,49 -5,43 -7,68 -2,81 -9,41 7,68 9,78 8,47 -8,47 0,00 -4,89 -4,89 9,78 10,13 7,16 -10,13 7,16 -7,16 0,00 7,16 11,32 5,66 -9,80 11,32 -9,80 5,66 0,00 12,49 3,23 -6,24 8,83 -12,06 10,82 -8,83 14,84 0,00 0,00 0,00 -14,84 14,84 -14,84 14,74 -3,81 7,37 -10,42 -14,24 12,76 -10,42 13,26 -6,63 11,49 -13,26 -11,49 6,63 0,00 13,46 -9,52 13,46 -9,52 -9,52 0,00 9,52 12,62 -10,93 10,93 0,00 -6,31 -6,31 12,62 11,49 -11,10 5,74 8,12 -2,97 -9,95 8,12 10,11 -10,11 0,00 10,11 0,00 -10,11 0,00 10,78 -10,42 -5,39 7,63 2,79 -9,34 -7,63 9,49 -8,22 -8,22 0,00 4,74 -4,74 -9,49 11,18 -7,90 -11,18 -7,90 7,90 0,00 -7,90 13,55 -6,78 -11,74 -13,55 11,74 6,78 0,00 13,68 -3,54 -6,84 -9,67 13,21 11,85 9,67 14,54 0,00 0,00 0,00 14,54 14,54 14,54
Suma -3,15 13,39 -3,81 2,75 23,02 1,55 ai/bi -0,26 1,12 -0,32 0,23 1,92 0,13 Źródło: opracowanie własne
Rysunek 2.7 przedstawia dopasowanie pierwszych trzech składowych ai do danych
wyjściowych wraz z tymi danymi. Jak już to zostało wspomniane, pierwsza harmonika
103
zakłada, że wyjściowe dane mają jeden okres, druga zakłada, że wyjściowe dane mają dwa
okresy, a trzecia, że wyjściowe dane mają trzy okresy.
Rys. 0.7. Dopasowanie poszczególnych składowych ai do danych. Źródło: opracowanie własne
Rysunek 2.8 przedstawia dopasowanie pierwszych trzech składowych bi do danych
wyjściowych wraz z tymi danymi.
Rys. 0.8. Dopasowanie poszczególnych składowych bi do danych. Źródło: opracowanie własne
-15,0
-10,0
-5,0
0,0
5,0
10,0
15,0
20,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Energia elektryczna w kWh a1 a2 a3
-20,0
-15,0
-10,0
-5,0
0,0
5,0
10,0
15,0
20,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Energia elektryczna w kWh b1 b2 b3
104
Zobaczmy następnie jak wygląda pierwszych piętnaście składowych ai oraz bi, wartość
amplitudy oraz ich udział w zmienności Y. Tabela 0.4 przedstawia te dane.
Tabela 0.4. Wyliczenie udziału w zmienności Y
i ai bi 9�� Udział w zmienności Y
1 -0,26 0,23 0,12 2,0% 2 1,12 1,92 4,92 81,2% 3 -0,32 0,13 0,12 1,9% 4 -0,08 0,37 0,14 2,3% 5 -0,03 -0,25 0,07 1,1% 6 0,00 0,09 0,01 0,1% 7 0,05 -0,30 0,09 1,5% 8 0,31 -0,08 0,10 1,7% 9 -0,06 0,08 0,01 0,2%
10 0,14 0,38 0,16 2,7% 11 0,09 -0,03 0,01 0,1% 12 0,00 -0,34 0,11 1,9% 13 -0,09 -0,03 0,01 0,1% 14 -0,14 0,38 0,16 2,7% 15 0,06 0,08 0,01 0,2%
Źródło: opracowanie własne
Jak widać pierwsze trzy obserwacje a1-a3 oraz b1-b3 są wzięte z ostatniego wiersza
Tabela 0.3. Kolumna / � została wyliczona zgodnie ze wzorem (2.30). Natomiast udział w
zmienności Y zgodnie ze wzorem (2.34). Wariancja zmiennej Y wynosi 3,03. Jak widać,
najlepszym dopasowaniem charakteryzuje się harmonika druga oraz czternasta (pogrubione w
tabeli). Ich udział w wariancji zmiennej Y wynosi odpowiednio 81,2% oraz 2,7%.
Następnie należy wyliczyć wartości dopasowane oraz prognozowane zgodnie ze
wzorem (2.24). Jednak do tego wzoru użyjemy wyłącznie harmoniki 2 oraz 14. Harmoniki te
przedstawia Rysunek 2.9.
105
Rys. 0.9. Harmoniki: druga oraz czternasta Źródło: opracowanie własne
Tabela 0.5 przedstawia wartości harmoniki 2 oraz harmoniki 14 wyliczonej zgodnie ze
wzorem (2.24). Wartość teoretyczna/dopasowana jest to wartość wyliczona jako suma
średniej wartości wyjściowego szeregu Y (α0) oraz harmoniki drugiej i czternastej. Średnia
wartość energii elektrycznej (szeregu wyjściowego) wynosi 12,2.
Tabela 0.5. Wartości prognozowane modelem analizy harmonicznej
Miesiące Energia
elektryczna w kWh Harmonika 2 Harmonika 14 Wartości teoretyczne
(prognozowane)
1 14,8 2,219 -0,397 14,013 2 13,6 1,925 0,311 14,426 3 12,9 1,116 -0,142 13,164 4 11,4 0,007 -0,065 12,132 5 11,8 -1,103 0,255 11,342 6 9,8 -1,918 -0,376 9,896 7 10,9 -2,219 0,397 10,368 8 9,8 -1,925 -0,311 9,954 9 10,1 -1,116 0,142 11,216
10 11,3 -0,007 0,065 12,248 11 12,5 1,103 -0,255 13,039 12 14,8 1,918 0,376 14,484 13 14,7 2,219 -0,397 14,013 14 13,3 1,925 0,311 14,426 15 13,5 1,116 -0,142 13,164 16 12,6 0,007 -0,065 12,132 17 11,5 -1,103 0,255 11,342
-2,500
-2,000
-1,500
-1,000
-0,500
0,000
0,500
1,000
1,500
2,000
2,500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Harmonika 2 Harmonika 14
106
Miesiące Energia
elektryczna w kWh Harmonika 2 Harmonika 14 Wartości teoretyczne
(prognozowane)
18 10,1 -1,918 -0,376 9,896 19 10,8 -2,219 0,397 10,368 20 9,5 -1,925 -0,311 9,954 21 11,2 -1,116 0,142 11,216 22 13,6 -0,007 0,065 12,248 23 13,7 1,103 -0,255 13,039 24 14,5 1,918 0,376 14,484 25 2,219 -0,397 14,013 Źródło: opracowanie własne
Rysunek 2.10 został zbudowany na podstawie danych z Tabela 0.5. Przedstawia on
wyjściowe dane o zużyciu energii elektrycznej wraz z wartościami teoretycznymi/
prognozowanymi.
Rys. 0.10. Dane wyjściowe oraz wartości teoretyczne/prognozowane. Źródło: opracowanie własne
Widać, że wartości teoretyczne dość dobrze dopasowały się do danych wyjściowych.
Zauważmy, że za pomocą metody harmoniki można prognozować na znacznie więcej
okresów niż tylko jeden. Wystarczy podstawiać kolejne wartości t na które chcemy znać
prognozę do wzoru (2.24).
8,000
10,000
12,000
14,000
16,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Wartości teoretyczne (prognozowane) Energia elektryczna w kWh
107
2.5.3. Metoda Kleina
Kolejną metodą pozwalającą na konstrukcję modelu, w którym znajdują się wahania
sezonowe oraz tendencja rozwojowa jest model zaprezentowany przez amerykańskiego
ekonomistę Lawrenca Roberta Kleina, który w roku 1980 otrzymał za ten model Nagrodę
Nobla [24]. Model ten od twórcy modelu jest nazywany jego nazwiskiem. Model Kleina
matematycznie można zapisać za pomocą następującego wzoru [34]
���� = ':(��;+ � ��� + �����
��� (2.36)
gdzie:
• f(t) jest funkcją trendu, przy czym (�� = ��< − 1 + =, gdzie l=1,..,N, j=1,…,m czyli
wartość w l-tym cyklu j-tej fazy,
• I i jest zmienną zero-jedynkową, która przyjmuje wartość jeden dla fazy o numerze i
oraz zero dla pozostałych faz cyklu,
• m jest liczbą faz w cyklu.
Parametry modelu Kleina szacuje się za pomocą metody najmniejszych kwadratów,
natomiast prognozy przez ekstrapolację oszacowanego modelu.
Ze względu na skomplikowanie modelu, nie zostanie on przedstawiony szerzej w
niniejszym opracowaniu.
2.6. Prognozowanie na podstawie modeli adaptacyjnych szeregów czasowych
Modele adaptacyjne zyskują coraz bardziej na popularności wśród modeli prognostycznych.
Jest to związane z faktem, że klasyczne modele zakładają prognozę za pomocą metody
podstawowej, co jak wcześniej zostało opisane, zakłada, że model będzie niezmienny w
czasie (budowany model na danych rzeczywistych, będzie aktualny również w przyszłości do
prognozowania). Niestety nie zawsze szereg jest stacjonarny, a model niezmienny w czasie.
Może się zatem okazać w pewnym momencie w przyszłości, że model, którego używamy już
nie prognozuje dobrze, gdyż jest zdezaktualizowany. Prowadzi to do większych błędów
prognozy, gdyż parametry zdezaktualizowanego modelu już nie odzwierciedlają w pełni
rzeczywistych relacji pomiędzy zmienną prognozowaną, a zmiennymi opisującymi tą
zmienną.
Modele adaptacyjne, jak sama nazwa wskazuje adaptują się do zmiennych danych, co
powoduje, że w przyszłości model sam ewoluuje. Model sam dostosowuje się do zmian
108
trendu (zarówno jeśli chodzi o kierunek jak i nachylenie krzywej trendu, czyli szybkość
trendu), zmian amplitudy czy też okresu wahań sezonowych. Modele adaptacyjne nie
zakładają również stałości parametrów występujących w modelu.
Jedynym założeniem jaki musi spełniać szereg czasowy aby móc stosować modele
adaptacyjne, jest założenie stacjonarności w czasie błędów predykcji, co jest założeniem dość
realistycznym.
Prostota obliczeń, względnie wysoka jakość prognoz, odrzucenie niezmienności
modelu w czasie oraz jedyne, dość realistyczne założenie dotyczące stacjonarności błędów
predykcji sprawiły, że modele adaptacyjne szybko stały się bardzo popularne.
Rysunek 2.11 przedstawia najważniejsze modele, które możemy zaliczyć do modeli
adaptacyjnych.
Rys. 0.11. Modele adaptacyjne Źródło: opracowanie własne
Poszczególne modele prognostyczne zostaną szczegółowo opisane w następnych
rozdziałach niniejszego opracowania.
Modele adaptacyjne
Modele naiwne
Średnia ruchoma
Wygładzanie wykładnicze
Trend pełzający
109
2.7. Modele naiwne
Modele naiwne są najprostszym modelem adaptacyjnym. Charakteryzują się one dużą
prostotą. Opierają się one na założeniu, że prognozowana wartość nie ulegnie zmianie w
najbliższym okresie (np. zysk danego przedsiębiorstwa w następnym kwartale będzie taki sam
jak w obecnym, wzrost obrotów w następnym kwartalne wzrośnie w tym samym stopniu w
przyszłym miesiącu, w jakim wzrósł w obecnym). Z powodu tego założenia, modele naiwne
używane są do prognozowania krótkoterminowego (np. jeden miesiąc lub jeden kwartał).
Inną możliwością użycia modeli naiwnych jest niematerialność prognozowanej kwoty lub jej
bardzo mała amplituda zmian (np. wartość kapitału zakładowego nie zmieni się przez
najbliższy rok do czasu zatwierdzenia sprawozdania finansowego przez audytora).
Matematycznie model metody naiwnej, w którym zakładamy, że zmienna w okresie t+1 jest
równa wartości tej zmiennej w okresie t można zapisać za pomocą następującego wzoru [9]
���∗ = ��, (2.37)
gdzie:
• ���∗ – prognoza zmiennej Y na okres t+1,
• �� – wartość zmiennej Y na okres t.
Metoda ta jest oparta na modelu błądzenia losowego, który to ma rozkład normalny ze
średnią zero. Ponieważ prawdopodobieństwo tego, że dana zmienna wzrośnie jest takie samo
jak to że spadnie, zgodnie z symetrycznym rozkładem normalnym, zatem zakłada się stały
poziom tej zmiennej.
Metody naiwne można też rozszerzać. Jeśli na przykład w danych widoczny jest trend,
wtedy możemy założyć, że wartość w okresie t+1 będzie równa wartości w okresie t
zwiększonej o wartość trendu szacowną jako różnice pomiędzy okresami t oraz t-1. Możemy
to zapisać za pomocą następującego wzoru, przy analogicznych oznaczeniach jak we wzorze
(2.37)
���∗ = �� + ��� − ����. (2.38)
Trend możemy też spróbować opisać za pomocą współczynnika addytywnego.
Współczynnik ten będzie określał pewną tendencję do spadku lub wzrostu zmiennej y w
badanym okresie o pewną stałą c. Wtedy zamiast wzrostu/spadku zmiennej y wyliczonej jako
różnica pomiędzy wartościami t oraz t-1 możemy do zmiennej w okresie t dodać stałą c.
Można to zapisać za pomocą następującego wzoru
���∗ = �� + 6. (2.39)
110
Trend możemy również spróbować opisać za pomocą innego współczynnika –
multiplikatywnego. Współczynnik ten będzie określał pewną tendencję do spadku lub
wzrostu zmiennej y w badanym okresie o pewien procent c. Matematycznie możemy to
zapisać za pomocą następującego wzoru
���∗ = �� ∙ �1 + 6. (2.40)
Metody naiwne są bardzo proste w zrozumieniu oraz szybkie i tanie w implementacji
przez każde przedsiębiorstwo. Jednak z uwagi na swoją prostotę ich wartość prognostyczna
jest dość niska. Natomiast błąd prognozy można oszacować wyłącznie ex post. Nie ma
możliwości oszacowania błędu ex ante.
Zauważmy, że za pomocą modeli naiwnych można prognozować na znacznie więcej
okresów niż tylko jeden. Jest to bardzo proste, jednak jak już zostało wspomniane, im dłuższy
okres tym większy błąd prognozy możemy generować.
2.8. Modele średniej ruchomej
Modele średnie ruchomej są drugim rodzajem modeli adaptacyjnych. Warto wspomnieć, że
średnia ruchoma oprócz prognozowania może też być użyta do wygładzania szeregów
czasowych.
Metoda średniej ruchomej polega na zastąpieniu oryginalnego szeregu zmiennej Y,
prognozowanymi wartościami średniej arytmetycznej obliczonymi dla każdej wartości z k
ostatnich elementów (obserwacji).
Używając średniej ruchomej do prognozowania, zakłada się, że wartość zmiennej y w
okresie t+1 jest równa wartości średniej arytmetycznej z ostatnich k obserwacji tej zmiennej.
Matematycznie możemy tą regułę zapisać za pomocą następującego wzoru (jest to tak zwana
średnia ruchoma prosta) [38]
���∗ =1> � � �
�����, (2.41)
gdzie k jest tak zwaną stałą wygładzania. Im większe k, tym szereg czasowy będzie bardziej
wygładzony (odstające obserwacje będą miały bardzo mały wpływ na wartość szeregu).
Wadą dużego k jest wolna reakcja szeregu średnich na zmiany oryginalnego szeregu Y.
Mała wartość k będzie powodowała natomiast, że szereg zmiennych będzie bardzo
szybko reagował na zmiany wyjściowego szeregu zmiennej Y. Jego wadą natomiast będzie
duży wpływ obserwacji odstających na wartość szeregu średnich.
111
Stała k jest określana przez osobę prognozującą i jest to najtrudniejsza część tej
metody.
Należy zauważyć, że w prostej średniej arytmetycznej, na wartość prognozowanej
zmiennej Y w takim samym stopniu będzie miała informacja (obserwacja) ostatnia, jak i
pierwsza brana do liczenia średniej.
Bardzo często zakłada się w prognozowaniu, że ostatnie obserwacje niosą więcej
informacji (można powiedzieć, że w większym stopniu tłumaczą zachowanie zmiennej Y),
niż obserwacje początkowe. W celu zwiększenia istotności ostatnich obserwacji nadaje im się
większą wagę. Taki sposób prognozowania nazywamy średnią ruchomą ważoną.
Matematycznie model średniej ruchomej ważonej możemy zapisać za pomocą następującego
wzoru
���∗ = � � �
������ , (2.42)
gdzie wi jest wagą nadaną przez osobę prognozującą, zmiennej prognozowanej w okresie i.
Wagi są liczbami nieujemnymi, które posiadają następujące własności:
�� < �� < ⋯ < �� ≤ 1, (2.43)
�� �
��= 1. (2.44)
Zauważmy, że w przypadku średniej ruchomej ważonej, osoba przeprowadzająca
prognozowanie musi określić liczbę wyrazów średniej (podobnie jak w prostej średniej
ruchomej) oraz dodatkowo wagę każdej obserwacji. W przypadku obu modeli średniej
ruchomej (prostej oraz ważonej) do prognozowania służy tylko k ostatnich elementów.
Modele średniej ruchomej stosuje się najczęściej do szeregów, które nie mają trendu
oraz sezonowości. W przypadku szeregów czasowych w których występuje trend linowy
można zastosować metodę tzw. podwójnej średniej ruchomej. Polega ona na pierwszym
wygładzeniu danych za pomocą średniej ruchomej, a następnie obliczeniu średniej ruchomej
już na wygładzonym szeregu danych.
Przykład 2.3.
Zastosujmy średnią ruchomą prostą oraz ważoną do prognozowania kursu akcji. Do
tego celu użyjemy różnych współczynników wygładzania oraz różnych wag w przypadku
średniej ruchomej ważonej.
112
Tabela 0.6 pokazuje prognozę za pomocą średniej ruchomej prostej oraz ważonej z
różnymi wagami i różnymi współczynnikami wygładzania. Model prognozuje wartość kursu
akcji BUDIMEX na dzień 1 lipca 2013 roku na podstawie kursów zamknięcia akcji
notowanych na Giełdzie Papierów Wartościowych w Warszawie od 10 czerwca 2013 roku do
28 czerwca 2013 roku (15 obserwacji).
Tabela 0.6. Prognozowanie kursu akcji BUDIMEX za pomocą średniej ruchomej
okres szereg oryginalny
średnia ruchoma prosta (k=3)
średnia ruchoma prosta (k=5)
średnia ruchoma ważona
(k=3, w1=0,2, w2=0,3, w3=0,5)
średnia ruchoma ważona
(k=3, w1=0,1, w2=0,1, w3=0,8)
1 87,40 2 87,75 3 88,00 4 88,73 87,72 87,81 87,89 5 90,65 88,16 88,32 88,49 6 92,70 89,13 88,51 89,54 90,00 7 93,00 90,69 89,57 91,29 91,89 8 95,28 92,12 90,62 92,44 92,71 9 93,20 93,66 92,07 94,08 94,57
10 91,30 93,83 92,97 93,78 93,60 11 92,50 93,26 93,10 92,67 92,08 12 91,40 92,33 93,06 92,28 92,33 13 93,00 91,73 92,74 91,71 91,61 14 88,03 92,30 92,28 92,42 92,63 15 94,00 90,81 91,25 90,20 89,36
prognoza 91,68 91,79 92,01 83,90 Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie
Aby zobaczyć, który model najlepiej prognozuje, należy zweryfikować wartość
prognozy poszczególnych modeli z kursem zamknięcia akcji w dniu 1 lipca 2013 roku.
Wynosi on 94,60 PLN.
2.12 podsumowuje dane z Tabela 0.6. Na podstawie tego wykresu można próbować
zobaczyć, który model najlepiej dopasował się do danych. Można podejrzewać, że model,
który najlepiej dopasuje się do danych, najlepiej zaprognozuje też ich przyszłą wartość.
Oczywiście nie musi tak się zdarzyć, jeśli nastąpi gwałtowny spadek lub wzrost wartości
oryginalnego szeregu. Wtedy może się okazać, że gorzej dopasowany model lepiej przewidzi
przyszłą wartość zmiennej.
113
Rys. 0.12. Model średniej ruchomej Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie
Za pomocą modeli średniej ruchomej można prognozować na znacznie więcej
okresów niż tylko jeden. W takim przypadku, prognoza na okres t+1 staje się składnikiem
średniej do wyliczenia na okres t+2.
Gdy mamy do czynienia z sezonowością, w niektórych przypadkach stosując średnią
ruchomą scentrowaną możemy ten szereg wygładzić oraz pozbyć się sezonowości. W
modelu średniej ruchomej scentrowanej, wartość średniej ruchomej zależy od tego, czy stała
wygładzania k jest liczbą parzystą, czy nieparzystą [38].
Gdy k jest liczbą nieparzystą, wartości scentrowanej średniej ruchomej obliczane są
jako średnia k wyrazów przypisywana do wyrazu środkowego.
Gdy k jest liczbą parzystą, a tak jest najczęściej, przy próbie likwidacji sezonowości
(np. kwartały), wartości scentrowanej średniej ruchomej obliczane są za pomocą
następującego wzoru
���∗ =�� ?�� ������
�
+∑ � ���
���
����
�
+�� �����
�
@. (2.45)
Starając się ten wzór przełożyć na bardziej zrozumiały opis, możemy powiedzieć, że
gdy k jest parzyste, do wyznaczenia prognozy za pomocą średniej scentrowanej, liczona jest
suma z połowy pierwszej wartości szeregu, połowy z (k+1)-szej wartości oraz wszystkich
wartości pomiędzy nimi. Następnie suma ta dzielona jest przez wartość k. Dla przykładu,
84,00
86,00
88,00
90,00
92,00
94,00
96,00
średnia ruchoma prosta (k=3) średnia ruchoma prosta (k=5)
średnia ruchoma ważona
(k=3, w1=0,2, w2=0,3, w3=0,5)
średnia ruchoma ważona
(k=3, w1=0,1, w2=0,1, w3=0,8)
szreg oryginalny
114
obliczając średnią dla k=4, liczymy średnią z połowy wartości pierwszej i połowy piątej
obserwacji oraz wartości drugiej, trzeciej i czwartej obserwacji zmiennej Y.
Przykład 2.4.
Zastosujmy scentrowana średnią ruchomą dla wygładzenia szeregu wartości eksportu
towarów, który zawiera wahania sezonowe.
Tabela 0.7 zawiera wartość eksportu towarów w milionach złotych od początku
danego roku do danego kwartału. Dane pochodzą z Głównego Urzędu Statystycznego od
początku roku 2009 do końca roku 2012 w podziale na kwartały. Dodatkowo tabela zawiera
wartości szeregu wygładzonego za pomocą scentrowanej średniej ruchomej z k=4 (gdyż
mamy cztery kwartały).
Tabela 0.7. Dane eksportu towarów w milionach PLN
Okres Eksport w mln
PLN Scentrowana średnia ruchoma
(k=4)
2009Q1 34 426,63
2009Q2 69 191,53
2009Q3 104 053,03 87 515,26
2009Q4 141 080,67 88 889,85
2010Q1 37 045,00 91 752,91
2010Q2 77 569,83 95 977,70
2010Q3 118 579,27 99 207,11
2010Q4 160 352,73 101 444,85
2011Q1 43 608,20 105 038,58
2011Q2 88 908,53 110 451,68
2011Q3 135 990,43 114 410,81
2011Q4 186 246,33 116 395,47
2012Q1 49 387,67 119 257,82
2012Q2 99 006,33 122 456,16
2012Q3 148 791,47
2012Q4 199 032,03 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Rysunek 2.13 przygotowany na podstawie danych z Tabela 0.7 przedstawia
wygładzenie szeregu wyjściowego oraz dopasowanie scentrowanej średniej ruchomej do
danych. Jak łatwo zauważyć, średnia scentrowana nie zawiera już sezonowości.
115
Rys. 0.13 Scentrowana średnia ruchoma Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
2.9. Modele wygładzania wykładniczego
Modele wygładzania wykładniczego są kolejnym rodzajem modeli adaptacyjnych. Modele
wygładzania wykładniczego stosuje się w szeregach czasowych podobnie jak modele średniej
ruchomej, z tą różnicą, że wagi określone są wykładniczo. Najczęściej modele wygładzania
wykładniczego stosuje się do szeregów czasowych bez wahań sezonowych. W literaturze
można znaleźć wiele modeli wygładzania wykładniczego. W niniejszym opracowaniu zostaną
przedstawione trzy najbardziej znane:
• modele wygładzania wykładniczego Browna,
• modele wygładzania wykładniczego Holta,
• modele wygładzania wykładniczego Wintersa.
Szczegółowe opisy poszczególnych modeli zostanie zaprezentowany w następnych
podrozdziałach.
0
50 000
100 000
150 000
200 000
250 000
2009Q1
2009Q2
2009Q3
2009Q4
2010Q1
2010Q2
2010Q3
2010Q4
2011Q1
2011Q2
2011Q3
2011Q4
2012Q1
2012Q2
2012Q3
2012Q4
scentrowana średnia ruchoma Eksport w mln PLN
116
2.9.1. Modele wygładzania wykładniczego Browna
Model wygładzania wykładniczego Browna został zaprezentowany przez Roberta Goodella
Browna w roku 1959 odtąd zwany jego nazwiskiem [6].
W metodzie wygładzania wykładniczego do prognozowania zakłada się, że
wygładzona wartość zmiennej Y w okresie t+1 jest równa pewnemu procentowi α zmiennej y
z okresu t oraz pewnemu procentowi (1-α) zmiennej prognozowanej y* na okres t. Procent
zmiennej prognozowanej y* z okresu t został wzięty w ten sposób, aby stanowić dopełnienie
(1-α) zmiennej y z okresu t. Suma tych dwóch procentów musi sumować się do jedności.
Matematycznie możemy tą regułę zapisać za pomocą następującego wzoru [17]
���∗ = � ∙ �� + (1 − �) ∙ ��∗, (2.46)
gdzie:
• ���∗ – prognoza zmiennej Y na okres t+1,
• ��∗– prognoza zmiennej Y na okres t,
• ��– rzeczywista wartość zmiennej Y na okres t,
• α – stała wygładzania z przedziału (0,1].
Oczywiście w tym modelu musimy założyć, że ��∗ = ��, tzn. że pierwsza wartość
prognozy jest równa pierwszej wartości szeregu prognozowanego.
Dobór wag w modelu wygładzania wykładniczego Browna zależy od osoby
przeprowadzającej prognozowanie oraz typu danych na podstawie których jest wykonywana
prognoza. Jeśli prognosta sądzi, że możliwe są częste zmiany w czasie zmiennej
prognozowanej y*, to powinien większą wagę przyłożyć do najświeższych rzeczywistych
wartości zmiennej y (α powinno być blisko jedynki). Można powiedzieć, że w tym przypadku,
prognoza będzie w większym stopniu uwzględniać błędy ex post poprzednich prognoz.
Natomiast, gdy α będzie bliżej zera, większe znaczenie będzie miała wartość wygładzona w
poprzednim okresie. W tym przypadku prognoza w mniejszym stopniu będzie odzwierciedlać
błędy ex post poprzednich prognoz.
Bardzo często zakłada się, że ostatnie obserwacje w większym stopniu objaśniają
zmienną, co świadczy o tym, że większą wagę powinniśmy przyłożyć do nowszych
obserwacji. Najczęściej parametr α określany jest empirycznie na podstawie danych
historycznych tak, aby szereg prognoz był jak najlepiej dopasowany do szeregu
rzeczywistych wartości zmiennej y.
117
Metoda ta nazywana jest także metodą pojedynczego wygładzania wykładniczego.
Określenie wykładnicze jest związane ze sposobem wyliczenia szeregu prognozowanego
zmiennej Y. Zobaczmy jak wygląda kilka pierwszych wartości tego szeregu.
Dla t=1, mamy
��∗ = � ∙ �� + (1 − �) ∙ ��∗ = � ∙ �� + (1 − �) ∙ �� = ��. (2.47)
Dla t=2 oraz podstawiając za ��∗ wyrażenie z równania (2.47) mamy
��∗ = � ∙ �� + �1 − � ∙ ��∗ = � ∙ �� + �1 − � ∙ ��. (2.48)
Dla t=3 oraz podstawiając za ��∗ wyrażenie z równania (2.48) mamy
��∗ = � ∙ �� + �1 − � ∙ ��∗ = � ∙ �� + �1 − � ∙ �� ∙ �� + �1 − � ∙ �� == � ∙ �� + ��1 − � ∙ �� + (1 − �)� ∙ ��. (2.49)
Dla t=4 oraz podstawiając za ��∗ wyrażenie z równania (2.49) mamy
��∗ = � ∙ �� + �1 − � ∙ ��∗ == � ∙ �� + �1 − � ∙ �� ∙ �� + ��1 − � ∗ �� + (1 − �)� ∙ �� == � ∙ �� + � ∙ �1 − � ∙ �� + � ∙ �1 − �� ∙ �� + �1 − �� ∙ ��. (2.50)
Ogólnie dla t=k oraz korzystając z rekurencji mamy
��∗ = � ∙ ���� + � ∙ �1 − � ∙ ���� + � ∙ �1 − �� ∙ ���� +⋯+ �1 − ���� ∙ ��. (2.51)
Ponieważ α zawiera się w przedziale (0,1], zatem wagi α, α(1- α), α(1- α)2 mają
wartości wykładnicze malejące, co daje nazwę tej metodzie. Z uwagi na to, że jest to szereg
geometryczny, zatem zgodnie z wzorem na sumę szeregu geometrycznego, jego wartości
sumują się do jedności. W przypadku gdy α=1, model upraszcza się do modelu metody
naiwnej.
W przypadku szeregów czasowych w których występuje trend linowy można
zastosować metodę tzw. podwójnego wygładzania wykładniczego. Polega ona na
pierwszym wygładzeniu danych za pomocą wygładzania wykładniczego, a następnie
obliczeniu kolejnego wygładzania wykładniczego już na szeregu wygładzonym. Można to
zapisać za pomocą następującego wzoru rekurencyjnego
A�B�� = �B��B�� = � ∗ �B� + (1 − �) ∗ �B�� (2.52)
gdzie:
• �B�� – jest wartością podwójnie wygładzonego szeregu dla okresu t,
• �B� – jest wartością wygładzonego szeregu dla okresu t.
W przypadku trendu nieliniowego stosuje się modele potrójnego wygładzania
nieliniowego.
Przykład 2.5.
118
Zaprognozujmy za pomocą modelu wygładzania wykładniczego kurs akcji
BUDIMEX stosując różne parametry wygładzania.
Tabela 0.8 pokazuje prognozę za pomocą wygładzania wykładniczego z różnymi
parametrami wygładzania.
Model prognozuje wartość kursu akcji BUDIMEX na dzień 1 lipca 2013 roku na
podstawie kursów zamknięcia notowanych na Giełdzie Papierów Wartościowych w
Warszawie od 10 czerwca 2013 roku do 28 czerwca 2013 roku (15 obserwacji).
Tabela 0.8. Prognozowanie kursu akcji BUDIMEX za pomocą wygładzania wykładniczego
Okres szreg oryginalny
Wygładzanie wykładnicze (alfa = 0,1)
Wygładzanie wykładnicze (alfa = 0,5)
Wygładzanie wykładnicze (alfa = 0,9)
1 87,40 87,40 87,40 87,40 2 87,75 87,40 87,40 87,40 3 88,00 87,44 87,58 87,72 4 88,73 87,49 87,79 87,97 5 90,65 87,62 88,26 88,65 6 92,70 87,92 89,45 90,45 7 93,00 88,40 91,08 92,48 8 95,28 88,86 92,04 92,95 9 93,20 89,50 93,66 95,05 10 91,30 89,87 93,43 93,38 11 92,50 90,01 92,36 91,51 12 91,40 90,26 92,43 92,40 13 93,00 90,38 91,92 91,50 14 88,03 90,64 92,46 92,85 15 94,00 90,38 90,24 88,51 prognoza 90,74 92,12 93,45
Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie
Jak już zostało wspomniane, kurs zamknięcia akcji w dniu 1 lipca 2013 roku wynosi
94,60 PLN.
Rysunek 2.14 podsumowuje dane z Tabela 0.8. Na podstawie tego wykresu łatwo
zobaczyć, która stała wygładzania najlepiej dopasowała model do danych. Stała ta wynosi
0,9. Błąd ex post pomiędzy prognozą, a faktycznym wykonaniem wynosi 1,15 PLN
(94,60 PLN – 93,45 PLN), co stanowi 1,2% wartości akcji w dniu 1 lipca 2013 roku.
119
Rys. 0.14. Wygładzanie wykładnicze Browna Źródło: opracowanie własne na podstawie danych z Giełdy Papierów Wartościowych w Warszawie
Warto zauważyć, że za pomocą modeli wygładzania Browna można prognozować na
znacznie więcej okresów niż tylko jeden.
2.9.2. Modele wygładzania wykładniczego Holta
Metoda wygładzania wykładniczego Holta jest rozwinięciem modelu wygładzania
wykładniczego Browna. Metoda ta została przedstawiona przez Charlsa C. Holta w roku 1957
[23]. Model ten dodatkowo pozwala modelować szeregi z trendem. Do modelowania trendu
użyty jest wielomian stopnia pierwszego, czyli linia prosta. Metoda wygładzania
wykładniczego Holta jest bardziej elastyczna w porównaniu z modelem wygładzania
wykładniczego Browna, gdyż występują w nim dwa parametry dobierane przez osobę
przeprowadzającą prognozowanie. Równanie modelu wygładzania wykładniczego Holta
możemy zapisać za pomocą następujących wzorów [40]:
C� = � ∙ �� + (1 − �) ∙ �C��� + D���, (2.53)
D� = � ∙ �C� − C���+ (1 − �) ∙ D���, (2.54)
oraz wzoru na wartość prognozy
���∗ = C� + D�, (2.55)
gdzie:
• Ft – wygładzona wartość zmiennej prognozowanej na moment t,
• Tt – wygładzona wartość przyrostu trendu na moment t,
86,00
87,00
88,00
89,00
90,00
91,00
92,00
93,00
94,00
95,00
96,00
Wygładzanie wykładnicze (alfa = 0,1) Wygładzanie wykładnicze (alfa = 0,5)
Wygładzanie wykładnicze (alfa = 0,9) szreg oryginalny
120
• α, β – parametry modelu z przedziału (0,1].
W modelu tym jako wartości początkowe przyjmuje się najczęściej F1=y1 oraz T1=y2-y1.
Jak widać, proces wygładzania w tym modelu może być rozbity na dwa etapy:
• etap przybliżania poziomu zmiennej, któremu to odpowiada wzór (2.53),
• etap przybliżania przyrostu zmiennej, któremu to odpowiada wzór (2.54).
Zmienna β wyraża wpływ przyrostu. Gdy wpływ ten jest silny, parametr β jest bliskie zera.
Natomiast, gdy wpływ ten jest słaby, parametr β jest bliski jedności.
Przykład 2.6.
Zobaczmy jak wygląda dopasowanie modelu wygładzania wykładniczego Holta w
przypadku prognozowania eksportu towarów w milionach PLN. Dane pochodzą z Głównego
Urzędu Statystycznego od początku roku 2008 do końca roku 2012 w podziale na kwartały i
przedstawiają wartość eksportu w poszczególnych kwartałach danego roku.
Tabela 0.9 przedstawia dane eksportu wraz z prognozą modelu wygładzania
wykładniczego Holta. Model został skalibrowany z parametrami α= 0,9 oraz β=0,6.
Łatwo zauważyć, że prognoza na okres pierwszego kwartału 2013 roku jest prawie
idealna. Różnica na kwocie 3,5 mln PLN stanowi błąd ex post rzędu 0,01%.
Tabela 0.9. Prognozowanie eksportu towarów za pomocą wygładzania wykładniczego Holta
Okres Eksport w mln
PLN F T Prognoza
2008Q1 34 425,37 34425,4 352,7 0,0
2008Q2 34 778,07 34778,1 352,7 34 778,1
2008Q3 33 603,97 33756,6 -471,8 35 130,8
2008Q4 32 320,30 32416,8 -992,6 33 284,9
2009Q1 34 426,63 34126,4 628,7 31 424,1
2009Q2 34 764,90 34763,9 634,0 34 755,1
2009Q3 34 861,50 34915,1 344,3 35 397,9
2009Q4 37 027,63 36850,8 1299,1 35 259,5
2010Q1 37 045,00 37155,5 702,5 38 150,0
2010Q2 40 524,83 40258,1 2142,6 37 858,0
2010Q3 41 009,43 41148,6 1391,3 42 400,7
2010Q4 41 773,47 41850,1 977,4 42 539,8
2011Q1 43 608,20 43530,1 1399,0 42 827,5
2011Q2 45 300,33 45263,2 1599,4 44 929,1
2011Q3 47 081,90 47060,0 1717,8 46 862,7
121
Okres Eksport w mln
PLN F T Prognoza
2011Q4 50 255,90 50108,1 2516,0 48 777,8
2012Q1 49 387,67 49711,3 768,3 52 624,1
2012Q2 49 618,67 49704,8 303,4 50 479,6
2012Q3 49 785,13 49807,4 183,0 50 008,2
2012Q4 50 240,57 50215,6 318,1 49 990,4
2013Q1 (prognoza) 50 530,10 50 533,6 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Rysunek 2.15 podsumowuje dane z Tabela 0.9. Zauważmy, na podstawie tego
wykresu, że szereg prognoz dość ładnie dopasowuje się do wartości szeregu wyjściowego, co
potwierdza mały błąd prognozy. Dodatkowo na rysunku została umieszczona prosta trendu
wraz z jej równaniem, aby podkreślić tendencję rozwojową występującą w danych.
Rys. 0.15. Wygładzanie wykładnicze Holta Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Warto zauważyć, że za pomocą modeli wygładzania Holta można również
prognozować na znacznie więcej okresów niż tylko jeden.
y = 1070,2x + 29855
30 000,0
35 000,0
40 000,0
45 000,0
50 000,0
55 000,0
Prognoza Eksport w mln PLN Liniowy (Eksport w mln PLN)
122
2.9.3. Modele wygładzania wykładniczego Wintersa
Metoda wygładzania wykładniczego Wintera jest uogólnieniem metody Holta. Została ona
przedstawiona przez Petera R. Wintersa w roku 1960 [44]. Jest stosowana dla szeregów, które
zawierają trend, a także wahania sezonowe. Wahania sezonowe mogą nakładać się na trend w
sposób addytywny lub multiplikatywny. Wersja multiplikatywna jest używana rzadziej, ze
względu na założenie, że przyrosty względne wartości trendu zmiennej Y zmieniają się w
sposób regularny lub są mniej więcej stałe. Oczywiście mówimy tylko o przypadkach, w
których nie nastąpiła zmiana lub załamanie trendu.
Równanie modelu wygładzania wykładniczego Wintersa w wersji addytywnej
możemy zapisać za pomocą następujących wzorów [9]:
C� = � ∙ ��� − ���+ (1 − �) ∙ �C��� + D���, (2.56)
D� = � ∙ �C� − C���+ (1 − �) ∙ D���, (2.57)
� = � ∙ ���−C�+ (1 − �) ∙ ���, (2.58)
oraz wzoru na wartość prognozy
���∗ = C� + D� + ����, (2.59)
gdzie:
• Ft – wygładzona wartość zmiennej prognozowanej na moment t,
• Tt – wygładzona wartość przyrostu trendu na moment t,
• St – wygładzona wartość składnika sezonowości na moment t,
• r – długość cyklu sezonowego,
• α, β, γ – parametry modelu z przedziału (0,1].
W modelu tym jako wartości początkowe przyjmuje się najczęściej F1=y1 oraz T1=y2-
y1, natomiast, początkowe wartości St otrzymujemy odejmując od wartości yi średnią z r
pierwszych obserwacji.
Jak widać, proces wygładzania w tym modelu może być rozbity za pomocą trzech
etapów:
• etap przybliżania poziomu zmiennej, któremu to odpowiada wzór (2.56),
• etap przybliżania przyrostu zmiennej, któremu to odpowiada wzór (2.57),
• etap przybliżania sezonowości zmiennej, któremu to odpowiada wzór (2.58).
Równanie modelu wygładzania wykładniczego Wintersa w wersji multiplikatywnej
możemy zapisać za pomocą następujących wzorów [9]:
C� = � ∙ * �� ���-+ (1 − �) ∙ �C��� + D���, (2.60)
123
D� = � ∙ �C� − C���+ (1 − �) ∙ D���, (2.61)
� = � ∙ *��C�- + (1 − �) ∙ ���, (2.62)
oraz wzoru na wartość prognozy
���∗ = �C� + D� ∙ ����, (2.63)
Przykład 2.7.
Zobaczmy jak wygląda dopasowanie modelu wygładzania wykładniczego Wintersa w
wersji addytywnej w przypadku prognozowania średniego miesięcznego wynagrodzenia
brutto w sektorze przedsiębiorstw zatrudniających przynajmniej 9 osób. Dane pochodzą z
Głównego Urzędu Statystycznego od początku roku 2008 do końca roku 2012 w podziale na
kwartały. Wartość kwartalna wyliczana jest jako średnia arytmetyczna z trzech miesięcy.
Tabela 0.10 przedstawia dane średniego miesięcznego wynagrodzenia brutto w
sektorze przedsiębiorstw wraz z prognozą modelu wygładzania wykładniczego Wintersa w
wersji addytywnej. Model został skalibrowany z parametrami α= 0,7, β=0,9 oraz γ=0,1.
Średnia r została policzona z czterech kwartałów roku 2008 (4 obserwacje) i wynosi
3 176,5 PLN.
Tabela 0.10. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą wygładzania wykładniczego Wintersa
okres Średnie miesięczne
wynagrodzenie brutto
F T S Prognoza
2008_Q1 3048,92 3 048,9 91,9 -127,5 2008_Q2 3140,83 3 165,8 114,4 -35,6 3 013,3 2008_Q3 3188,59 3 207,6 49,0 12,1 3 244,5 2008_Q4 3327,523 3 200,5 -1,4 151,1 3 268,7 2009_Q1 3 248,0 3 322,6 109,7 -122,3 3 350,1 2009_Q2 3 258,8 3 335,8 22,9 -39,8 3 310,1 2009_Q3 3 304,6 3 312,3 -18,9 10,1 3 319,0 2009_Q4 3 456,2 3 301,7 -11,5 151,4 3 303,6 2010_Q1 3 337,6 3 409,0 95,4 -117,2 3 441,6 2010_Q2 3 383,0 3 447,2 44,0 -42,2 3 387,2 2010_Q3 3 414,8 3 430,6 -10,6 7,5 3 449,0 2010_Q4 3 604,6 3 443,2 10,3 152,4 3 427,6 2011_Q1 3 482,4 3 555,8 102,3 -112,8 3 606,0 2011_Q2 3 560,8 3 619,5 67,6 -43,9 3 545,3 2011_Q3 3 594,9 3 617,3 4,8 4,5 3 643,2 2011_Q4 3 771,6 3 620,0 2,9 152,3 3 626,6 2012_Q1 3 668,5 3 733,8 102,6 -108,0 3 775,3
124
okres Średnie miesięczne
wynagrodzenie brutto
F T S Prognoza
2012_Q2 3 697,4 3 769,8 42,7 -46,7 3 728,4 2012_Q3 3 675,8 3 713,6 -46,3 0,3 3 765,8 2012_Q4 3 868,9 3 701,8 -15,3 153,8 3 667,6 2013_Q1 (prognoza) 3 741,0 3 840,4
Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
W tabeli 2.10 na szaro zaznaczono wiersze, w których początkowe wartości St,
otrzymaliśmy odejmując od wartości yi średnią równą 3 176,5 PLN. Pozostałe wartości St, są
liczone za pomocą wzoru (2.58).
Zauważmy, że prognoza na okres pierwszego kwartału 2013 roku wyszła wyższa w
porównaniu z wykonaniem, co oznacza, że model lekko przeszacowuje. Różnica na kwocie
99,4 mln PLN stanowi błąd ex post rzędu 2,7% co jest błędem znacznie wyższym niż udało
się osiągnąć przy modelu Holta. Jednak ciągle nie jest to błąd znaczący.
Rysunek 2.16 podsumowuje dane z Tabela 0.10. Dzięki umieszczeniu linii prostej
trendu wraz z jej równaniem, łatwiej zauważyć tendencję rozwojową występującą w danych
oraz sezonowość (gdyż regularnie dane są raz pod linią trendu, a raz nad nią).
Rys. 0.16. Wygładzanie wykładnicze Wintersa Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Podobnie jak w poprzednich modelach, za pomocą modeli wygładzania Wintersa
można prognozować na znacznie więcej okresów niż tylko jeden.
y = 35,108x + 3079,3
3 000,0
3 200,0
3 400,0
3 600,0
3 800,0
4 000,0
2008_Q1
2008_Q2
2008_Q3
2008_Q4
20Q3_Q1
20Q3_Q2
20Q3_Q3
20Q3_Q4
2010_Q1
2010_Q2
2010_Q3
2010_Q4
2011_Q1
2011_Q2
2011_Q3
2011_Q4
20Q4_Q1
20Q4_Q2
20Q4_Q3
20Q4_Q4
2013_Q1
Średnie miesięczne wynagrodzenie brutto
Prognoza
Liniowy (Średnie miesięczne wynagrodzenie brutto)
125
2.10. Trend pełzający
Model trendu pełzającego jest również przykładem szerokiej gamy modeli adaptacyjnych,
czyli modeli dostosowujących się do szeregu wyjściowego Y. W porównaniu z modelami
średniej ruchomej i wygładzania wykładniczego model trendu pełzającego jest znacznie
trudniejszy w implementacji. Jego zaletą jest natomiast prognozowanie szeregów, które
odznaczają się dużą nieregularnością lub załamaniami trendu. Metoda ta została
przedstawiona przez Z. Hellwiga [22] w roku 1967. Polega ona na szacowaniu wartości
trendu w każdym okresie (lub zdefiniowanym przez prognostę fragmencie szeregu) za
pomocą dopasowanych trendów liniowych, a następnie na ekstrapolacji tak uzyskanego
trendu pełzającego za pomocą wag harmonicznych.
Dla danego szeregu czasowego Y oraz stałej wygładzania k ustalonej przez prognostę,
a będącej liczbą obserwacji na jakich szacujemy trend liniowy, szacujemy na kolejnych
fragmentach szeregu:
y1, y2, … , yk,
y2, y3, … , yk+1,
y3, y4, … , yk+2,
…
yn-k+1, yn-k+2, … , yn,
parametry liniowych funkcji trendu:
f1(t)=α1+β1(t), gdzie ( ∈ [1, >], f2(t)=α2+β2(t), gdzie ( ∈ [2, > + 1], f3(t)=α3+β3(t), gdzie ( ∈ [3, > + 2],
…
fn-k+1(t)=αn-k+1+βn-k+1(t), gdzie ( ∈ [� − > + 1, �]. Dla dowolnego ( ∈ [1,�] wartościom yi odpowiadają teoretyczne/prognozowane
wartości y* z wyliczonych funkcji fi. Ostatecznie prognozą na dany moment i jest uśredniona
wartość wyliczonych tych funkcji y* (można powiedzieć, że każdej wartości z szeregu yi
odpowiada wartość prognozowana � ∗), która będzie równa ��. Łącząc kolejne punkty (t,� ∗) otrzymujemy tendencję rozwojową szeregu czasowego w postaci segmentowej, zwaną
trendem pełzającym (stąd nazwa metody). Zauważmy, że szereg prognoz jest dokładnie tej
samej długości co szereg wyjściowy realnych obserwacji. Aby dokonać prognozy należy
zastosować pewien algorytm oparty o wagi harmoniczne. Zastosowanie wag harmonicznych
126
ma na celu uwzględnienie tzw. „postarzania informacji”, co oznacza, że nowsze obserwacje
niosą więcej informacji nt. prognozowanych danych, niż informacje stare. Harmoniczne wagi
są dlatego, iż przyjmuje się założenie, że przyrosty wag przypisywane kolejnym wyrazom
szeregu wyjściowego, są odwrotnie proporcjonalne do wieku danych.
Algorytm wag harmonicznych polega na:
• obliczeniu przyrostów funkcji trendu
�� = ��∗ − ����∗ dla ( ∈ [1, � − 1], (2.64)
• określeniu wartości przyrostów
�% =�6�����
���, (2.65)
gdzie 6� są wagami harmonicznymi. Są to liczby dodatnie z przedziału (0,1], których suma
wynosi jeden, a konstruowane są w następujący sposób
6� = 1� − 1� 1� − ,�
��,( = 1,2, … ,� − 1 (2.66)
• wyznaczeniu prognozy punktowej na okres T według następującego wzoru
��∗ = ����+ �D − � ∙�% . (2.67)
We wzorze na prognozę wyraz wolny równy jest ostatniej wartości szeregu prognoz, a
współczynnik nachylenia równy jest sumie wartości przyrostów wyliczonej zgodnie ze
wzorem (2.65).
Warto tutaj wspomnieć, że przeważnie zakłada się, że wartość wygładzania jest stała
we wszystkich fragmentach wyjściowego szeregu, co jest prostszym założeniem w
implementacji. W literaturze można jednak spotkać trend pełzający ze zmienną wartością
wygładzania w poszczególnych fragmentach wyjściowego szeregu.
Podsumowując zastosowanie metody trendu pełzającego ze stałą wygładzania stałą w
czasie prognozy można podzielić na dwa etapy:
• wyrównanie szeregu czasowego przy użyciu trendu pełzającego, za pomocą
trendów liniowych,
• prognozowanie wartości za pomocą wag harmonicznych.
127
Przykład 2.8.
Zobaczmy jak wygląda dopasowanie modelu trendu pełzającego w przypadku
prognozowania średniego miesięcznego wynagrodzenia brutto w sektorze przedsiębiorstw
zatrudniających przynajmniej 9 osób. Dane pochodzą z Głównego Urzędu Statystycznego od
początku roku 2010 do końca roku 2012 w podziale na kwartały. Wartość kwartalna
wyliczana jest jako średnia arytmetyczna z trzech miesięcy. Niech stała wygładzania wynosi
4, co oznacza, że dla każdego roku będziemy szacować wartość trendu na podstawie czterech
kwartałów. W Excelu wartość trendu oszacujemy za pomocą regresji liniowej.
Tabela 0.11 przedstawia dane średniego miesięcznego wynagrodzenia brutto w
sektorze przedsiębiorstw (uśrednione na kwartale) wraz z prognozą modelu trendu
pełzającego.
Tabela 0.11. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą trendu pełzającego
Średnie miesięczne wynagrodzenie brutto
Wartości teoretyczne Y w poszczególnych segmentach
Kwartały t tyś PLN y* 1 2 3 4 5 6 7 8 9
2010_Q1 1 3,34 3,31 3,31
2010_Q2 2 3,38 3,40 3,39 3,40
2010_Q3 3 3,41 3,46 3,48 3,45 3,47
2010_Q4 4 3,60 3,53 3,56 3,50 3,50 3,55
2011_Q1 5 3,48 3,53 3,54 3,53 3,56 3,47
2011_Q2 6 3,56 3,56 3,56 3,56 3,56 3,57
2011_Q3 7 3,59 3,62 3,57 3,65 3,62 3,65
2011_Q4 8 3,77 3,71 3,74 3,67 3,67 3,74
2012_Q1 9 3,67 3,69 3,72 3,69 3,72 3,64
2012_Q2 10 3,70 3,70 3,71 3,69 3,70
2012_Q3 11 3,68 3,71 3,66 3,76
2012_Q4 12 3,87 3,81 3,81 Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Wartości teoretyczne zostały wyliczone jako funkcja regresji liniowej zmiennej
wynagrodzenia. Jako zmienna objaśniająca została wykorzystana zmienna t (kolejny numer
kwartału). Funkcja użyta w Excelu to „REGLINP”. Wartość y* jest wyliczona jako średnia
arytmetyczna dla każdego wiersza. Poszczególne wartości funkcji trendu (estymatorów
parametrów) przedstawia Tabela 0.12.
128
Tabela 0.12. Estymatory parametrów
Estymatory parametrów trendu liniowego dla podokresów
0,08 3,23
0,05 3,30
0,03 3,37
0,00 3,53
0,09 3,02
0,05 3,27
0,02 3,51
-0,03 3,95
0,06 3,12 Źródło: opracowanie własne
Następnie spróbujmy zaprognozować wartość wynagrodzenia na kolejne kwartały. Do
tego celu użyjemy wag harmonicznych.
Tabela 0.13. Prognozowanie metodą wag harmonicznych
t y* wt ct - wagi harmoniczne
wt*ct Składniki Wagi
1 3,31
2 3,40 0,086 0,008 0,008 0,0007
3 3,46 0,068 0,009 0,017 0,0012
4 3,53 0,063 0,010 0,027 0,0017
5 3,53 -0,002 0,011 0,039 -0,0001
6 3,56 0,039 0,013 0,052 0,0020
7 3,62 0,059 0,015 0,067 0,0039
8 3,71 0,084 0,018 0,085 0,0071
9 3,69 -0,013 0,023 0,108 -0,0014
10 3,70 0,007 0,030 0,138 0,0010
11 3,71 0,010 0,046 0,184 0,0018
12 3,81 0,104 0,091 0,275 0,0286
13 - prognoza 3,861 Suma = 0,0466 Źródło: opracowanie własne
129
Kolumna „Składniki” w Tabela 0.13 została wyliczona dla każdego t zgodnie z
następującym wzorem
1� − 1 ∙ 1� − ( − 1. (2.68)
Natomiast kolumna „Wagi” stanowi sumy „Składników” od pierwszej obserwacji do
danego t – zgodnie ze wzorem (2.66).
Rysunek 2.17 przedstawia wyjściowy szereg wynagrodzenia oraz dopasowane
wartości szeregu wygładzonego za pomocą trendu pełzającego wraz z prognozą
wyestymowaną za pomocą wag harmonicznych.
Rys. 0.17. Trend pełzający z wagami harmonicznymi Źródło: opracowanie własne na podstawie danych z Głównego Urzędu Statystycznego
Za pomocą modeli trendu pełzającego można prognozować na znacznie więcej
okresów niż tylko jeden. Korzystając z wzoru (2.67) oraz mając ���� oraz �% wystarczy, że
będziemy podmieniać tylko okres T na który chcemy prognozować.
3,00
3,10
3,20
3,30
3,40
3,50
3,60
3,70
3,80
3,90
4,00
Średnie miesięczne wynagrodzenie brutto prognoza
130
ROZDZIAŁ III
BUDOWA I PROGNOZOWANIE NA PODSTAWIE
MODELI AUTOREGRESJI I ŚREDNIEJ RUCHOMEJ
3.1. Proces stochastyczny
Podczas badania zjawisk, zwykle otrzymujemy zestaw zmierzonych wartości pewnej
wielkości, która zmienia się w czasie. Zatem otrzymujemy pewien ciąg wartości {E�}��� . Każdą z wartości możemy interpretować jako realizację pewnego doświadczenia. Z
matematycznego punktu widzenia będzie to zmienna losowa.
Przypomnijmy zatem intuicyjne pojęcie zmiennej losowej, którą określamy jako
zmienną przyjmującą przy realizacji pewnego doświadczenia określoną wartość liczbową w
zależności od losowego wyniku doświadczenia.
Zmienną losową nazywamy dowolną funkcję E określoną na przestrzeni zdarzeń
elementarnych, przyjmującą wartości rzeczywiste (E: Ω → ℝ ) [7, 9, 13, 39].
Dokonując pomiarów w czasie wyznaczamy wartość tej zmiennej losowej w
określonej jednostce czasu. Zatem rozważamy zmienną losową zależną również od czasu.
Załóżmy dodatkowo, że w każdej jednostce czasu zmienne losowe są o rozkładach
normalnych. Rysunek 1 przedstawia wykresy procesów stochastycznych zadanych przez te
zmienne.
131
a) b)
Rys. 0.1. Proces stochastyczny a) dyskretny, b) ciągły Źródło: opracowanie własne
Procesem stochastycznym nazywamy uporządkowany ze względu na czas zbiór
zmiennych losowych [39]. Dokładniej będzie to funkcja ����� przekształcająca zbiór � � Ω
w �. Realizację zmiennych losowych w kolejnych chwilach nazywamy szeregiem
czasowym. Zatem szereg czasowy stanowi pojedynczą realizację procesu stochastycznego
[39]. Używając pojęć proces stochastyczny i szereg czasowy należy zwrócić uwagę na to, że i
jedno i drugie pojęcie oznacza ciąg. W pierwszym przypadku jest to ciąg funkcyjny (zmienne
losowe), a w drugim ciąg liczbowy (szeregi czasowe) 1.
W przypadku procesów ekonomicznych z reguły mamy do czynienia z procesami
dyskretnymi, często nazywanymi skokowymi. Obserwacje wartości są przeprowadzane
zazwyczaj w jednakowych odstępach czasu (rocznych, kwartalnych, miesięcznych). W
przypadku obserwacji procesów finansowych mamy do czynienia z obserwacjami dziennymi,
godzinowymi, a ze względu na specyfikę elektronicznego systemu transakcji giełdowych
można twierdzić, że obserwacje są ciągłe. Należy zwrócić uwagę na to, że obserwacja w
określonej chwili jest jedyną realizacją zmiennej losowej dla tej chwili. Tej realizacji
zmiennej losowej nie można powtórzyć czy ponownie zaobserwować2 realizacji tej zmiennej,
gdyż powtórzenie doświadczenia w idealnie takich samych warunkach jest niemożliwe [39].
W dalszej części będziemy proces stochastyczny oznaczać zamiennie w zależności od
kontekstu ��� lub ��. Na potrzeby dalszych rozważań przypomnijmy następujące określenia.
1 W literaturze ekonomicznej często stosuje się zamiennie określenia szereg czasowy i proces stochastyczny. 2 Prawdopodobieństwo zaobserwowania tej samej realizacji jest równe zero.
w
t
Yt HwL
132
Dystrybuantą łączną ciągu zmiennych losowych nazywamy funkcję C określoną
zależnością [9]: C���, ��, … , �|(�, (�, … , ( = ��FE�(� ≤ ��,E�(� ≤ ��, … , E�( ≤ �G. Średnią procesu stochastycznego E� nazwiemy funkcję �:D → ℝ określoną
zależnością3:
�� = ��( = �HE�(I = �HE�I = J '�"|("K"�
��.
Wariancją procesu stochastycznego nazywamy funkcję L�:D → ℝ określoną
zależnością
L�� = L��( = L��E� = M!0�E� = J '�"|([" −��]��
��K".
Autokowariancją procesu stochastycznego nazwiemy funkcję 61M:D × D → ℝ,
określoną zależnością ���,�� = 61M:E�� ,E��; = �N:E�(�−��(�;:E�(�−��(�;O. Oczywiście mając, wielkości wariancji i autokowariancji możemy zbudować dla
procesu dyskretnego macierz wariancji i kowariancji postaci:
� = PQQQR L�� ���,������� , L�� … ���,��
⋯ ���,��⋮ ⋮���,�� ���,�� ⋱ ⋮
⋯ L� STTTU,
a następnie macierz korelacji procesu stochastycznego
V = PQQR 1 V��,��V��,�� 1
… V��,��⋯ V��,��
⋮ ⋮V��,�� V��,�� ⋱ ⋮
⋯ 1 STTU,
gdzie funkcja autokorelacji jest postaci V��,�� = ��,�� �� ��
.
Do badań szeregów czasowych używamy nieco zawężonych pojęć. Przez funkcję
autokorelacji ACF rozumiemy funkcję V� = ����, gdzie �� = 61M�E�,E�. 3 W definicjach stosujemy kilka oznaczeń w dalszej części będziemy wykorzystywać je zamiennie.
133
Estymatorami tych funkcji są dla funkcji autokowariancji o odstępie >
6� = 1��(�� − ��)(��� − ��),��
���
gdzie �� oznaczą wartość średnią.
Estymatorem funkcji autokorelacji jest 0� = 6�6�. Natomiast wariancję estymatora funkcji autokorelacji wyznaczamy z zależności:
M!0�0� = 1� W1 + 2�0 �!
��X ,> > �.
Wykres funkcji 0� w zależności od wartości > nazywamy korelogramem.
Funkcja autokorelacji cząstkowej (w skrócie PACF) jest odpowiednikiem funkcji
autokorelacji (ACF). Mierzy ona korelację między kolejnymi opóźnieniami po
wyeliminowaniu wpływu pośrednich opóźnień. Dlatego dla rzędu opóźnienia 1 funkcje ACF i
PACF mają równe wartości.
Funkcję PACF oznaczamy przez Y�,� i obliczmy następująco:
Y�,� =K4(
PQQQR 1 V� V�V� 1 V�V� V� 1
⋯ V��� V�⋯ V��� V�⋯ V��� V�
⋮ ⋮ ⋮V��� V��� V��� ⋮ ⋮ ⋮
⋯ V� V� STTTU
K4(PQQQQRPQQQR 1 V� V�V� 1 V�V� V� 1
⋯ V��� V���⋯ V��� V���⋯ V��� V���
⋮ ⋮ ⋮V��� V��� V��� ⋮ ⋮ ⋮
⋯ V� 1STTTUSTTTTU.
3.2. Filtrowanie szeregów
W celu uzyskania szeregu stacjonarnego stosuje się często przekształcenia szeregów za
pomocą tzw. filtrów z których najczęściej stosujemy filtry liniowe. Filtry liniowe są
stosowane do transformacji zmiennych, które charakteryzują się trendem stochastycznym lub
deterministycznym, które omawiamy później. Filtrem liniowym nazywamy zamianę procesu E� na proces E�∗ za pomocą przekształcenia [7, 14]
134
E�∗ = � 8 E� ,"
���
gdzie ( = 0 + 1,… , � − �, 0 + � + 1 < �, 0, � > 0, 8 – wagi.
W zależności od postaci wag mamy:
• średnią ruchomą, gdy ∑ 8 = 1,
• średnią scentrowaną, gdy 0 = �,
• średnią symetryczną, gdy 8 = 8� .
Rys. 0.2. Zastosowanie filtru liniowego Źródło: Dane PKB GUS, obliczenia własne
Przy stosowaniu filtrów liniowych występują następujące problemy:
• obcięcie 0 początkowych i � końcowych wyrazów szeregu wstępnego (stosuje się
wtedy średnie asymetryczne).
• średnia asymetryczna powoduje przesunięcie fazy.
• średnia ruchoma rzędu k (której wszystkie współczynniki są równe 1/k) usuwa
sezonowość o okresie k.
Do usuwania trendu wielomianowego stosujemy tzw. filtr różnicowy Δ 4 postaci:
ΔE� = E� − E���.
4 nazywany też operatorem różnicowania.
170000
190000
210000
230000
250000
270000
290000
310000
330000
1 3 5 7 9 11 13 15 17 19 21 23
y_t
średnia 3 okresowa
135
Rekurencyjnie filtr różnicowy możemy zdefiniować dla dowolnego rzędu 2
następująco:
Δ#E� = Δ�Δ#��E�.
Przykład 3.1. (dla 2 = 2) Δ�E� = Δ�ΔE� = Δ�E� − E��� = �E� − E���− �E��� − E��� = E� − 2E��� + E���.
Do opisu procesów autoregresyjnych stosujemy pewne operatory. Jednym z nich jest
operator opóźnienia5 Z określony następująco: ZE� = E���. Pomiędzy operatorem opóźnienia a filtrem różnicowym zachodzi zależność:
Δ#E� = �1 − Z#E�.
Przykład 3.2. (dla 2 = 1, oraz 2 = 2)
ΔE� = E� − E��� = E� − ZE� = �1 − ZE�. Δ�E� = E� − 2E��� + E��� = �1 − 2Z + Z�E� = �1 − Z�E�.
3.3. Stacjonarność procesu stochastycznego
W badaniach szeregów czasowych ważną rolę odgrywa pojęcie stacjonarności [13].
W literaturze funkcjonują dwa pojęcia stacjonarności. Stacjonarność w węższym sensie
definiujemy jako brak zmiany łącznego i warunkowego rozkładu prawdopodobieństwa przy
przesunięciu punktu zerowego na osi czasu, co formalnie zapisujemy jako C���, ��, … , �|(�, (�, … , ( = C���, ��, … , �|(� + <, (� + <, … , ( + < dla < ∈ ℝ.
Oznacza to że łączny rozkład zmiennych losowych E� jest identyczny i niezmienny w
czasie. Takie pojęcie stacjonarności jest mało przydatne w zastosowaniach, gdyż wymaga
użycia zaawansowanego aparatu analizy funkcjonalnej. Dlatego też wprowadzono pojęcia
stacjonarności określone za pomocą parametrów, które łatwo można zmierzyć. Wprowadza
się zatem pojęcie słabej (w szerszym sensie) stacjonarności procesu [9, 13, 14, 18]. Proces
jest więc słabo stacjonarny6 gdy proces ma stałą średnią, wariancję, a funkcja autokowariancji
zależy tylko od <. Matematycznie oznacza to, że
5 W literaturze występuje również jako operator wycofania, przesunięcia wstecz. 6 Dalej mówimy krótko stacjonarny
136
�HE�I = [ = 61��(, M!0�E� = L� = 61��(, 61M�E�,E�� = ��<, dla ( ∈ ℝ, < ≠ 0.
Proces stochastyczny stacjonarny w węższym sensie jest również słabo stacjonarny.
Dla zmiennej losowej o rozkładzie normalnym określenie słabej stacjonarności jest
równoznaczne z pojęciem silnej stacjonarności. Dlatego, aby sprawdzić, czy proces o
rozkładzie normalnym jest ściśle stacjonarny, wystarczy poznać podstawowe parametry jego
rozkładu. Na ogół dokonujemy jedynie weryfikacji stałości parametrów wielowymiarowego
rozkładu zmiennej losowej, a nie testujemy konkretnej postaci tego rozkładu.
Ponieważ dokładne parametry procesu na ogół nie są znane więc opisujemy je za
pomocą estymatorów. I tak w próbie �- elementowej estymatorem średniej [ jest
�� = 1����
���.
Zaś wariancji L� jest
�� = 1��(�� − ��)�
���.
3.4. Biały szum
W badaniach procesów stochastycznych posługujemy się pojęciem białego szumu [5, 14, 18,
39]. Białym szumem7 nazywamy proces stochastyczny �� spełniający 3 warunki:
1. �H��I = 0, 2. M!0��� = L� = 61��(, 3. 61M���, �" = 0, dla � > (.
W przypadku gdy ��~\(0,L�) mówimy, że proces białego szumu jest gaussowski.
Proces białego szumu oczywiście jest stacjonarny.
7 ang. white noise.
137
Rys. 0.3. Przykład procesu białego szumu Źródło: opracowanie własne
Zbadajmy w programie Statistica autokorelację przedstawionego na wykresie szeregu.
Wykorzystamy do tego polecenie Statystyka → Zaawansowane modele liniowe i nieliniowe
→ Szeregi czasowe i prognozowanie. Po wyborze zmiennej korzystamy z opcji OK
(Przekształcenia, autokorelacje, korelacje wzajemne, wykresy). Wybierając w zakładce
Autokorelacje przycisk Autokorelacje otrzymujemy następujący wykres.
Rys. 0.4. Wykres funkcji autokorelacji Źródło: opracowanie własne
138
Funkcja autokorelacji pokazuje nam występowanie autokorelacji pomiędzy
wartościami szeregu w chwili ( i w chwili ( − �. Dla białego szumu autokorelacja nie
powinna występować tzn. powinna wynosić 0. W programie Statistica oznacza to, że wykres
tej funkcji znajduje się w pewnym zbiorze krytycznym, stanowiącym przedział ufności.
Do badania własności szeregów czasowych możemy wybrać program Gretl.
Rys. 0.5 Funkcja korelogram w Gretlu Źródło: opracowanie własne
Otrzymujemy zarówno wykres funkcji autokorelacji (ACF) jak i korelacji cząstkowej
(PACF) oraz tabelę testów autokorelacji Ljunga-Boxa.
Rys. 0.6. Wykres i test funkcji ACF i PACF Źródło: opracowanie własne
Źródło: opracowanie własne
139
Mając proces białego szumu możemy określić proces błądzenia losowego8 . Niech E� będzie pewną ustaloną wartością początkową, Określamy dla dowolnego ( > 0 proces E� = E��� + ��, gdzie �� jest procesem białego szumu. Oczywiście powyższy wzór rekurencyjny możemy
przekształcić na
E� = E� +�� �
��.
Oznacza to, że dla tego procesu zachodzą:
�HE�I = � ]E� +�� �
��^ = �HE�I = E�,
M!0�E� = M!0 W�� �
��X = (L�,
61M�E�,E�" = (L�. Jak widzimy, zarówno wariancja jak i kowariancja zależą od czasu, zatem proces
błądzenia losowego jest procesem niestacjonarnym.
Rys. 0.7. Przykład błądzenia losowego Źródło: opracowanie własne
8 ang. random walk
140
Do badania stacjonarności szeregów czasowych służą różnego rodzaju testy
pierwiastka jednostkowego. Najpopularniejszymi testami są test Dickeya-Fullera (DF),
rozszerzony test Dickeya-Fullera (ADF9), test Phillipsa-Perrona (PP) czy też test
Kwiatkowskiego–Phillipsa–Schmidta–Shina (KPSS).
3.5. Proces średniej ruchomej
Analizując proces błądzenia losowego, możemy przypuszczać, że wiele procesów
obserwowanych w przyrodzie ma znamiona losowości (przypadku). Mało tego, możemy
zaobserwować wpływ tych działań przypadkowych na następne wartości. Możemy zatem
zastanawiać się jak głęboki jest ten wpływ, tzn. na ile okresów naprzód działa. Procesem
opisującym to jest proces średniej ruchomej10. Niech ����∈$ będzie procesem białego szumu.
Proces średniej ruchomej zapisujemy w postaci [5, 9, 13, 14, 18, 39]:
E� = 8� + �� +�8 ��� ,!
��
lub w postaci operatorowej E� = 8� + _�Z��, gdzie _�Z = 1 + 8�Z +⋯+ 8!Z! jest wielomianem operatorowym stopnia �, zaż �� jest
białym szumem o wariancji L�. Proces średniej ruchomej (MA(q)) ma następujące własności:
1. �HE�I = 8�, 2. M!0�E� = :1 + 8�� +⋯+ 8!�;L�, 3. 61M�E�,E��� = ` 0, > > �,:8� + 8��8� +⋯+ 8!8!��;L�, > ≤ �, 4. �� = ` 0, > > �,L�∑ 8� 8 !��
�� 0 ≤ > ≤ �, Na tej podstawie możemy powiedzieć, że każdy proces średniej ruchomej jest
procesem stacjonarnym.
Rozważmy proces średniej ruchomej zobrazowany na poniższym rysunku.
9 ang. agumented Dickey-Fuller test. 10 ang. moving average proces.
141
Rys. 0.8. Proces Ma(1) Źródło: opracowanie własne
Przyjrzyjmy się jego funkcji ACF i PACF.
Rys. 0.9 Funkcje ACF i PACF procesu AR(1) Źródło: opracowanie własne
Możemy tutaj zauważyć następującą zależność – funkcja PACF jest geometrycznie
gasnąca, natomiast funkcja ACF ma jedną wartość statystycznie niezerową. Ilość tych
niezerowych wartości oznacza wartość rzędu � procesu MA.
142
3.6. Proces autoregresyjny
Model procesu autoregresyjnego rzędu 2 opisuje fakt zależności wartości szeregu w chwili ( od wszystkich 2 wcześniejszych wartości. Model taki oznaczamy symbolem /�(2), a
zależność zapisujemy wzorem [5, 9, 13, 14, 18, 39] E� = �� + ∑ � E�� + ��,# �� g
gdzie 2 – rząd autoregresji, lub też opóźnienie zmiennej objaśniającej, ��,��, … ,�# – parametry modelu autoregresji, �� – biały szum.
Model ten często zapisujemy przy użyciu operatora opóźnienia Z jako
�ZE� = �� + ��, gdzie
Φ�Z = 1 − ��Z − ��Z� −⋯− �#Z# jest wielomianem operatorowym stopnia 2.
Proces autoregresyjny jest stacjonarny gdy pierwiastki 2 wielomianu Φ(Z) leżą poza
okręgiem jednostkowym tzn. |2 | > 1.
Warto zwrócić uwagę na fakt, że funkcje ACF dla procesu autoregresyjnego wygasa
tzn. jej wartości zmniejszają się a od pewnego miejsca leżą w przedziale ufności. Natomiast
liczba niezerowych wartości funkcji PACF przybliża rząd 2modelu.
Zauważmy to na przykładzie procesu E� = 1,3E��� − 0,4E��� + ��. Zapiszemy proces
ten w postaci E��1 − 1,3Z + 0,4Z� = ��. Otrzymaliśmy wielomian charakterystyczny
postaci 1 − 1,3Z + 0,4Z�, który ma dwa pierwiastki 1,25 i 2. Ich moduły są większe od
jedności zatem badany proces jest stacjonarny. Czasami wielomian charakterystyczny
zapisujemy w postaci iloczynowej np. 1 − 1,3Z + 0,4Z� = (1− 0,53)(1− 0,83). Wówczas dla stwierdzenia stacjonarności badamy moduł współczynnika przy 3. U nas
wynoszą odpowiednio 0,5 oraz 0,8 są tym razem mniejsze od 1 co zapewnia stacjonarność.
143
Przykład 3.3.
Dany jest proces którego początkowa realizacja dana jest w tabeli 3.1.
Tabela 0.1. Początkowe wartości szeregu
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0,81 0,68 0,55 0,01 0,92 0,30 0,41 0,55 0,03 0,32 0,65 0,29 0,47 0,10 0,66 0,10 0,40 0,41 0,29 0,47 0,18 0,82
-
0,16 0,63
Źródło: opracowanie własne
Rys. 0.10. Wykres szeregu AR(1) Źródło: opracowanie własne
Rys. 0.11. Wykres funkcji ACF i PACF Źródło: opracowanie własne
144
Rys. 0.12 Wartości testu Ljunga-Boxa Źródło: opracowanie własne
Identyfikację modelu autoregresyjnego przeprowadzamy ustalając jego rząd w oparciu
o funkcje ACF i PACF. Na rysunku 3.11 współczynnik autokorelacji cząstkowej rzędu 1
przekracza znacząco wartość krytyczną a więc jest statystycznie istotny, natomiast pozostałe,
wyższych rzędów nie wychodzą poza obszar, tym samym są statystycznie nieistotne. Zatem
nasz model jest postaci E� = �� + ��E��� + ��. Parametry tego modelu szacujemy klasyczną metodą najmniejszych kwadratów
(MNK) 11wybierając rząd opóźnienia 1.
Rys. 0.13. Ekran dostępu do modelu MNK Źródło: opracowanie własne
11 Patrz str. 31
145
Rys. 0.14. Wybór zmiennych modelu MNK Źródło: opracowanie własne
Rys. 0.15. Ocena parametrów modelu Źródło: opracowanie własne
Wynika stąd, że model jest postaci E� = 0,503682 − 0,328687E��� + ��. Otrzymujemy stąd równanie charakterystyczne wielomianu w postaci iloczynowej 1 +
0,328687Z = 0. Współczynnik przy Z jest mniejszy od jedności zatem szereg jest
stacjonarny.
Rozważmy proces AR(p) dla chwil (, ( − 1. E� = �� +�� E�� + ��,#
��
146
E��� = �� +�� E(���)� + ����.#
��
Wstawiając drugie równanie do pierwszego mamy E� = 8� + 8����� + a�E��� +⋯+ a#�E%���&�#
Wyznaczając kolejno E���, E���, … i wstawiając do równania powyższego
otrzymamy docelowo, że E� = 8� + 8����� + 8����� +⋯. Czyli otrzymaliśmy nieskończony szereg (średnia ważona) białego szumu.
Możemy zatem opisać momenty procesu autoregresyjnego na podstawie powyższej
zależności i wzorów dla procesów MA.
1. �HE�I = '��∑ '��
���
,
2. M!0�E� = �1 + ∑ 8 �� �� L� Należy zwrócić uwagę na fakt, że uzyskanie w wyniku zastosowania modelu AR i MA
składnika losowego, jako różnicy pomiędzy modelem a wartościami rzeczywistymi,
identycznego z procesem białego szumu jest potwierdzeniem, że analiza szeregu czasowego
jednej zmiennej została zakończona. Oznacza to, że nie możemy wydzielić żadnych innych
ważnych składowych procesu (zarówno stacjonarnych, jak i niestacjonarnych), natomiast to,
co pozostało ma charakter czysto losowy.
Równania Yule-Walkera [14] pozwalają w sposób rekurencyjny wyznaczyć wartość
funkcji autokorelacji dla procesu autoregresyjnego AR(p) i są określane zależnością:
V� =�� V�� #
��.
3.7. Proces ARMA
Jeżeli weźmiemy pod uwagę fakt że na wartość procesu mają wpływ zarówno nasze działania
jak i bodźce czysto przypadkowe możemy połączyć oba procesy AR i MA w jeden ARMA
[5, 7, 9, 14, 18, 39]. Jego postać będzie następująca: E� = �� + ��E��� + ��E��� +⋯+ �#E��# + �� + 8����� +⋯+ 8!���!, gdzie �� jest procesem białego szumu.
147
Wykorzystując zdefiniowane operatory wycofania mamy
Φ�ZE� = !� + _�Z��. Model ARMA generuje proces stacjonarny gdy jego składowymi są model stacjonarny
AR oraz model odwracalny MA. Oznacza to że należy zbadać moduły pierwiastków
odpowiednich wielomianów charakterystycznych(wszystkie mają być poza okręgiem
jednostkowym).
Dla procesu ARMA(p,q) funkcja autokowariancji jest zadana zależnością
rekurencyjną:
�� −�� ��� #
��= L��8����",0 ≤ > ≤ �,!
���
�� −�� ��� #
��= 0,> ≥ � + 1,
gdzie �� określają zależności
bccdcce 1, = = 0,�� −�! ��� = 8� ,�
��1 ≤ = ≤ 2,
�� −�! ��� = 8� ,#
��K<!= > 2, 203�63��8� = 0K<!= > �,
! oraz 8 są współczynnikami modelu ARMA(p,q), natomiast L� jest wariancją procesu ��.
3.8. Stopień zintegrowania modelu
W rzeczywistości mamy rzadko do czynienia z procesami stacjonarnymi. Najczęściej jeden z
trzech warunków stacjonarności jest niespełniony i wówczas powinniśmy szukać sposobu jej
usunięcia. Zwykle spotykamy się z niestacjonarnością ze względu na średnią gdy mamy jakiś
szczególny trend lub ze względu na wariancję, gdy mamy dużą zmienność szeregu. W takich
przypadkach należy wykorzystać metody usunięcia trendu lub sezonowości. Proces który
można sprowadzić do stacjonarnego po K krotnym różnicowaniu nazywamy procesem
zintegrowanym stopnia K [5, 13, 14, 18]. Proces zintegrowany stopnia K, który jest typu
AR(p) oznaczamy ARI(p,d), analogicznie MA(q) oznaczamy IMA(d,q), oraz ARMA(p,q)
oznaczamy ARIMA(p,d,q).
148
Niezależnie od wyboru sposobu badania stacjonarności schemat wnioskowania jest
następujący. Rozpoczynamy od analizy szeregu E�. W przypadku przyjęcia hipotezy o
stacjonarności, mówimy, że szereg jest zintegrowany w stopniu zerowym co zapisujemy E�~f(0). Jeżeli jednak przyjmiemy hipotezę o jego niestacjonarności to stosujemy filtr
różnicowy i badamy stacjonarność szeregu E�∗ = ΔE�. Jeżeli taki szereg jest stacjonarny to
mówimy, że szereg E� jest zintegrowany w stopniu pierwszym co zapisujemy E�~f(1). W
przeciwnym wypadku znów stosujemy filtr różnicowy. Procedurę kontynuujemy aż do
znalezienia szeregu stacjonarnego. Jeżeli dla > = 1,2, … ,K − 1 szereg Δ�E� jest
niestacjonarny, natomiast szereg Δ)E� jest stacjonarny to mówimy, że szereg E� jest
zintegrowany w stopniu d co zapisujemy E�~f(K). Liczba różnicowań jest równa liczbie pierwiastków jednostkowych wielomianu
charakterystycznego modelu autoregresji [5, 14, 18]. Jednakże rzadko zdarza się aby
zachodziła potrzeba większej ilości różnicowań niż 2. Dlatego po każdym różnicowaniu
powinniśmy badać czy powstały szereg jest stacjonarny ze względu na wartość średnią.
Większość szeregów makroekonomicznych przedstawiających strumienie lub zasoby
powiązanych z liczbą ludności, takich jak produkcja lub zatrudnienie jest stopnia I(1). Szeregi
I(2) wzrastają według stale rosnącej stopy. Są to w większości przypadków szeregi powiązane
z poziomem cen. Szeregi I(3) lub wyższe występują niezmiernie rzadko. Są to na przykład
zasoby pieniądza, poziomy cen przy hiperinflacji itp. Wyróżniamy dwa skrajne przypadki
niestacjonarności: trend deterministyczny, gdy wartość oczekiwana nie jest stała, i trend
stochastyczny, gdy wariancja nie jest stała.
Rozważmy proces błądzenia losowego z dryftem postaci: E� = � + ��, E� = E��� +� + ��. Wówczas
�HE�I = � ]�(� + ��)�
��^ = �( ≠ 61��(.
Obserwujemy tu trend w wartości oczekiwanej czyli tzw. trend deterministyczny.
Rozważmy operator różnicowania Δ. Niech
Z� = ΔE� = E� − E��� = ��. Dla procesu g� mamy �Hg�I = �HΔY�I = �H��I = 61��(. Zatem proces g� jest stacjonarny.
149
Proces ARIMA(p,d,q) zapisujemy w postaci równania
Φ�ZΔ)E� = !� + _�Z�� lub
Φ�Z(1 − B))E� = !� + _�Z��.
3.9. Procedura Boxa – Jenkinsa
Procedurą Boxa – Jenkinsa nazywamy metodę wstępnego wyznaczania parametrów 2,K, �
modelu ARIMA, adekwatnego dla danego szeregu czasowego [5, 9, 18]. Procedura ta
zwyczajowo dzielona jest na trzy etapy:
1. Identyfikacja,
2. estymacja,
3. diagnozowanie.
1. Identyfikacja wymaga wstępnej identyfikacji trzech parametrów określających rząd
procesu autoregresyjnego, rząd integracji oraz rząd średniej ruchomej. Zaczynamy od
badania wykresu, z którego wnosimy o jego niestacjonarności względem średniej lub
wariancji, skupiskach, lokalnej podwyższonej zmienności itp. Istotnym rolę odgrywa
analiza funkcji autokorelacji i autokorelacji cząstkowej (ACF i PACF). Wyróżniamy
następujące sytuacje wstępnej identyfikacji parametrów 2,K, �.
a) ACF nie wygasa, zatem mamy niestacjonarność. Należy zróżnicować szereg
wyjściowy jedno lub dwukrotnie,
b) ACF wykładniczo gaśnie, PACF jest ucięta od pewnego argumentu p. Daje to
proces AR(p).
c) ACF jest ucięta, a PACF szybko gaśnie. Oznacza to proces MA(q).
d) Jeśli ani ACF ani PACF nie maja punktu ucięcia, to proces jest mieszany
ARIMA(p,q).
2. Po tak wstępnym wyestymowaniu parametrów p i q badamy modele o wartościach nieco
większych dla wyestymowanych parametrów. Liczymy więc kolejno modele
powiększając za każdym razem tylko jeden parametr o jedna jednostkę. Badamy
statystycznie normalność reszt. Jeśli okaże się, że mimo to otrzymujemy nieakceptowalny
ze względu na normalność reszt model, oznacza to, że metoda ARIMA jest niewłaściwą
metodą estymacji dla danego szeregu. Do dalszej estymacji parametrów stosuje się
metodę największej wiarygodności (MNW).
150
3. Po oszacowaniu modelu sprawdzamy wykresy reszt i przeprowadzamy test Jarque-Bera`y
na normalność reszt. Często stosowanym testem na autokorelacje reszt oszacowanego
modelu jest test Q Ljunga- Boxa. Powszechnie stosowanym kryterium porównania modeli
o różnych zestawach parametrów są kryterium informacyjne Akaike lub kryterium
informacyjne Schwartza-Bayesa Za liczbę h oznaczającą liczbę szacowanych parametrów
należ podstawić 2 + �. Za model lepiej dopasowany uznajemy natomiast ten o najniższej
wartości kryterium informacyjnego.
Korzystanie z kryteriów informacyjnych w praktyce oznacza, że powinniśmy
estymować wszystkie możliwe modele ARMA dla których rząd opóźnień składowej AR jest
mniejszy lub równy ustalonemu p, a rząd składowej MA mniejszy lub równy ustalonemu q, a
następnie wybrać ten dla którego wartość kryterium informacyjnego jest najmniejsza.
Rozważmy szereg wartości cen miedzi, którego początkowa realizacja jest dana w
tabeli 3.2.
Tabela 0.2. Początkowe wartości cen miedzi
2007-04-16 2007-04-17 2007-04-18 2007-04-19 2007-04-20 2007-04-23 2007-04-24 2007-04-26 7690,00 8015,00 7874,00 7797,00 7887,00 7955,00 7828,00 7662,00
Źródło: wyborcza.biz.pl
Obliczenia wykonujemy w programie Gretl. Na początek wykonujemy wykres
obserwacji przedstawiony na rysunku 3.16.
Rys. 0.16. Wykres obserwacji Źródło: opracowanie własne
2000
3000
4000
5000
6000
7000
8000
9000
10000
11000
0 200 400 600 800 1000 1200 1400
Kurs
151
Z wykresu możemy wstępnie wnioskować o istnieniu niestacjonarności szeregu
względem średniej i wariancji. W celu usunięcia niestacjonarności względem wariancji
rozważamy szereg zlogarytmowany, natomiast dla usunięcia niestacjonarności względem
średniej rozważmy jego pierwsze różnice.
Zatem będziemy identyfikować model ARIMA o stopniu integracji 1. Na podstawie
korelogramu wartości zlogarytmowanych i pierwszych ich różnic szacujemy że � 1, � 2.
Rys. 0.17. Wykresy ACF i PACF Źródło: opracowanie własne
Analizujemy model ARIMA(1,1,2).
Rys. 0.18. Specyfikacja modelu ARIMA(1,1,2) Źródło: opracowanie własne
152
Okazuje się że najlepszym, który ma istotne statystycznie współczynniki jak również
najniższe kryterium Akaike’a jest model ARIMA(1,1,2).
Rys. 0.19. Specyfikacja modelu ARIMA(1,1,1) Źródło: opracowanie własne
Dopasowanie modelu obrazuje poniższy rysunek. Następnym etapem jest zbadanie
normalności reszt
Rys. 0.20. Porównanie szeregów Źródło: opracowanie własne
7,8
8
8,2
8,4
8,6
8,8
9
9,2
9,4
0 200 400 600 800 1000 1200 1400
l_Kurs
Empiryczne i wyrównane warto¶ci zmiennej: l_Kurs
wyrównane
empiryczne
153
3.10. Model SARIMA
Wygodnie jest przy szeregach z sezonowością rozpatrywać podszeregi zbudowane z danych
z tego samego sezonu (np. przy sezonowości kwartalnej z tego samego kwartału) . Model
ARMA dla tych danych będzie postaci:
Φ*�Z"E� = !� + _+�Z"��. gdzie
Φ*�Z" = 1 − ��Z" − ��Z�" −⋯− �,Z,", _+�Z" = 1 + 8�Z" +⋯+ 8+Z+". Operatory Φ*�Z" oraz _+�Z" są odpowiednio sezonowymi operatorami dla
autoregresji i średniej ruchomej rzędu P, Q o okresie sezonowym s. Model taki oznaczamy
symbolem SARMA(P,Q)s [5, 13, 18]
Rozważmy model SARMA(1,1)12 o okresie sezonowości 12. Wówczas
Φ��Z�� = 1 − ��Z��, _��Z�� = 1 + 8�Z��. Zatem model zapiszemy w postaci �1 − ��Z��E� = !� + �1 + 8�Z����,
skąd E� = ��E���� + �� + 8������ + ��. Okazuje się, ze szeregi sezonowe mogą również posiadać trend, który jak już wiemy
usuwamy poprzez kolejne różnicowanie. Model taki nazywamy SARIMA(P,D,Q)s i
zapisujemy w postaci
Φ*�Z"Δ"-E� = !� + _+�Z"�� lub
Φ*�Z"�1 − Z"-E� = !� + _+�Z"��. Łącząc model sezonowy ze standardowym otrzymamy model
SARIMA(p,d,q)x(P,D,Q)s postaci:
Φ�ZΦ*�Z"Δ)Δ"-E� = !� + _�Z_+�Z"�� Jako przykład rozważmy model SARIMA(0,1,1)x(0,1,1)12 tzn. Φ�Z = 1, Φ*�Z" =
Φ��Z�� = 1, Δ) = Δ = (1 − Z), Δ"- = Δ�� = (1 − Z��), _�Z = 1 + 8�Z, _+�Z" =_��Z�� = 1 + 8�Z��. Zatem �1 − Z�1 − Z��E� = �1 + 8�Z�1 + 8�Z���� skąd
154
�1 − Z − Z�� + Z��E� = �1 + 8�Z+8�Z��+8�8�Z����, lub w prostszej postaci E� = E��� + E���� − E���� + �� + 8�����+8������+8�8������.
Modele SARIMA często traktuje się jako szczególne przypadki procesów ARIMA.
Rozpisując równanie operatorowe dla procesu SARIMA (p,d,q)x(P,D,Q)s otrzymamy proces
ARIMA(p+Ps+d+sD, q+sQ). Jednakże ich wykorzystanie ma sens w prostocie zapisu i
interpretacji. Poniższa tabela przedstawia klasyfikację podstawowych modeli szeregów
czasowych
Tabela 0.3. Klasyfikacja podstawowych modeli procesów stochastycznych
Charakterystyki procesu Wariancja procesu stacjonarna Niestacjonarna-procesy zintegrowane niecykliczna cykliczna
Średnia procesu
stacjonarna ARMA(p,q) ARIMA(p,d,q) ARIMA(P,D,Q)
niestacjonarna niecykliczna f(t) ARIMA(p,d,q)+f(t) ARIMA(P,D,Q)+f(t) cykliczna g(t) ARIMA(p,d,q)+g(t) ARIMA(P,D,Q)+g(t)
f(t) – trend deterministyczny, g(t) – wahania okresowe deterministyczne Źródło: [9]
3.11. Prognozy w modelach ARIMA
Ogólną postać modelu ARIMA zapisujemy w postaci operatorowej jak wiemy następująco:
Φ�Z(1 − B))E� = !� + _�Z��. Rozważmy trzy postacie jawne tego modelu [5]:
1. Wartość E� procesu zapisujemy poprzez poprzednie jego wartości oraz bieżącą i
poprzednie wartości ��. E� = �� + ��E���� + ��E���� +⋯+ �#)E���#�) + ��� + 8������ +⋯+ 8!����!
To równanie jest bardzo wygodne do wyznaczania prognoz.
2. Wartość E�� zapisujemy tylko przy pomocy bieżących i poprzednich impulsów ���� jako nieskończona suma
E�� = � _��������
����=�_�������
���= �Z��,
gdzie _� = 1. Wagi _ wyznaczamy z zależności:
155
Φ�Z�1 − B)Θ(Z) = _�Z. Dla dodatnich < > K model ten przedstawiamy w postaci uciętej E�� = i�� + ��� + _������ +⋯+ _������, gdzie
i�� = � _�������
����=�_������ .�
���
3. Poprzez nieskończoną sumę ważoną poprzednich wartości szeregu E�� i bieżącego
impulsu ��� E�� =�2�E�����
���+ ���.
Jeżeli K ≥ 1, to wyrażenie
�2�E�����
���
jest średnią ważoną. Wagi 2� wyznaczamy z zależności
Φ�Z�1 − B) = �1 − 2�Z − 2�Z� −⋯ _�Z poprzez porównanie współczynników przy tych samych potęgach.
Jeżeli mamy wykonany odpowiedni model, to możemy go wykorzystać do
wyznaczenia prognoz. Rozważmy proces ARIMA(p,d,q) postaci E� = �� + ��E��� + ��E��� +⋯+ �#E��# + �� + 8����� +⋯+ 8!���!, Prognozą realizacji procesu stochastycznego zrobioną w okresie ( z wyprzedzeniem <
jest wartość oczekiwana �[E��] postaci E��∗ = �NE��O = �[�� + ��E���� + ��E���� +⋯+ �#E���# + ��� + 8������ +⋯+ 8!����! .
Przez wartość oczekiwaną �NE��O rozumiemy tu warunkową wartość oczekiwaną E�� przy znajomości wszystkich wartości E do momentu (, czyli �NE��|E�,E���, … O. Funkcję E�∗(<) = E��∗ jako funkcję zmiennej < przy ustalonym ( nazywamy funkcją prognozy w
momencie (. Błąd prognozy dla wyprzedzenia <wynosi ���< = ��� + _������ +⋯+ _������.
156
Wariancja błędu prognozy M!0:���<; = �1 + _�� + _�� +⋯+ _���� L�. Błąd prognozy na jeden krok naprzód jest równy ���1 = E�� − E��∗ = ���. Poprawianie prognoz. Spróbujmy znaleźć przedziały prawdopodobieństw dla prognoz
z wyprzedzeniem 1,2, … , j i obliczmy nowe prognozy poprzez poprawę starych. Korzystając
z punktu 2) z równania operatorowego wyznaczamy wartości wag _�,_�, …_.. Są one
postaci: _� = Y�∗ − 8�,_� = Y�∗_� + Y�∗ − 8�,⋮_� = Y�∗_��� +⋯+ Y#)∗ _��#�) − 8� .
gdzie _� = 1, _� = 0, dla = < 0 i 8� = 0 dla = > � oraz _∗ są współczynnikami równania
operatorowego postaci _∗�Z = _�Z�1 − Z) = _�ZΔ) . Jeżeli h = �!"F2 + K − 1, �G, to dla = > h wagi _ spełniają równanie _� = Y�∗_��� +⋯+ Y#)∗ _��#�) .
Zauważmy, że w momencie ( prognoza z wyprzedzeniem < + 1 będzie postaci: E�(��)∗ = _���� + _������ +⋯, Natomiast w momencie ( + 1 prognoza z wyprzedzeniem < będzie postaci: E%��&�∗ = _���� + _���� +⋯,
skąd E%��&�∗ = E�(��)∗ + _����. Zatem prognozę w chwili ( na moment < + 1 poprawiamy poprzez dodanie ��� =���1, który jest błędem prognozy na jeden krok naprzód wzmocnionego przez czynnik _�.
Znając wagi _ możemy podać przedział ufności dla prognozy w postaci
kE�� − 5/���1 +�_�����
���;E�� + 5/���1 +�_�����
���l,
gdzie 5
�
jest kwantylem rzędu 1 − �/2 standardowego rozkładu normalnego, natomiast �� jest estymatorem wariancji L�.
157
Rozważmy poprzedni przykład ceny miedzi w programie Statistica. Dane to ceny
miedzi za okres od16.04.2007 do 31.12.2012. Po otwarciu pliku z danymi przechodzimy do
modułu Analiza szeregów czasowych i wybieramy opcję Arima i funkcja autokorelacji. Tak
jak w Gretlu analizę zaczynamy od przeglądu funkcji ACF i PACF. Analizując wykres
szeregu dochodzimy do wniosku że mamy brak stacjonarności wariancji i średniej. Zatem
logarytmujemy szereg i różnicujemy go za pomocą przycisku Inne przekształcenia i wykresy,
zatwierdzając OK(przekształć wybrany szereg).
Otrzymujemy potwierdzenie że 2 ≈ 1, � ≈ 2. Przechodzimy do zakładki Więcej i
zaznaczamy opcje jak niżej. W szczególności zaznaczamy STAŁĄ, rząd autoregresji p 1, rząd
średniej ruchomej q 2 i różnice pierwszego opóźnienia 1. Oczywiście należy zaznaczyć
przekształć zmienną przed analizą funkcją logarytm naturalny.
Rys. 0.21. Modyfikacja szeregu Źródło: opracowanie własne
Rys. 0.22. Wykresy ACF i PACF dla szeregu log ceny miedzi Źródło: opracowanie własne
158
Rys. 0.23. Wybór postaci modelu ARIMA Źródło: opracowanie własne
Otrzymujemy parametry modelu wraz z oceną ich błędów i istotnością.
Rys. 0.24. Ocena parametrów modelu Źródło: opracowanie własne
W ten sposób możemy zbadać kilka modeli i dobrać te które mają istotne parametry.
Następnym krokiem jest badanie reszt. W tym celu przechodzimy do zakładki Rozkład reszt.
Możemy dla niego zbadać wykres normalności
159
Rys. 0.25. Wykres normalności Źródło: opracowanie własne
Wykresy funkcji ACF i PACF dla reszt modelu
Rys. 0.26. ACF i PACF reszt modelu Źródło: opracowanie własne
160
Ponieważ nie ma istotnych korelacji reszt można po zbadaniu testami normalności
reszt przejść do prognozowania w zakładce Więcej. Ustalamy tu na podstawie jak długiego
szeregu prognozujemy i z jakim wyprzedzeniem.
Szeregi czasowe są ciągiem obserwacji rozmieszczonych w czasie. Przykładami takich
ciągów są roczne dane o zyskach firm, kwartalne dane o Produkcie Krajowym Brutto (PKB),
miesięczne informacje o stopie bezrobocia, tygodniowe sprawozdania o wielkości sprzedaży
w firmie, dzienne dane o obrotach na giełdzie. Są to tzw. dane dyskretne. Ale jeśli
popatrzymy na wyceny akcji, czy zapis EKG (elektrokardiogram), lub zapis drgań ziemi
możemy mówić niemal o zapisie ciągłym. Istnieje wiele powodów do zapisywania i
analizowania danych czasowych. Są to np. próba analizowania własności szeregu, próba
szukania analogi w zachowaniu się szeregu, ale też chęć lepszego zrozumienia mechanizmów
generowania szeregu a tym samym możliwość przewidywania przyszłości. Wraz z rozwojem
nowoczesnych wysoko wydajnych komputerów stało się możliwe wykonywanie obliczeń na
dużych macierzach. Dzięki temu możliwe stało się, zaawansowane oparte na własnościach
procesów stochastycznych, badanie szeregów czasowych. Modele szeregów czasowych są
wykorzystywane coraz częściej do opisu i przewidywania zachowań gospodarki. Nieraz nie
jesteśmy w stanie określić niektórych zależności, pomiędzy zmiennymi, za to chcemy
uchwycić zależność samego szeregu w czasie. W tym celu wykorzystujemy szeregi czasowe.
Obecnie rozwija się zarówno narzędzia badania szeregów autoregresji wraz ze średnią
ruchomą ale również zależności wielowymiarowe w modelach VAR i GARCH. Omawiane w
tym rozdziale zagadnienia mają na celu przedstawienie podstawowych informacji i własności
o procesach autoregresyjnych i procesach średniej ruchomej. Procesy te są wykorzystywane
do opisu zjawisk gospodarczych np. PKB. Są one również wyjściem do przygotowywania
wstępnych prognoz. Analiza rzeczywistych danych przy pomocy metod statystycznych, a
zwłaszcza przy pomocy pakietów statystycznych, nie jest zwykle integralną częścią studiów
matematycznych. Jednakże jest ona na pewno użyteczna w przyszłej pracy zawodowej.
Dlatego też wszystkie rozważania zostały zobrazowane przy pomocy pakietów Gretl i
Statistica.
161
Podsumowanie
W dzisiejszym świecie przepływu dużej ilości informacji przestaje być istotne co było, nawet
co jest, a staje się priorytetem informacja o przyszłości. Każdy z nas chce wiedzieć jaka
będzie pogoda jutro gdy pójdziemy do pracy, czy też na spacer, za tydzień gdy chcemy
odwiedzić znajomych, czy za kilka miesięcy gdy będziemy na wakacjach. Służby reagowania
kryzysowego chcą wiedzieć czy grozi nam powódź lub inne zdarzenie. Przedsiębiorcy chcą
przewidywać zachowania rynku by dostosować do nich swoją produkcję.
Najpierw dokonywano naiwnych przewidywań w sprawach banalnych, babcia mówiła
„dziś wieje z południa za trzy dni będzie padał deszcz”. Te przewidywania były oparte na
obserwacji natury i często podawane w postaci przysłów.
Wraz z rozwojem nauki zaczęto badać dokładniej różne zjawiska. Na szczególną
uwagę zasłużyły zjawiska ekonomiczne. Wszakże poznanie zarysu przyszłości w biznesie to
czysty zysk. Każdy podejmując decyzje, chce je opierać o realne i rzetelne prognozy. Rządy
państw chcą znać prognozy przychodów z podatków i prognozy wydatków budżetowych, aby
móc racjonalnie gospodarować budżetem i utrzymywać dziurę budżetową na jak najniższym
poziomie. Podobnie postępują samorządy lokalne. Banki prognozują m.in. stopę procentową
oraz kurs walutowy aby zabezpieczać się przed ryzykiem spowodowanym przez te czynniki
makroekonomiczne. Ryzyko jakie mogą powodować te czynniki makroekonomiczne to
ryzyko płynności banku lub niebezpieczeństwo, że przy zbyt drastycznych wzrostach tych
czynników, kredytobiorcy nie będą w stanie wywiązać się ze swoich zobowiązań. Firmy
produkcyjne również prognozują. Starają się one zaprognozować dobrze produkcję na
następne okresy, aby nie zostać z nadwyżką towaru lub jego niedoborem w istotnych
okresach. Firmy eksportujące lub importujące muszą prognozować wartość kursów
walutowych, aby dalej opłacało im się handlować. Wszystkie te podmioty chcą znać
prognozy gospodarcze aby wiedzieć, czy zatrudnić nową siłę roboczą, bo gospodarka będzie
się rozkręcać, czy też ciąć zatrudnienie ze względu na zbliżający się kryzys.
Do prognozowania używanych jest wiele modeli matematycznych, poczynając od
modeli naiwnych poprzez regresje linowe, średnie ruchome i trendy pełzające, aż do
wygładzania wykładniczego. Używanych jest również wiele modeli opartych o wiedzę i
doświadczenie eksperckie. Oczywiście każdy podmiot gospodarczy czy też osoba fizyczna
prognozuje zgodnie ze swoją wiedzą.
162
Wraz z rozwojem narzędzi matematycznych, a szczególne statystyki, a następnie
metod komputerowych stało się możliwe wykorzystanie coraz bardziej zaawansowanego
aparatu matematycznego. Rozpoczęto badania zależności pomiędzy zjawiskami i powstały
modele regresji liniowej jedno i wielowymiarowe.
W niniejszej monografii skupiliśmy się między innymi na dokładnym przedstawieniu
jak zbudować model ekonometryczny, na podstawie którego możemy wyciągać wnioski co
do przyszłości. Jest to ekonometria klasyczna, która została wzbogacona o następne modele.
Modele szeregów czasowych, które z natury są proste i możliwe do wykorzystania przez
każdego przy pomocy arkusza kalkulacyjnego. Następnym etapem są już zaawansowane
modele szeregów czasowych oparte o pojęcia procesów stochastycznych stacjonarnych i
niestacjonarnych. Przedstawione tutaj informację mają na celu pokazanie ewolucji w
badaniach nad prognozowaniem przy jednoczesnym pokazaniu wielu przykładów
zastosowania niekoniecznie trudnych modeli, zwłaszcza jeśli można do tego użyć
funkcjonujących na rynku narzędzi. Wykorzystaliśmy do tego takie narzędzia ja MS Excel,
Gretl, Statisticę.
163
Tablice statystyczne
Aneks A
Wartości krytyczne dla testu t Studenta
spełniające warunek ( ),P t tα ν α> =
α / ν α = 0.5 α = 0.1 α = 0.05 α = 0.01 α = 0.005 α = 0.001 ν =1 1,0000 6,.3138 12,7062 63,6567 127,3213 636,6196 ν =2 0,8165 2,9200 4,3027 9,9248 14,0890 31,5991 ν =3 0,7649 2,3534 3,1824 5,8409 7,4533 12,9240 ν =4 0,7407 2,1318 2,7764 4,6041 5,5976 8,6103 ν =5 0,7267 2,0150 2,5706 4,0321 4,7733 6,8688 ν =6 0,7176 1,9432 2,4469 3,7074 4,3168 5,9588 ν =7 0,7111 1,8946 2,3646 3,4995 4,0293 5,4079 ν =8 0,7064 1,8595 2,3060 3,3554 3,8325 5,0413 ν =9 0,7027 1,8331 2,2622 3,2498 3,6897 4,7809 ν =10 0,6998 1,8125 2,2281 3,1693 3,5814 4,5869
11 0,6974 1,7959 2,2010 3,1058 3,4966 4,4370 12 0,6955 1,7823 2,1788 3,0545 3,4284 4,3178 13 0,6938 1,7709 2,1604 3,0123 3,3725 4,2208 14 0,6924 1,7613 2,1448 2,9768 3,3257 4,1405 15 0,6912 1,7530 2,1314 2,9467 3,2860 4,0728 16 0,6901 1,7459 2,1199 2,9208 3,2520 4,0150 17 0,6892 1,7396 2,1098 2,8982 3,2224 3,9651 18 0,6884 1,7341 2,1009 2,8784 3,1966 3,9216 19 0,6876 1,7291 2,0930 2,8690 3,1737 3,8834 20 0,6870 1,7247 2,0860 2,8453 3,1534 3,8495 22 0,6858 1,7171 2,0739 2,8188 3,1188 3,7921 24 0,6848 1,7109 2,0639 2,7969 3,0905 3,7455 26 0,6840 1,7056 2,0555 2,7787 3,0669 3,7066 28 0,6834 1,7011 2,0484 2,7633 3,0469 3,6739 30 0,6828 1,6973 2,0423 2,7500 3,0298 3,6460 35 0,6816 1,6901 2,0286 2,7280 3,0008 3,5829 40 0,6807 1,6839 2,0211 2,7045 2,9712 3,5510 45 0,6800 1,6780 2,0142 2,6898 2,9522 3,5204 50 0,6794 1,6759 2,0086 2,6778 2,9370 3,4960 60 0,6786 1,6706 2,0003 2,6603 2,9146 3,4602 70 0,6780 1,6669 1,9944 2,6479 2,8997 3,4350 80 0,6776 1,6641 1,9901 2,6387 2,8870 3,4163 90 0,6772 1,6620 1,9867 2,6316 2,8779 3,4019 100 0,6770 1,6602 1,9840 2,6259 2,8707 3,3905 200 0,6757 1,6525 1,9719 2,6006 2,8385 3,3398 500 0,6750 1,6479 1,9647 2,5857 2,8195 3,3101 ∞ 0,6745 1,6449 1,9600 2,5758 2,8070 3,2905
164
Aneks B
Wartości krytyczne dla testu F Fishera-Snedecora spełniające warunek ( )1 2, ,m mP F Fα α> = ,
dla 0.05α = , gdzie 1 1m n k= − , 2 2m n k= −
1m
/ 2m 1m
=1
2 3 4 5 6 7 8 9 10 11 12
2m
=1
161 200 216 225 230 234 237 239 241 242 244 245
2 18,5 19,0 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,4 19,4 19,4 3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,71 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,96 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,53 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,24 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,03 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,86 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,64 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,48 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,37 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,29 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,22 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,04 35 4,12 3,27 2,87 2,64 2,48 2,37 2,28 2,22 2,16 2,12 2,04 1,98 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,95 45 4,05 3,21 2,81 2,58 2,43 2,30 2,23 2,15 2,10 2,04 1,97 1,91 50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,89 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,86 80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,88 1,82 100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,79 125 3,92 3,07 2,68 2,44 2,29 2,17 2,08 2,01 1,96 1,91 1,83 1,77 150 3,90 3,06 2,66 2,46 2,27 2,16 2,07 2,00 1,94 1,89 1,82 1,76 200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,80 1,74 300 3,87 3,03 2,63 2,40 2,24 2,13 2,04 1,97 1,91 1,86 1,78 1,72 500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,77 1,71 1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,76 1,70
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,69
165
Aneks B (c.d.)
Wartości krytyczne dla testu F Fishera-Snedecora spełniające warunek ( )1 2, ,m mP F Fα α> = ,
dla 0.05α = , gdzie 1 1m n k= − , 2 2m n k= −
1m
/ 2m
16 18 20 24 30 40 50 75 100 200 500 ∞
2m
=1
246 247 248 249 250 251 252 253 253 254 254 254
2 19,4 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5 19,5 19,5 19,5 3 8,69 8,67 8,66 8,64 8,62 8,59 8,58 8,57 8,55 8,54 8,53 8,53 4 5,84 5,82 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63 5 4,60 4,58 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,37 6 3,92 3,90 3,87 3,84 3,81 3,77 3,75 3,72 3,71 3,69 3,68 3,67 7 3,49 3,47 3,44 3,41 3,38 3,34 3,32 3,29 3,28 3,25 3,24 3,23 8 3,20 3,17 3,15 3,12 3,08 3,05 3,03 3,00 2,98 2,96 2,94 2,93 9 2,99 2,96 2,94 2,90 2,86 2,82 2,80 2,77 2,76 2,73 2,72 2,71 10 2,83 2,80 2,77 2,74 2,70 2,67 2,64 2,61 2,59 2,56 2,55 2,54 12 2,60 2,57 2,54 2,50 2,46 2,42 2,40 2,36 2,35 2,32 2,31 2,30 14 2,44 2,41 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13 16 2,33 2,30 2,28 2,24 2,20 2,16 2,13 2,09 2,07 2,04 2,02 2,01 18 2,25 2,22 2,19 2,15 2,11 2,07 2,04 2,00 1,98 1,95 1,93 1,92 20 2,18 2,15 2,12 2,08 2,04 1,99 1,96 1,92 1,90 1,87 1,85 1,84 30 1,99 1,96 1,93 1,89 1,84 1,79 1,76 1,72 1,69 1,66 1,64 1,62 35 1,94 1,91 1,88 1,83 1,79 1,73 1,70 1,66 1,63 1,60 1,57 1,56 40 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51 45 1,87 1,84 1,81 1,76 1,72 1,66 1,63 1,58 1,54 1,52 1,49 1,47 50 1,85 1,81 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44 60 1,81 1,78 1,75 1,70 1,65 1,59 1,56 1,50 1,48 1,44 1,41 1,39 80 1,77 1,73 1,70 1,65 1,60 1,54 1,51 1,45 1,42 1,38 1,35 1,32 100 1,75 1,71 1,68 1,63 1,57 1,51 1,48 1,42 1,39 1,34 1,30 1,28 125 1,72 1,69 1,65 1,60 1,55 1,49 1,45 1,39 1,36 1,31 1,27 1,25 150 1,71 1,67 1,64 1,59 1,54 1,47 1,44 1,37 1,34 1,29 1,25 1,22 200 1,69 1,66 1,62 1,57 1,52 1,45 1,42 1,35 1,32 1,26 1,22 1,19 300 1,68 1,64 1,61 1,55 1,50 1,43 1,39 1,33 1,30 1,23 1,19 1,15 500 1,66 1,62 1,59 1,54 1,48 1,42 1,38 1,31 1,28 1,21 1,16 1,12 1000 1,65 1,61 1,58 1,53 1,47 1,41 1,36 1,30 1,26 1,19 1,13 1,08
∞ 1,64 1,60 1,57 1,52 1,46 1,40 1,35 1,28 1,24 1,17 1,11 1,00
166
Aneks C
Wartości krytyczne dla testu serii
spełniające warunek ( )1 2, ,n nP S Sγ γ≤ = , dla 2 0.025γ α= =
1n/
2n
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2 3 4 5 2 2 6 2 2 3 3 7 2 2 3 3 3 8 2 3 3 3 4 4 9 2 3 3 4 4 5 5 10 2 3 3 4 5 5 5 6 11 2 3 4 4 5 5 6 6 7 12 2 2 3 4 4 5 6 6 7 7 7 13 2 2 3 4 5 5 6 6 7 7 8 8 14 2 2 3 4 5 5 6 7 7 8 8 9 9 15 2 3 3 4 5 6 6 7 7 8 8 9 9 10 16 2 3 4 4 5 6 6 7 8 8 9 9 10 10 11 17 2 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 18 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 19 2 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 20 2 3 4 5 6 6 7 8 9 9 10 10 12 12 13 13 13 13 14
167
Aneks D
Wartości krytyczne dla testu serii
spełniające warunek ( )1 2, ,n nP S Sγ γ≤ = , dla 1 2 0.975γ α= − =
1n
/
2n
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2 4 3 5 6 4 5 7 8 5 5 7 8 9 6 5 7 8 9 10 7 5 7 9 10 11 12 8 5 7 9 10 11 12 13 9 5 7 9 11 12 13 13 14 10 5 7 9 11 12 13 14 15 15 11 5 7 9 11 12 13 14 15 16 16 12 5 7 9 11 12 13 15 15 16 17 18 13 5 7 9 11 13 14 15 16 17 18 18 19 14 5 7 9 11 13 14 15 16 17 18 19 19 20 15 5 7 9 11 13 14 15 17 17 18 19 20 21 21 16 5 7 9 11 13 15 16 17 18 19 20 20 21 22 22 17 5 7 9 11 13 15 16 17 18 19 20 21 22 22 23 24 18 5 7 9 11 13 15 16 17 18 19 20 21 22 23 24 24 25 19 5 7 9 11 13 15 16 17 19 20 21 22 22 23 24 25 25 26 20 5 7 9 11 13 15 16 17 19 20 21 22 23 24 24 25 26 26 27
168
Aneks E
Wartości krytyczne dla testu Durbina–Watsona dla 0.05α =
n k=1 k=2 k=3 k=4 k=5 Ld Ud Ld Ud Ld Ud Ld Ud Ld Ud
6 0.61 1.40 7 0.70 1.36 0.47 1.90 8 0.73 1.33 0.56 1.78 9 0.82 1.32 0.63 1.70 10 0.88 1.32 0.70 1.64 11 0.93 1.32 0.76 1.60 12 0.97 1.33 0.81 1.58 13 1.01 1.34 0.86 1.56 14 1.05 1.35 0.91 1.55 15 1.08 1.36 0.95 1.54 0.82 1.75 0.69 1.97 0.56 2.21 16 1.10 1.37 0.98 1.54 0.86 1.73 0.74 1.93 0.62 2.15 17 1.13 1.38 1.02 1,54 0.90 1,71 0/78 1.90 0.67 2.10 18 1.16 1.39 1.05 1.53 0.93 1.69 0.82 1.87 0.71 2.06 19 1.18 1.40 1.08 1.53 0.97 1.68 0.86 1.85 0.75 2.02 20 1.20 1.41 1.10 1.54 1.00 1.68 0.90 1.83 0.79 1.99 21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96 22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 24 1.27 1.45 1.19 1.55 1.10 1.66 1.01 1.78 0.93 1.90 25 1.29 1.45 1.21 1.55 1.12 1.66 1.04 1.77 0.95 1.89 26 1.30 1.46 1.22 1.55 1.14 1.65 1.06 1.76 0.98 1.88 27 1.32 1.47 1.24 1.56 1.16 1.65 1.08 1.76 1.01 1.86 28 1.33 1.48 1.26 1.56 1.18 1.65 1.10 1.75 1.03 1.85 29 1.34 1.48 1.27 1.56 1.20 1.65 1.12 1,74 1.05 1.84 30 1.35 1.49 1.28 1.57 1.21 1.65 1.14 1.74 1.07 1.83 31 1.36 1.50 1.30 1.57 1.23 1.64 1.16 1.74 1.09 1.83 32 1.37 1.50 1.31 1.57 1.24 1.65 1.18 1.73 1.11 1.82 33 1.38 1.51 1.32 1.58 1.26 1.65 1.19 1.73 1.13 1.81 34 1.39 1.51 1.33 1.58 1.27 1.65 1.21 1.73 1.15 1.81 35 1.40 1.52 1.34 1.58 1.28 1.65 1.22 1.73 1.16 1.80 36 1.41 1.52 1.35 1.59 1.29 1.65 1.24 1.73 1.18 1.80 37 1.42 1.53 1.36 1.59 1.31 1.66 1.25 1.72 1.19 1.80 38 1.43 1.54 1.37 1.59 1.32 1.66 1.26 1.72 1.21 1.79 39 1.43 1.54 1.38 1.60 1.33 1.66 1.27 1.72 1.22 1.79 40 1.44 1.54 1.39 1.60 1.34 1.66 1.29 1.72 1.23 1.79 45 1.48 1.57 1.43 1.62 1.38 1.67 1.34 1.72 1.29 1.78 50 1.50 1.59 1.46 1.63 1.42 1.67 1.38 1.72 1.34 1.77 55 1.53 1.60 1.49 1.64 1.45 1.68 1.41 1.72 1.38 1.77 60 1.55 1.62 1.51 1.65 1.48 1.69 1.44 1.73 1/41 1.77 65 1.57 1.63 1.54 1.66 1.50 1.70 1,47 1.73 1.44 1.77 70 1.58 1.64 1.55 1.67 1.52 1.70 1,49 1.74 1.46 1.77 75 1.60 1.65 1.57 1.68 1.54 1.71 1,51 1.74 1.49 1.77 80 1.61 1.66 1.59 1.69 1,56 1.72 1.53 1.74 1.51 1.77 85 1.62 1.67 1.60 1.70 1.57 1.72 1.55 1.75 1.52 1.77 90 1.63 1.68 1.61 1.70 1.59 1.73 1,57 1.75 1.54 1.78 95 1.64 1.69 1.62 1.71 1.60 1.73 1.58 1.75 1.56 1.78 100 1.65 1.69 1.63 1.72 1.61 1.74 1.59 1.76 1.57 1.78
169
Aneks F
Współczynniki ,n iα dla testu Shapiro–Wilka
2 3 4 5 6 7 8 9 10 1 0.707 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5888 0.5739 2 – 0.0000 0.1677 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291 3 – – – 0.0000 0.0875 0.1401 0.1743 0.1976 0.2141 4 0.0000 0.0561 0.0947 0.1224 5 0.0000 0.0399
Ciąg dalszy tabeli 11 12 13 14 15 16 17 18 19 20 1 0.5601 0.5475 0.5359 0.5251 0.5150 0.5656 0.4968 0.4886 0.4808 0.4734 2 0.3315 0.3325 0.3325 0.3318 0.3306 0.3290 0.3273 0.3253 0.3232 0.3211 3 0.2260 0.2347 0.2412 0.2460 0.2495 0.2521 0.2540 0.2553 0.2561 0.2565 4 0.1429 0.1586 0.1707 0.1802 0.1878 0.1939 0.1988 0.2027 0.2059 0.2085 5 0.0695 0.0922 0.1099 0.1240 0.1353 0.1447 0.1524 0.1587 0.1641 0.1686 6 0.0000 0.0303 0.0539 0.0727 0.0880 0.1005 0.1109 0.1197 0.1271 0.1334 7 0.0000 0.0240 0.0433 0.0593 0.0725 0.0837 0.0932 0.1013 8 0.0000 0.0196 0.0359 0.0496 0.0612 0.0711 9 0.0000 0.0016 0.0303 0.0422 10 0.0000 0.0140
Ciąg dalszy tabeli
21 22 23 24 25 26 27 28 29 30 1 0.4643 0.4590 0.4542 0.4493 0.4450 0.4407 0.4366 0.4328 0.4291 0.4254 2 0.3185 0.3156 0.3126 0.3098 0.3069 0.3043 0.3018 0.2992 0.2968 0.2944 3 0.2578 0.2571 0.2563 0.2554 0.2543 0.2533 0.2522 0.2510 0.2499 0.2487 4 0.2129 0.2131 0.2139 0.2145 0.2148 0.2151 0.2152 0.2151 0.2150 0.2148 5 0.1736 0.1764 0.1787 0.1807 0.1822 0.1836 0.1848 0.1857 0.1864 0.1870 6 0.1399 0.1445 0.1480 0.1512 0.1539 0.1563 0.1584 0.1601 0.1616 0.1630 7 0.1092 0.1150 0.1201 0.1245 0.1283 0.1316 0.1346 0.1372 0.1395 0.1415 8 0.0804 0.0878 0.0941 0.097 0.1046 0.1089 0.1128 0.1162 0.1192 0.1219 9 0.0530 0.0618 0.0696 0.0764 0.0823 0.0876 0.0923 0.0965 0.1002 0.1036 10 0.0263 0.0368 0.0453 0.0539 0.0610 0.0672 0.0728 0.0778 0.0822 0.0862 11 0.0000 0.0122 0.0228 0.0321 0.0403 0.0476 0.0540 0.0598 0.0650 0.0697 12 0.0000 0.0107 0.0200 0.0284 0.0358 0.0424 0.0483 0.0237 13 0.0000 0.0094 0.0178 0.0253 0.0320 0.0381 14 0.0000 0.0084 0.0159 0.0227 15 0.0000 0.0076
170
Ciąg dalszy tabeli
31 32 33 34 35 36 37 38 39 40 1 0.4220 0.4188 0.4156 0.4127 0.4096 0.4068 0.4040 0.4015 0.3989 0.3964 2 0.2921 0.2898 0.2876 0.2854 0.2834 0.2813 0.2794 0.2774 0.2755 0.2737 3 0.2475 0.2463 0.2451 0.2439 0.2427 0.2415 0.2403 0.2391 0.2380 0.2368 4 0.2145 0.2141 0.2137 0.2132 0.2127 0.2121 0.2116 0.2110 0.2104 0.2098 5 0.1874 0.1878 0.1880 0.1882 0.1883 0.1883 0.1883 0.1881 0.1880 0.1878 6 0.1641 0.1651 0.1660 0.1667 0.1673 0.1678 0.1683 0.1688 0.1689 0.1691 7 0.1433 0.1449 0.1463 0.1475 0.1487 0.1496 0.1505 0.1513 0.1520 0.1526 8 0.1243 0.1265 0.1284 0.1301 0.1317 0.1331 0.1344 0.1356 0.1366 0.1376 9 0.1066 0.1093 0.1118 0.1140 0.1160 0.1179 0.1196 0.1211 0.1225 0.1237 10 0.899 0.0931 0.0961 0.0988 0.1013 0.1036 0.1055 0.1075 0.1092 0.1108 11 0.0739 0.0777 0.0812 0.0844 0.0873 0.0900 0.0924 0.0947 0.0967 0.0986 12 0.0585 0.0629 0.0669 0.0706 0.0739 0.0770 0.0798 0.0824 0.0848 0.0870 13 0.0453 0.0485 0.0530 0.0572 0.0610 0.0645 0.0677 0.0706 0.0733 0.0759 14 0.0289 0.0344 0.0395 0.0441 0.0484 0.0523 0.0559 0.0592 0.0622 0.0651 15 0.0144 0.0206 0.0262 0.0314 0.0361 0.0404 0.0444 0.0481 0.0515 0.0546 16 0.0000 0.0068 0.0131 0.0187 0.0239 0.0287 0.0331 0.0372 0.0409 0.0444 17 0.0000 0.0062 0.0119 0.0172 0.0220 0.0264 0.0305 0.0343 18 0.0000 0.0057 0.0110 0.0158 0.0203 0.0244 19 0.0000 0.0053 0.0101 0.0146 20 0.0000 0.0049
Ciąg dalszy tabeli
41 42 43 44 45 46 47 48 49 50 1 0.3940 0.3917 0.3894 0.3872 0.3850 0.3830 0.3008 0.3789 0.3770 0.3751 2 0.2719 0.2701 0.2684 0.2667 0.2651 0.2635 0.2620 0.2604 0.2589 0.2574 3 0.2357 0.2345 0.2334 0.2323 0.2313 0.2302 0.2291 0.2281 0.2271 0.2260 4 0.2091 0.2085 0.2078 0.2072 0.2065 0.2058 0.2052 0.2045 0.2038 0.2032 5 0.1876 0.1874 0.1871 0.1868 0.1865 0.1862 0.1859 0.1855 0.1851 0.1847 6 0.1693 0.1694 0.1695 0.1695 0.1695 0.1695 0.1695 0.1693 0.1692 0.1691 7 0.1531 0.1535 0.1539 0.1542 0.1545 0.1548 0.1550 0.1551 0.1553 0.1554 8 0.1384 0.1392 0.1398 0.1405 0.1410 0.1415 0.1420 0.1423 0.1427 0.1430 9 0.1249 0.1259 0.1269 0.1278 0.1286 0.1293 0.1300 0.1306 0.1312 0.1317 10 0.1123 0.1136 0.1149 0.1160 0.1170 0.1180 0.1189 0.1197 0.1205 0.1212 11 0.1004 0.1020 0.1035 0.1049 0.1062 0.1073 0.1085 0.1095 0.1105 0.1113 12 0.0891 0.0909 0.0927 0.0943 0.0959 0.0972 0.0986 0.0998 0.1010 0.1020 13 0.0782 0.0804 0.0824 0.0842 0.0860 0.0876 0.0892 0.0906 0.0919 0.0932 14 0.0677 0.0701 0.0724 0.0745 0.0765 0.0783 0.0801 0.0817 0.0832 0.0846 15 0.0575 0.0602 0.0628 0.0651 0.0673 0.0694 0.0713 0.0731 0.0748 0.0764 16 0.0476 0.0506 0.0534 0.0560 0.0584 0.0607 0.0628 0.0648 0.0667 0.0685 17 0.0379 0.0411 0.0442 0.0471 0.0497 0.0522 0.0546 0.0568 0.0588 0.0608 18 0.0283 0.0318 0.0352 0.0383 0.0412 0.0439 0.0465 0.0489 0.0511 0.0532 19 0.0188 0.0227 0.0263 0.0296 0.0328 0.0357 0.0385 0.0411 0.0436 0.0459 20 0.0094 0.0136 0.0175 0.0211 0.0245 0.0275 0.0307 0.0335 0.0361 0.0386 21 0.0000 0.0045 0.0087 0.0126 0.0163 0.0197 0.0229 0.0259 0.0288 0.0314 22 0.0000 0.0042 0.0081 0.0118 0.0153 0.0185 0.0215 0.0244 23 0.0000 0.0039 0.0076 0.0111 0.0143 0.0174 24 0.0000 0.0037 0.0071 0.0104 25 0.0000 0.0035
171
Aneks G
Wartości krytyczne dla testu Shapiro–Wilka
n 0.01α = 0.02α = 0.05α = 0.10α = 0.50α = 3 0.753 0.756 0.767 0.789 0.959 4 0.687 0.707 0.748 0.792 0.935 5 0.686 0.715 0.762 0.806 0.927 6 0.713 0.743 0.788 0.826 0.927 7 0.730 0.760 0.803 0.838 0.928 8 0.749 0.778 0.818 0.851 0.932 9 0.764 0.791 0.829 0.859 0.935 10 0.781 0.806 0.842 0.869 0.938 11 0.792 0.817 0.850 0.876 0.940 12 0.805 0.828 0.859 0.883 0.943 13 0.814 0.837 0.866 0.889 0.945 14 0.825 0.846 0.874 0.895 0.947 15 0.835 0.855 0.881 0.901 0.950 16 0.844 0.863 0.887 0.906 0.952 17 0.851 0.869 0.892 0.910 0.954 18 0.858 0.874 0.897 0.914 0.956 19 0.863 0.879 0.901 0.917 0.957 20 0.868 0.884 0.905 0.920 0.959 21 0.873 0.888 0.908 0.923 0.960 22 0.878 0.892 0.911 0.926 0.961 23 0.881 0.895 0.914 0.928 0.962 24 0.884 0.898 0.916 0.930 0.963 25 0.888 0.901 0.918 0.931 0.964 26 0.891 0.904 0.920 0.933 0.965 27 0.894 0.906 0.923 0.935 0.965 28 0.896 0.908 0.924 0.936 0.966 29 0.898 0.910 0.926 0.937 0.966 30 0.900 0.912 0.927 0.939 0.967 31 0.902 0.914 0.929 0.940 0.967 32 0.904 0.915 0.930 0.941 0.968 33 0.906 0.917 0.931 0.942 0.968 34 0.908 0.919 0.933 0.943 0.969 35 0.910 0.920 0.934 0.944 0.969 36 0.912 0.922 0,935 0.945 0.970 37 0.914 0.924 0.936 0.946 0.970 38 0.916 0.925 0.938 0.947 0.971 39 0.917 0.927 0.939 0.948 0.971 40 0.919 0.928 0.940 0.949 0.972 41 0.920 0.929 0.941 0.950 0.972 42 0.922 0.930 0.942 0.951 0.972 43 0.923 0.932 0.943 0.951 0.973 44 0.924 0.933 0.44 0.952 0.973 45 0.926 0.934 0.945 0.953 0.973 46 0.927 0.935 0.945 0.953 0.974 47 0.928 0.936 0.946 0.954 0.974 48 0.929 0.937 0.947 0.954 0.974 49 0.929 0.937 0.947 0.955 0.974 50 0.930 0.938 0.947 0.955 0.974
172
Aneks H
Wartości krytyczne dla testu 2χ
spełniające warunek ( )2 2,P α νχ χ α> =
α /ν 0.10α =
0.05α =
0.01α =
1 2.706 3.841 6.635 2 4.605 5.991 9,210 3 6.251 7.815 11.345 4 7.779 9.488 13.277 5 9.236 11.070 15.086 6 10.645 12.592 16.812 7 12.017 14.067 18.475 8 13.362 15.507 20.090 9 14.684 16.919 21.666 10 15.987 18.307 23.209 11 17.275 19.675 24.725 12 18.549 21.026 26.217 13 19.812 22.362 27.688 14 21.064 23.685 29.141 15 22.307 24.996 30.578 16 23.542 26.296 32.000 17 24.769 27.587 33.409 18 25.989 28.869 34.805 19 27.204 30.144 36.191 20 28.412 31.410 37.566
173
Bibliografia
[1] Aczel A. D., Statystyka w Zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa 2000.
[2] Amemiya T., Nonlinear Regression Models. W: Handbook of Econometrics, red. Z. Grili-
ches, M.D. Intriligator, North Holland, Amsterdam 1983.
[3] Bard Y., Nonlinear Parameter Estimation, Academic Press, New York 1974.
[4] Borkowski B., Dudek H., Szczesny W., Ekonometria. Wybrane zagadnienia, Wydaw-
nictwo Naukowe PWN, Warszawa 2003.
[5] Box G. E. P., Jenkins G. M., Analiza szeregów czasowych prognozowanie i sterowanie,
PWN, Warszawa 1983.
[6] Brown R.G., Statistical Forecasting for Inventory Control, McGrow Hill, New York
1959.
[7] Chatfield C. The analysis of time series.. an introduction, CHAPMAN & HALL/CRC,
London, 2000.
[8] Chow G.C., Ekonometria / Przekład – W. Jurek, Wydawnictwo Naukowe PWN,
Warszawa 1995.
[9] Cieślak M., Prognozowanie gospodarcze. Metody i zastosowania, Wydawnictwo Nauko-
we PWN, Warszawa 2004.
[10] Czerwiński Z., Matematyka na usługach ekonomii, Wyd. 7, PWN, Warszawa 1984.
[11] Draper N. R., Smith H., Applied Regression Analysis, John Wiley&Sons, New York
1998.
[12] Dziechciarz J. (red.), Ekonometria: metody, przykłady, zadania, Wydawnictwo Akademii
Ekonomicznej im. Oskara Langego, Wrocław 2003.
[13] Enders W., Applied Econometric Time Series, Wiley 2010.
[14] Falk M., A First Course on Time Series Analysis Examples with SAS, udostępnione na
stronie http://opus.bibliothek.uni-wuerzburg.de/volltexte/2005/1259/
[15] Goldberger A.S., Teoria ekonometrii, PWE, Warszawa 1975.
[16] Golgfeld S.M., Quandt R.E., Nonlinear Methods in Econometrics, North Holland,
Amsterdam 1972.
[17] Goryl A., Jędrzejczyk Z., Kukuła K., Osiewalski J., Walkosz A., Wprowadzenie do eko-
nometrii, Wydawnictwo Naukowe PWN, Warszawa 2009.
[18] Górecki B. R., Ekonometria podstawy teorii i praktyki, KeyText, Warszawa 2010.
[19] Green W. H., Econometric Analysis, Prentice Hall, Inc., New Jersey 2000.
174
[20] Gruszczyński M., Podgórska M., Ekonometria, Szkoła Główna Handlowa, Warszawa
2000.
[21] Guzik B., Jurek W., Sikora W., Appenzeller D., Ekonometria I badania operacyjne.
Zagadnienia podstawowe, Wydawnictwo AE w Poznaniu, Poznań 2000.
[22] Hellwig Z., Schemat budowy prognozy statystycznej metodą wag harmonicznych,
Przegląd Statystyczny, z. 2, 1967.
[23] Holt C.C., Forecasting seasonals and trends by exponentially weighted moving averages,
International Journal of Forecasting, volume 20, 2004.
[24] http://www.nobelprize.org/nobel_prizes/economic-sciences/laureates/1980/
[25] Intriligator M.D., Econometric Models, Techniques and Applications, North-Holland
Publishing Company, Amsterdam-Oxford 1978.
[26] Jajuga K.(red) Ekonometria. Metody i analiza problemów ekonomicznych, Wydawnictwo
Akademii Ekonomicznej we Wrocławiu, Wrocław 1999.
[27] Judge G.G., Griffiths W.E., Hill R.C., Lutkepohl H., Lee T.-C., The Theory and Practice
of Econometrics, John Wiley, New York 1985.
[28] Kukuła K. (red.), Wprowadzenie do ekonometrii w przykładach i zadaniach, wyd. 2,
Wydawnictwo Naukowe PWN, Warszawa 2003.
[29] Lange O., Wstęp do ekonometrii, PWE, Warszawa 1976.
[30] Łuniewska M., Ekonometria finansowa. Analiza rynku kapitałowego, Wydawnictwo
Naukowe PWN, Warszawa 2008.
[31] Maddala G.S., Ekonometria, Wydawnictwo Naukowe PWN, Warszawa 2006.
[32] Marcinkowska-Lewandowska W., Plebaniak J., Podgórska M., Ekonometria w zada-
niach i ćwiczeniach, Szkoła Główna Handlowa w Warszawie, Warszawa 2005.
[33] Osińska M., Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa
2006.
[34] Pawełek B., Wanat S., Zeliaś A., Prognozowanie ekonomiczne. Teoria, przykłady,
zadania, Wydawnictwo Naukowe PWN, Warszawa 2004.
[35] Pawłowski Z., Ekonometria, Wyd. 5, PWN, Warszawa 1980.
[36] Ramanathan R. Introductory Econometrics with Applications, HBC Publishers, Fort
Worth 1998.
[37] Seber G.A.F., Wild C.J., Nonlinear Regression, John Wiley, New York 1989.
[38] Snarska A., Statystyka, Ekonometria, Prognozowanie. Ćwiczenia z Excelem, Placet,
2005.
175
[39] Szafrański G., Materiały do ekonometrii dynamicznej i finansowej udostępniane na
stronie http://gszafranski.w.interia.pl
[40] Sobczyk, M., Prognozowanie. Teoria, Przykłady, Zadania, Wydawnictwo Placet 2008.
[41] Welfe A., Ekonometria, PWE, Warszawa 1997.
[42] Welfe A., Ekonometria. Metody i ich zastosowanie, Polskie Wydawnictwo Ekono-
miczne, Warszawa 2009.
[43] Welfe W., Welfe A., Ekonometria stosowana, Polskie Wydawnictwo Ekonomiczne,
Warszawa 2004.
[44] Winters P. R., Forecasting Trends and Seasonal by Exponentially Weighted Averages,
Management Science, Vol. 6, No. 3, 1960.
176
1. Spis rysunków
Rys. 1.1. Klasyfikacja modeli ekonometrycznych ................................................................... 13 Rys. 1.2 Etapy budowania modelu ekonometrycznego ........................................................... 18 Rys. 1.3. Graf powiązań między zmiennymi objaśniającymi .................................................. 29 Rys. 1.4. Zależność kosztów całkowitych od wielkości produkcji ......................................... 36
Rys. 1.5. Rozrzut reszt ............................................................................................................. 54
Rys. 1.6. Wykres funkcji wykładniczej 0 1XY α α= ⋅ ................................................................ 60
Rys. 1.7. Wykres funkcji wykładniczej 0 1XY eα α+= ................................................................. 60 Rys. 1.8. Wykres funkcji wykładniczej 1
0XY eαα= ⋅ ............................................................... 61
Rys. 1.9. Wykres funkcji potęgowych ..................................................................................... 62
Rys. 1.10. Wykres funkcji logarytmicznej 0 1 logY Xα α= + ................................................. 63
Rys. 1.11. Wykres wielomianu stopnia 3 przy podanych warunkach dla parametrów ............ 64 Rys. 1.12. Wykres funkcji hiperbolicznej ................................................................................ 65 Rys. 1.13. Funkcja wykładnicza z odwrotnością ..................................................................... 66 Rys. 1.14. Funkcja logistyczna ................................................................................................. 66 Rys. 1.15. Pierwsza funkcja Tornquista ................................................................................... 67 Rys. 1.16. Druga funkcja Tornquista ....................................................................................... 68 Rys. 1.17. Trzecia funkcja Tornquista ..................................................................................... 68 Rys. 1.18. Zależność jednostkowego kosztu produkcji (ty ) od wielkości produkcji ( tx ) ...... 70
Rys. 1.19. Sprzedaż lodów w latach 2003-2009 (ton) ............................................................. 76 Rys. 2.1. Funkcje prognoz ........................................................................................................ 83
Rys. 2.2. Etapy prognozowania ................................................................................................ 85 Rys. 2.3. Zasady/reguły prognozy ............................................................................................ 88 Rys. 2.4 Metody prognostyczne ............................................................................................... 89 Rys. 2.5. Klasyczne modele trendu .......................................................................................... 96 Rys. 2.6. Wykres funkcji regresji liniowej wraz z danymi rzeczywistymi .............................. 99
Rys. 2.7. Dopasowanie poszczególnych składowych ai do danych. ...................................... 103 Rys. 2.8. Dopasowanie poszczególnych składowych bi do danych. ...................................... 103 Rys. 2.9. Harmoniki: druga oraz czternasta ........................................................................... 105 Rys. 2.10. Dane wyjściowe oraz wartości teoretyczne/prognozowane. ................................. 106 Rys. 2.11. Modele adaptacyjne .............................................................................................. 108 Rys. 2.12. Model średniej ruchomej ...................................................................................... 113
Rys. 2.13 Scentrowana średnia ruchoma. .............................................................................. 115 Rys. 2.14. Wygładzanie wykładnicze Browna ....................................................................... 119
Rys. 2.15. Wygładzanie wykładnicze Holta .......................................................................... 121 Rys. 2.16. Wygładzanie wykładnicze Wintersa ..................................................................... 124 Rys. 2.17. Trend pełzający z wagami harmonicznymi .......................................................... 129 Rys. 3.1. Proces stochastyczny a) dyskretny, b) ciągły .......................................................... 131 Rys. 3.2. Zastosowanie filtru liniowego ................................................................................. 134 Rys. 3.3. Przykład procesu białego szumu ............................................................................. 137 Rys. 3.4. Wykres funkcji autokorelacji .................................................................................. 137 Rys. 3.5 Funkcja korelogram w Gretlu .................................................................................. 138 Rys. 3.6. Wykres i test funkcji ACF i PACF ......................................................................... 138 Rys. 3.7. Przykład błądzenia losowego .................................................................................. 139
Rys. 3.8. Proces Ma(1) ........................................................................................................... 141 Rys. 3.9 Funkcje ACF i PACF procesu AR(1) ...................................................................... 141
177
Rys. 3.10. Wykres szeregu AR(1) .......................................................................................... 143 Rys. 3.11. Wykres funkcji ACF i PACF ................................................................................ 143 Rys. 3.12. Wartości testu Ljunga-Boxa .................................................................................. 144 Rys. 3.13. Ekran dostępu do modelu MNK ........................................................................... 144 Rys. 3.14. Wybór zmiennych modelu MNK .......................................................................... 145 Rys. 3.15. Ocena parametrów modelu ................................................................................... 145 Rys. 3.16. Wykres obserwacji ................................................................................................ 150 Rys. 3.17. Wykresy ACF i PACF .......................................................................................... 151 Rys. 3.18. Specyfikacja modelu ARIMA(1,1,2) .................................................................... 151 Rys. 3.19. Specyfikacja modelu ARIMA(1,1,1) .................................................................... 152 Rys. 3.20. Porównanie szeregów ........................................................................................... 152 Rys. 3.21. Modyfikacja szeregu ............................................................................................. 157 Rys. 3.22. Wykresy ACF i PACF dla szeregu log ceny miedzi ............................................. 157 Rys. 3.23. Wybór postaci modelu ARIMA ............................................................................ 158 Rys. 3.24 Ocena parametrów modelu .................................................................................... 158 Rys. 3.25. Wykres normalności ............................................................................................. 159
Rys. 3.26. ACF i PACF reszt modelu .................................................................................... 159
178
2. Spis Tabel
Tabela 1.1. Miesięczne wydatki na żywność ........................................................................... 11 Tabela 1.2. Wydatki na żywność 10 gospodarstw domowych w marcu 2012 r. ..................... 11 Tabela 1.3. Wydatki na żywność 10 gospodarstw domowych w kolejnych miesiącach 2012 r. ............................................................................................... 12 Tabela 2.1. Dane dotyczące płacy minimalnej ......................................................................... 98 Tabela 2.2. Prognozowanie za pomocą regresji liniowej ......................................................... 98 Tabela 2.3. Prognozowanie metodą harmoniki ...................................................................... 102 Tabela 2.4. Wyliczenie udziału w zmienności Y ................................................................... 104 Tabela 2.5. Wartości prognozowane modelem analizy harmonicznej ................................... 105
Tabela 2.6. Prognozowanie kursu akcji BUDIMEX za pomocą średniej ruchomej .............. 112 Tabela 2.7. Dane eksportu towarów w milionach PLN ......................................................... 114 Tabela 2.8. Prognozowanie kursu akcji BUDIMEX za pomocą wygładzania wykładniczego .................................................................................................. 118 Tabela 2.9. Prognozowanie eksportu towarów za pomocą wygładzania wykładniczego Holta ......................................................................................... 120 Tabela 2.10. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą wygładzania wykładniczego Wintersa ................................................................. 123 Tabela 2.11. Prognozowanie średniego miesięcznego wynagrodzenia brutto za pomocą trendu pełzającego ................................................................................................ 127 Tabela 2.12. Estymatory parametrów .................................................................................... 128 Tabela 2.13. Prognozowanie metodą wag harmonicznych .................................................... 128 Tabela 3.1. Początkowe wartości szeregu .............................................................................. 143 Tabela 3.2. Początkowe wartości cen miedzi ......................................................................... 150 Tabela 3.3. Klasyfikacja podstawowych modeli procesów stochastycznych ........................ 154
Top Related