Micha‚ Kowalczykiewicz

download Micha‚ Kowalczykiewicz

of 25

  • date post

    07-Jan-2016
  • Category

    Documents

  • view

    48
  • download

    0

Embed Size (px)

description

Michał Kowalczykiewicz. Time series forecasting using a hybrid ARIMA and neural network model (na podstawie pracy z Neurocomputing 50 (2003) 159 – 175, autorstwa G. Peter Zhang). Szereg czasowy. - PowerPoint PPT Presentation

Transcript of Micha‚ Kowalczykiewicz

  • Micha KowalczykiewiczTime series forecasting using a hybrid ARIMA and neural network model

    (na podstawie pracy z Neurocomputing 50 (2003) 159 175, autorstwa G. Peter Zhang)

  • Szereg czasowySzereg czasowy to proces stochastyczny, ktrego dziedzin jest czas; to zbir informacji uporzdkowanych w czasie, ktrych pomiary wykonywane s z pewnym krokiem czasowym

    Analiza szeregw czasowych ma dwa gwne cele: wykrywanie natury zjawiska reprezentowanego przez sekwencj obserwacji prognozowanie (przewidywanie przyszych wartoci szeregu czasowego)

  • Analiza szeregwModele pure autoregressive (AR) pure moving avarage (MA) autoregressive integrated moving average (ARIMA) bilinear model threshold autoregressive (TAR) autoregressive conditional heteroscedastic (ARCH) artificial neural network (ANN)

  • Analiza szeregwModele pure autoregressive (AR) pure moving avarage (MA) autoregressive integrated moving average (ARIMA) bilinear model threshold autoregressive (TAR) autoregressive conditional heteroscedastic (ARCH) artificial neural network (ANN)

  • ARIMAJest metod statystyczn suc do analizowania szeregw czasowych, o liniowych zalenociach midzy danymi.

    Autorzy Box i Jenkins, 1976

  • ARIMA

    Model:yt = 0 + 1yt-1 + 2yt-2 . . . + pyt-p + t - 1t-1 - 2t-2 - . . . - qt-q

    yt - warto w czasie tt - losowy bd w czasie ti (i = 1, 2, . . ., p), i (j = 0, 1, . . ., q) - parametry modelup, q - porzdek modelu

    t - niezalene, ze redni zero i sta wariancj 2

  • ARIMABudowanie modelu za pomoc metody Boy - Jenkinsa (1976)

    AlgorytmFAZA 1 : identyfikacja modeluFAZA 2 : estymacja parametrwFAZA 3 : walidacja

  • ARIMA - identyfikacja modelu W tej fazie naley ustali (zidentyfikowa) liczb i typ parametrw modelu ARIMA, czyli okreli wartoci parametrw p i q.

  • ARIMA - identyfikacja modelu W tej fazie naley ustali (zidentyfikowa) liczb i typ parametrw modelu ARIMA, czyli okreli wartoci parametrw p i q.

    Korzysta si z:autokorelogramu (ACF)autokorelogramu czstkowego (PACF)

  • ARIMA - uwagiWymaga si, by wejciowy szereg dla tej fazy by stacjonarny, to znaczy, powinien on mie sta w czasie redni, wariancj i autokorelacj. Dlatego zazwyczaj szereg wymaga rnicowania a do osignicia stacjonarnoci

    rnicowanie: yt = yt - yt-1

  • ARIMA - estymacja parametrwPolega na wyznaczeniu wartoci parametrw i (i = 1, 2, . . ., p), i (j = 0, 1, . . ., q) dla ktrych otrzymujemy maksymaln wiarygodno (prawdopodobiestwo) otrzymania wanie obserwowanego szeregu. Aby mierzony bd by minimalny

  • ARIMA - estymacja parametrwPolega na wyznaczeniu wartoci parametrw i (i = 1, 2, . . ., p), i (j = 0, 1, . . ., q) dla ktrych otrzymujemy maksymaln wiarygodno (prawdopodobiestwo) otrzymania wanie obserwowanego szeregu. Aby mierzony bd by minimalny

    W praktyce wymaga to obliczenia (warunkowych) sum kwadratw reszt przy zadanych parametrach

  • ARIMA - walidacja W ostatniej fazie oceniamy trafno naszego modelu. Jeli model zawiera wiele parametrw i\lub wyniki nas nie zadowalaj

  • ARIMA - walidacja W ostatniej fazie oceniamy trafno naszego modelu. Jeli model zawiera wiele parametrw i\lub wyniki nas nie zadowalaj

    moemy prbowa powtrnie z innymi wartociami pocztkowymi parametrw (czyli wracamy do FAZA 1).

  • ANNJest oglnym modelem potraficym wykrywa nieliniowe zalenociach midzy danymi, w szeregw czasowych

  • ANNNajczciej uywan sieci w tym zagadnieniu jest a sie GLM

    zaleno midzy wyjciem yt , a wejciam (yt-1, yt-2, . . ., yt-p), jest nastpujca:

    yt = 0 + j

  • ANNJako funkcj aktywacji rodkowej warstwy przyjmuj si funkcje logistic:

    g(x) = 1 / (1 + exp(-x))

    liczba wej sieci (p) i liczba neuronw wewntrznych (q) s dobierane eksperymentalnie.

  • HybridDla danych o ktrych nie wiemy, czy s zwizki w nich wystpujce s liniowe czy, te nie adna z wymienionych metoda nie jest odpowiednia.

    Metoda ARIMA nie wykrywa nieliniowoci w danychSieci neuronowe daj rednie wyniki dla danych w ktrych wystpuj zarwno liniowe jak i nieliniowe zwizki

  • HybridDla danych o ktrych nie wiemy, czy s zwizki w nich wystpujce s liniowe czy, te nie adna z wymienionych metoda nie jest odpowiednia.

    Metoda ARIMA nie wykrywa nieliniowoci w danychSieci neuronowe daj rednie wyniki dla danych w ktrych wystpuj zarwno liniowe jak i nieliniowe zwizki

    Potrzebujemy uniwersalnego modelu, odpowiedniego dla wszystkich rodzajw danych

  • HybridModel: yt = Lt + Nt

    Lt - liniowy komponentNt - nieliniowy komponent

    Te dwa parametry musz zosta wyznaczone z danych

  • Hybrid - Liniowy komponentLiniowy komponentWpierw metod ARIMA modelujemy liniowy komponent ().Jeli tylko ~L (czyli zawiera wszystkie liniowe relacje w danych) to residua powstae z liniowego modelu bd zawieray tylko nieliniowe zwizki.

  • Hybrid - Nieliniowy komponentNieliniowy komponentNiech et bdzie reszt z dopasowanego liniowego modelu w czasie t.Wtedy: et = yt - t

    Te wartoci moemy zamodelowa za pomoc sieci neuronowej: et = f(et-1, et-2, . . ., et-n) + t

    t - losowy bd w czasie t

  • HybridOstatecznie

    yt ~ t + Nt

    gdzie Nt przewidywana warto w czasie t wyznaczona przez ANN

  • Hybrid - przykadyTestowane szeregi czasowe: LynxSunspotExchange rate

  • Dzikuj za uwag