ARIMA

ARIMA - Auto Regressive Integrated Moving Avarage

Metodologia ARIMA rozwinięta przez Boxa i Johnsona w 1976r służy do generowania prognoz na podstawie szeregów czasowych, których struktura jest niewyraźna a wariancja składnika losowego znaczna.

Zalety: moc, elastyczność Wada: złożoność

ARIMA (p, d, q) jest modelem autoregresyjnym średniej ruchomej. Modele szeregów czasowych dzielimy na: -) Model autoregresji AR (p) -) Model średniej ruchomej MA (q) -) Model ARMA (p,q)

Model autoregresji AR Szacowanie modelu opisującego kolejne elementy szeregu na podstawie opóźnionych w czasie elementów tego szeregu:

math y_t = a_1 y_{t-1} + a_2 y_{t-2} + ... + a_p y_{t-p} + \epsilon_t math

-) Model rzędu p -) Założenie: epsilon_t - składniki losowe niezależne w czasie

math E \epsilon_t = 0 math math D^2 \epsilon_t = \sigma^2 math

Wartość zmiennej objaśnianej jest więc sumą składnika losowego oraz kombinacji liniowej kolejnych obserwacji UWAGA: Szereg musi spełniać wymóg stacjonarności

Model średniej ruchomej MA Elementy szeregu pozostają pod wpływem realizacji składnika losowego z okresów przeszłych

math y_t = \epsilon_t + b_1 \epsilon_{t-1} + b_q \epsilon_{t - q} math

-) Model rzędu p -) Założenie: epsilon_t - składniki losowe niezależne w czasie,

math E \epsilon_t = 0 math math D^2 \epsilon_t = \sigma^2 math

Każda obserwacja składa się ze składnika losowego oraz kombinacji liniowej składników losowych z przeszłości. UWAGA: Szereg musi spełniać wymóg stacjonarności

Model ARMA - autoregresji i średniej warunkowej rzędu (p, q)

math y_t = a_1 y_{t-1} + ... + a_p y_{t-p} + \epsilon_t + b_1 \epsilon_{t-1} + ... + b_q \epsilon_{t-q} math

y_t - 1 wymiarowy

math y_t = A_1 y_{t-1} + ... + A_p y_{t-p} + \epsilon_t + B_1 epsilon_{t-1} + ... + B_q \epsilon_{t-q} math

A, B - macierze

Identyfikacja Warunek stosowania metody ARIMA: stacjonarność szeregu wejściowego (stała w czasie średnia, wariancja oraz autokorelacja). W przypadku braku stacjonarności należy zróżnicować szereg (tzn.: policzyć opóźnienia i przyrosty) Istotą tej części procedury jest określenie ile elementów autoregresyjnych (p) i średniej ruchomej (q) powinien zawierać model a także jaki powinien być stopień zróżnicowania szeregu, na którym opieramy badanie. Podstawowym narzędziem wykorzystywanym w fazie identyfikacji są wykresy szeregów, korelogramy autokorelacji ACF oraz autokorelacji cząstkowej PACF Podstawowe modele: -) Jeden parametr autoregresyjny (p): ACF opada wykładniczo, PACF osiąga maksimum przy opóźnieniu 1, brak korelacji dla innych opóźnień -) Dwa parametry autoregresyjne (p): ACF ma kształt sisusoidalny lub kombinacja zaników wykładniczych; PACF przyjmuje duże wartości przy opóźnieniach 1 i 2, brak korelacji dla innych opóźnień -) Jeden parametr średniej ruchomej (q) : ACF osiąga maksimum przy opóźnieniu 1, brak korelacji dla innych opóźnień; PACF gaśnie wykładniczo -) Dwa parametry średniej ruchomej (q): ACF przyjmuje duże wartości przy opóźnieniach 1 i 2, brak korelacji dla innych opóźnień; PACF ma kształt sinusoidy lub jest kombinacją zaników wykładniczych -) Jeden parametr autoregresyjny (p) i jeden średniej ruchomej (q): ACF opada opada wykładniczo począwszy od opóźnienia 1; PACF opada wykładniczo począwszy od opóźnienia 1

Estymacja i prognozowanie Estymowanie parametrów tak by zminimalizować sumę kwadratów reszt. Estymuje się na podstawie danych przekształconych (zróżnicowanych)

Stała w ARIMA Interpretacja -) Jeśli w modelu nie ma elementów autoregresyjnych to wartość oczekiwana stałej jest równa średniej szeregu m -) Jeśli w szeregu występują elementy autoregresyjne to stała reprezentuje wyraz wolny