ARIMA - Auto Regressive Integrated Moving Avarage

Metodologia ARIMA rozwinięta przez Boxa i Johnsona w 1976r służy do generowania prognoz na podstawie szeregów czasowych, których struktura jest niewyraźna a wariancja składnika losowego znaczna.

Zalety: moc, elastyczność
Wada: złożoność

ARIMA (p, d, q) jest modelem autoregresyjnym średniej ruchomej.
Modele szeregów czasowych dzielimy na:
-) Model autoregresji AR (p)
-) Model średniej ruchomej MA (q)
-) Model ARMA (p,q)

Model autoregresji AR
Szacowanie modelu opisującego kolejne elementy szeregu na podstawie opóźnionych w czasie elementów tego szeregu:



-) Model rzędu p
-) Założenie: epsilon_t - składniki losowe niezależne w czasie




Wartość zmiennej objaśnianej jest więc sumą składnika losowego oraz kombinacji liniowej kolejnych obserwacji
UWAGA: Szereg musi spełniać wymóg stacjonarności

Model średniej ruchomej MA
Elementy szeregu pozostają pod wpływem realizacji składnika losowego z okresów przeszłych



-) Model rzędu p
-) Założenie: epsilon_t - składniki losowe niezależne w czasie,




Każda obserwacja składa się ze składnika losowego oraz kombinacji liniowej składników losowych z przeszłości.
UWAGA: Szereg musi spełniać wymóg stacjonarności

Model ARMA - autoregresji i średniej warunkowej rzędu (p, q)



y_t - 1 wymiarowy




A, B - macierze

Identyfikacja
Warunek stosowania metody ARIMA: stacjonarność szeregu wejściowego (stała w czasie średnia, wariancja oraz autokorelacja). W przypadku braku stacjonarności należy zróżnicować szereg (tzn.: policzyć opóźnienia i przyrosty)
Istotą tej części procedury jest określenie ile elementów autoregresyjnych (p) i średniej ruchomej (q) powinien zawierać model a także jaki powinien być stopień zróżnicowania szeregu, na którym opieramy badanie.
Podstawowym narzędziem wykorzystywanym w fazie identyfikacji są wykresy szeregów, korelogramy autokorelacji ACF oraz autokorelacji cząstkowej PACF
Podstawowe modele:
-) Jeden parametr autoregresyjny (p): ACF opada wykładniczo, PACF osiąga maksimum przy opóźnieniu 1, brak korelacji dla innych opóźnień
-) Dwa parametry autoregresyjne (p): ACF ma kształt sisusoidalny lub kombinacja zaników wykładniczych; PACF przyjmuje duże wartości przy opóźnieniach 1 i 2, brak korelacji dla innych opóźnień
-) Jeden parametr średniej ruchomej (q) : ACF osiąga maksimum przy opóźnieniu 1, brak korelacji dla innych opóźnień; PACF gaśnie wykładniczo
-) Dwa parametry średniej ruchomej (q): ACF przyjmuje duże wartości przy opóźnieniach 1 i 2, brak korelacji dla innych opóźnień; PACF ma kształt sinusoidy lub jest kombinacją zaników wykładniczych
-) Jeden parametr autoregresyjny (p) i jeden średniej ruchomej (q): ACF opada opada wykładniczo począwszy od opóźnienia 1; PACF opada wykładniczo począwszy od opóźnienia 1

Estymacja i prognozowanie
Estymowanie parametrów tak by zminimalizować sumę kwadratów reszt. Estymuje się na podstawie danych przekształconych (zróżnicowanych)

Stała w ARIMA
Interpretacja
-) Jeśli w modelu nie ma elementów autoregresyjnych to wartość oczekiwana stałej jest równa średniej szeregu m
-) Jeśli w szeregu występują elementy autoregresyjne to stała reprezentuje wyraz wolny