본문 바로가기
ML/Time-Series Analysis

[ML][Time - Series Analysis] ARIMA(Autoregressive Integrated Moving Average, 자기 회귀 누적 이동 평균) 모델

by 어떻게든 되겠지~ 2025. 5. 17.

ARIMA(Autoregressive Integrated Moving Average)모델이란?

AR과 MA를 모두 고려하는 모형인데, ARMA와 달리 과거 데이터의 선형 관계뿐만 아니라 추세(Cointegration)까지 고려한 모델

ARIMA 모델의 기본 이론

  • 자기 회귀(AR, Auto Regressive) : 과거의 값들이 미래 값에 어떤 영향을 미치는지 설명
    • p 차수
  • 통합,차분(I, Integrated) : 데이터의 비정상성(non-stationarity)을 제거하기 위해 데이터를 차분하여 안정화
    • d 차수 / 차분은 데이터의 연속된 관측값들의 차이를 취하는 과정
  • 이동평균(MA, Moving Average) : 과거 예측 오차가 현재의 예측에 미치는 영향을 설명   
    • q 차수    

수식

$$ Z_{t}^{'} = \Phi_{1} Z_{t-1}^{'} + \Phi_{2} Z_{t-2}^{'} + \cdots + \Phi_{p} Z_{t-p}^{'} + \theta_{1}\alpha_{t-1} + \theta_{2}\alpha_{t-2} + \cdots + \theta_{q}\alpha_{t-q} + a_{t}$$

 

ARIMA 모델의 특징

  • 비정상성 처리
    • ARIMA 모델은 데이터의 비정상성을 처리하기 위해 차분을 수행
    • 즉, 시계열 데이터의 평균과 분산이 시간에 따라 변하지 않도록 변환
  • 복합모델
    • ARIMA는 AR, I, MA의 세 가지 구성 요소를 결합하여 복잡한 시계열 패턴을 설명
    • 이는 비정상 데이터, 계절성, 주기성 등을 모델링하는 데 유용하다
  • 유연성
    • ARIMA는 다양한 시계열 데이터에 적용할 수 있으며, 데이터의 패턴에 따라 적절한 p, d, q 값을 선택할 수 있다 
    • 이는 경제 지표, 주식 가격, 기후 데이터 등 다양한 분야에서 사용됩니다.
  • 예측
    • ARIMA 모델은 미래의 값을 예측할 수 있으며, 모델의 적합성을 평가하여 예측의 정확성을 높일 수 있다

ARIMA 모델의 장점

  • 데이터 전처리
    • 데이터의 비정상성을 차분을 통해 처리할 수 있어, 더 안정적인 모델을 구축가능
  • 복잡한 패턴 학습
    •  ARIMA는 AR, I, MA의 조합을 통해 복잡한 패턴을 학습하고 예측할 수 있다
  • 통계적 검정
    •  모델의 적합성을 평가하고, 잔차 분석 등을 통해 모델의 품질을 검토 가능

ARIMA 모델의 한계

  • 비선형성 처리 어려움
    • ARIMA는 선형 모델로서 비선형 패턴이나 복잡한 시계열 구조를 처리하기 어렵다
    • 이러한 경우에는 SARIMA(계절성 ARIMA) 또는 다른 비선형 모델이 필요
  •  모델 복잡도
    • p, d, q의 적절한 값을 선택하는 것이 어려울 수 있으며, 모델의 성능을 최적화하기 위해서는 반복적인 실험과 검증이 필요
  •  계절성 처리
    • ARIMA 모델은 기본적으로 계절성을 고려하지 않으므로, 계절성 패턴이 있는 데이터에서는 SARIMA 모델을 사용해야 한다
  •  데이터 요구량
    • 충분한 데이터가 필요하며, 데이터가 부족할 경우 모델의 성능이 떨어질 수 있다