← 일백제ADsP 개념서
← 개념서태블릿/PC 버전
3과목 · 데이터 분석·14

시계열 분석

시계열 정의와 구성 요소, 정상성, 자기상관, ARIMA 모델과 지수평활법, 시계열 예측 평가를 정리합니다.

1. 시계열이란

시계열(Time Series) 은 시간 순서대로 측정된 데이터.

  • 예: 월별 매출, 일별 주가, 초 단위 센서 값
  • 순서가 의미를 가짐 — 무작위 순서로 바꾸면 안 됨

2. 시계열의 4요소

2-1. 추세(Trend)

  • 장기적 상승·하락 경향

2-2. 계절성(Seasonality)

  • 규칙적 주기적 패턴 (월·요일·시간)

2-3. 순환(Cycle)

  • 불규칙하지만 반복되는 변동(경기 사이클)

2-4. 불규칙 변동(Irregular/Noise)

  • 랜덤한 변동

분해

Y_t = Trend_t + Seasonality_t + Cycle_t + Noise_t  (가법)
Y_t = Trend_t × Seasonality_t × Cycle_t × Noise_t  (승법)

3. 정상성(Stationarity)

평균·분산·자기공분산이 시간에 따라 변하지 않음.

ARIMA 같은 전통 시계열 모델은 정상성 가정.

3-1. 비정상성 원인

  • 추세
  • 계절성
  • 분산 변동

3-2. 정상화 기법

  • 차분(Differencing): $Y_t - Y_{t-1}$
  • 로그 변환: 분산 안정
  • 계절 차분: $Y_t - Y_{t-12}$

3-3. 정상성 검정

  • ADF 검정(Augmented Dickey-Fuller): p < 0.05이면 정상
  • KPSS 검정

4. 자기상관(Autocorrelation)

시계열 자신과 시차(lag)가 있는 자신과의 상관.

  • ACF(Auto-Correlation Function): 시차별 상관계수
  • PACF(Partial ACF): 중간 시차 제외한 상관

모델 차수(p, q) 결정에 사용.

5. ARIMA 모델

$$ARIMA(p, d, q)$$

  • AR(p): 과거 p개의 값으로 현재 설명
  • I(d): d번 차분
  • MA(q): 과거 q개의 오차로 현재 설명

5-1. AR(1) 예

$$Y_t = \phi_1 Y_{t-1} + \varepsilon_t$$

5-2. MA(1) 예

$$Y_t = \mu + \varepsilon_t + \theta_1 \varepsilon_{t-1}$$

5-3. SARIMA

ARIMA에 계절 항을 추가: $SARIMA(p,d,q)(P,D,Q)_s$

6. 지수 평활법(Exponential Smoothing)

최근 관측치에 더 큰 가중치 부여.

6-1. 단순 지수평활

  • 추세·계절 없을 때

6-2. Holt (이중)

  • 추세 포함

6-3. Holt-Winters (삼중)

  • 추세 + 계절

7. 기타 방법

방법 특징
분해법 추세·계절·잔차 분해
Prophet Facebook, 계절·휴일 자동
RNN/LSTM 긴 시퀀스 학습
Transformer 어텐션 기반

8. 예측 평가 지표

지표 특징
MAE 평균 절대 오차
RMSE 제곱 오차의 루트, 이상치 민감
MAPE 평균 절대 백분율 오차
MASE 단순 예측 대비 상대 지표

9. 예측 절차

1. 시계열 시각화
2. 정상성 검정 → 필요 시 차분
3. ACF/PACF로 모델 후보
4. ARIMA/지수평활 적합
5. 잔차 진단 (백색잡음인지)
6. 예측·신뢰구간 생성
7. 성능 평가

10. R 예시

library(forecast)
ts_data <- ts(sales, frequency = 12, start = c(2020, 1))
fit <- auto.arima(ts_data)
fcast <- forecast(fit, h = 12)
plot(fcast)

11. 실무 팁

  • 외부 변수(event, 홍보) 반영 → ARIMAX, Prophet regressors
  • 검증 방식: 시간 순서 기반 — 마지막 N 기간을 테스트로
  • 데이터 누수 방지: 미래 정보가 학습에 섞이면 안 됨

12. 출제 포인트

  • 시계열 4구성 요소
  • 정상성 정의와 차분
  • ARIMA(p, d, q) 각 항 의미
  • SARIMA 계절 항
  • 평가 지표(MAE/RMSE/MAPE)

요약 체크리스트

  • 추세·계절·순환·잡음 구분
  • 정상성 정의
  • ARIMA 3요소 의미
  • 지수 평활 3단계 비교