3과목 · 데이터 분석·14장
시계열 분석
시계열 정의와 구성 요소, 정상성, 자기상관, ARIMA 모델과 지수평활법, 시계열 예측 평가를 정리합니다.
1. 시계열이란
시계열(Time Series) 은 시간 순서대로 측정된 데이터.
- 예: 월별 매출, 일별 주가, 초 단위 센서 값
- 순서가 의미를 가짐 — 무작위 순서로 바꾸면 안 됨
2. 시계열의 4요소
2-1. 추세(Trend)
- 장기적 상승·하락 경향
2-2. 계절성(Seasonality)
- 규칙적 주기적 패턴 (월·요일·시간)
2-3. 순환(Cycle)
- 불규칙하지만 반복되는 변동(경기 사이클)
2-4. 불규칙 변동(Irregular/Noise)
- 랜덤한 변동
분해
Y_t = Trend_t + Seasonality_t + Cycle_t + Noise_t (가법)
Y_t = Trend_t × Seasonality_t × Cycle_t × Noise_t (승법)
3. 정상성(Stationarity)
평균·분산·자기공분산이 시간에 따라 변하지 않음.
ARIMA 같은 전통 시계열 모델은 정상성 가정.
3-1. 비정상성 원인
- 추세
- 계절성
- 분산 변동
3-2. 정상화 기법
- 차분(Differencing): $Y_t - Y_{t-1}$
- 로그 변환: 분산 안정
- 계절 차분: $Y_t - Y_{t-12}$
3-3. 정상성 검정
- ADF 검정(Augmented Dickey-Fuller): p < 0.05이면 정상
- KPSS 검정
4. 자기상관(Autocorrelation)
시계열 자신과 시차(lag)가 있는 자신과의 상관.
- ACF(Auto-Correlation Function): 시차별 상관계수
- PACF(Partial ACF): 중간 시차 제외한 상관
모델 차수(p, q) 결정에 사용.
5. ARIMA 모델
$$ARIMA(p, d, q)$$
- AR(p): 과거 p개의 값으로 현재 설명
- I(d): d번 차분
- MA(q): 과거 q개의 오차로 현재 설명
5-1. AR(1) 예
$$Y_t = \phi_1 Y_{t-1} + \varepsilon_t$$
5-2. MA(1) 예
$$Y_t = \mu + \varepsilon_t + \theta_1 \varepsilon_{t-1}$$
5-3. SARIMA
ARIMA에 계절 항을 추가: $SARIMA(p,d,q)(P,D,Q)_s$
6. 지수 평활법(Exponential Smoothing)
최근 관측치에 더 큰 가중치 부여.
6-1. 단순 지수평활
- 추세·계절 없을 때
6-2. Holt (이중)
- 추세 포함
6-3. Holt-Winters (삼중)
- 추세 + 계절
7. 기타 방법
| 방법 | 특징 |
|---|---|
| 분해법 | 추세·계절·잔차 분해 |
| Prophet | Facebook, 계절·휴일 자동 |
| RNN/LSTM | 긴 시퀀스 학습 |
| Transformer | 어텐션 기반 |
8. 예측 평가 지표
| 지표 | 특징 |
|---|---|
| MAE | 평균 절대 오차 |
| RMSE | 제곱 오차의 루트, 이상치 민감 |
| MAPE | 평균 절대 백분율 오차 |
| MASE | 단순 예측 대비 상대 지표 |
9. 예측 절차
1. 시계열 시각화
2. 정상성 검정 → 필요 시 차분
3. ACF/PACF로 모델 후보
4. ARIMA/지수평활 적합
5. 잔차 진단 (백색잡음인지)
6. 예측·신뢰구간 생성
7. 성능 평가
10. R 예시
library(forecast)
ts_data <- ts(sales, frequency = 12, start = c(2020, 1))
fit <- auto.arima(ts_data)
fcast <- forecast(fit, h = 12)
plot(fcast)
11. 실무 팁
- 외부 변수(event, 홍보) 반영 → ARIMAX, Prophet regressors
- 검증 방식: 시간 순서 기반 — 마지막 N 기간을 테스트로
- 데이터 누수 방지: 미래 정보가 학습에 섞이면 안 됨
12. 출제 포인트
- 시계열 4구성 요소
- 정상성 정의와 차분
- ARIMA(p, d, q) 각 항 의미
- SARIMA 계절 항
- 평가 지표(MAE/RMSE/MAPE)
요약 체크리스트
- 추세·계절·순환·잡음 구분
- 정상성 정의
- ARIMA 3요소 의미
- 지수 평활 3단계 비교