# Grouped time series
: 범주형 속성을 기준으로 나뉜 시계열 데이터셋의 특성을 활용해서 예측할 수 있다.
-
Hierarchical time series (coherent prediction) : 상하 계층관계 존재
-
Grouped time series : 상하 계층관계가 여러개 존재 (=교차관계)
-
행렬표현 : y = SP*yh (S: summation, P : disaggregation Proportion, yh : base forecast)
1) bottom-up 접근법
-
계산법
밑바닥 수준에서 각 시계열에 대해 기준 예측값을 먼저 계산. 상위 구조의 모든 시계열에 대해 합산
-
장단점
구조의 밑바닥 수준에서 예측할 수 있다.
합산 때문에 정보 손실이 일어나지 않는다는 것입니다.
밑바닥 수준의 데이터에는 잡음이 꽤 많아, 예측력이 떨어질 수 있음
2) top-down 접근법
-
계산법
전체합산 값에 대해서 비율을 곱해서 밑바닥 수준의 시계열 값을 찾아낸다.
결국 핵심은 "비율"에 대한 정의다.
-
과거 평균값의 비율 : 최하계층 시계열의 합 / 최상계층 시계열의 합
-
과거 비율값의 평균 : (최하계층 시계열/ 최상계층 시계열)의 평균
-
예측 비율값 (과거비율값 대안책) : ( i층 현재값 / i+1층 합)x(i-1층 현재값 / i층 합)x ... x 1
-
-
단점 :
-
수준이 낮아질 수록 덜 정확한 예측값을 내는 경향이 있다
-
편향이 없는 일관된 예측값을 내지 않는다
-
3) Middle-out approach
4) Optimal reconciliation**
기존 예측값(base forecasts)에 대한 조정행렬(P)이 정확하면 "coherent predictin" 구할 수 있다.
= 예측오차를 최소화하는 행렬(P)을 찾자.
-
[조건]
-
기준 예측값이 불편향이어야 한다. (모든 Top-down 접근법은 해당안됨)
-
예측값에서 오차에 대한 정보 필요하다 ( h step coherent forecast error = 분산! )
-
-
장점 : 계층적 구조 또는 그룹화된 구조 안에 있는 모든 사용 가능한 정보를 가짐
https://pypi.org/project/scikit-hts/
# not supported in fbprophet , tslearn
# pip install scikit-hts
# 기타
- 잠재변수 ; SLS
'Statistics > Time Series Analysis' 카테고리의 다른 글
TSA - 메인 모델 정리 (0) | 2021.02.18 |
---|---|
TSA - 6. 벡터자기회귀 (0) | 2021.01.22 |
TSA - 5. 동적회귀 (0) | 2021.01.22 |
TSA - 4. 자기회귀 (0) | 2021.01.22 |
TSA - 3. 패턴분해 (0) | 2021.01.22 |