본문 바로가기
Statistics/Time Series Analysis

TSA - 7. 그룹회귀

by bents 2021. 1. 22.

# Grouped time series

: 범주형 속성을 기준으로 나뉜 시계열 데이터셋의 특성을 활용해서 예측할 수 있다.

  • Hierarchical time series (coherent prediction) : 상하 계층관계 존재

  • Grouped time series : 상하 계층관계가 여러개 존재 (=교차관계)

  • 행렬표현 : y = SP*yh (S: summation, P : disaggregation Proportion, yh : base forecast)

1) bottom-up 접근법

  • 계산법

    밑바닥 수준에서 각 시계열에 대해 기준 예측값을 먼저 계산. 상위 구조의 모든 시계열에 대해 합산

  • 장단점

    구조의 밑바닥 수준에서 예측할 수 있다.

    합산 때문에 정보 손실이 일어나지 않는다는 것입니다.

    밑바닥 수준의 데이터에는 잡음이 꽤 많아, 예측력이 떨어질 수 있음

2) top-down 접근법

  • 계산법

    전체합산 값에 대해서 비율을 곱해서 밑바닥 수준의 시계열 값을 찾아낸다.

    결국 핵심은 "비율"에 대한 정의다.

    • 과거 평균값의 비율 : 최하계층 시계열의 합 / 최상계층 시계열의 합

    • 과거 비율값의 평균 : (최하계층 시계열/ 최상계층 시계열)의 평균

    • 예측 비율값 (과거비율값 대안책) : ( i층 현재값 / i+1층 합)x(i-1층 현재값 / i층 합)x ... x 1

  • 단점 :

    • 수준이 낮아질 수록 덜 정확한 예측값을 내는 경향이 있다

    • 편향이 없는 일관된 예측값을 내지 않는다

3) Middle-out approach

 

4) Optimal reconciliation**

기존 예측값(base forecasts)에 대한 조정행렬(P)이 정확하면 "coherent predictin" 구할 수 있다.

= 예측오차를 최소화하는 행렬(P)을 찾자.

  • [조건]

    • 기준 예측값이 불편향이어야 한다. (모든 Top-down 접근법은 해당안됨)

    • 예측값에서 오차에 대한 정보 필요하다 ( h step coherent forecast error = 분산! )

  • 장점 : 계층적 구조 또는 그룹화된 구조 안에 있는 모든 사용 가능한 정보를 가짐

https://pypi.org/project/scikit-hts/
# not supported in fbprophet , tslearn
# pip install scikit-hts

 

# 기타

- 잠재변수 ; SLS

 

'Statistics > Time Series Analysis' 카테고리의 다른 글

TSA - 메인 모델 정리  (0) 2021.02.18
TSA - 6. 벡터자기회귀  (0) 2021.01.22
TSA - 5. 동적회귀  (0) 2021.01.22
TSA - 4. 자기회귀  (0) 2021.01.22
TSA - 3. 패턴분해  (0) 2021.01.22