* Stationarity
: 정상성 ( 시계열 패턴없이 평균을 중심으로 랜덤 노이즈만 존재하는 상태 )
1) 명제 : 정상성이면 자기상관성이 없다(0이다; I(0)이다.). 역은 성립하지 않음.
Stationarity implies I(0), but I(0) does not imply stationarity
2) 판별법 : Augmented Dickey Fuller test
단, Cross validation, Out of sample 을 통해 반복해서 테스트해야 함.
Both the multiplicative and additive deltas on a series get at similar pieces of information, so it's not surprising both are stationary. In practice this might not always be the case.
# Additive X['AAPL'].diff()[1:] # Multiplicative X['AAPL'].pct_change()[1:]
[용어 정리]
1) Delta : 1차 도함수 ( 변화량 및 변화방향 ; 옵션가격/기초자산가격 )
2) Gamma : 2차 도함수 ( 변화속도/탄력도 ; 델타수치/기초자산가격 )
* Integration
: 적분? 합하기!
그러나 차분으로 이해하는게 더 빠를 듯하다.(아래)
1) Order of integration : 어떤 시계열이 안정적(stationary)이기 위해 필요한 차분(difference)의 최소 횟수
- 예시 : I(0)인 시계열을 누적합(적분)하면 I(1)이 되고, 이를 n번 반복하면 I(n)인 시계열이 된다.
= 누적을 n번 했기 때문에, 차분도 N번해야 랜덤노이즈 상태가 된다.
2) 판별법 : AIC로 차수 개수 정함
* Cointegration
: 공적분? 두 변수가 공통적인 추세를 공유하는 관계 또는 성질
1) 수리적 정의 : 시계열이 I(1)관계이고, 시계열 요소의 선형조합이 I(0)이면 해당 시계열은 공적분 관계이다.
- 예시 : 자기상관성이 존재하는 서로 다른 주식이 서로 비슷한 추세를 가진다면, A주식가격의 선형조합으로 B주식가격을 설명할 수 있다. 이런 두 주식의 관계가 공적분관계이다.
- 해석 : [반비례/비례]
-->상관계수 : 각 변수의 값의 관계.
-->공적분 : 각 변수의 (시간에 따른) 기울기의 관계
2) 판별법 : 공적분 검정 (요한슨&그레인저)
# 공적분 계산 from statsmodels.tsa.stattools import coint coint(X1, X2)
* ARIMA
1) AR : 과거 자신의 데이터를 변인으로하는 선형 모형
- AR(p) models try to capture (explain) the momentum and mean reversion effects often observed in trading markets (market participant effects).
2) MA : 과거 오차(white noise;변동성) 데이터를 변인으로 하는 선형 모형
- MA(q) models try to capture (explain) the shock effects observed in the white noise terms. These shock effects could be thought of as unexpected events affecting the observation process e.g. Surprise earnings, A terrorist attack, etc
3) ARMA : 혼합! 현재 가격이 과거 자신과 과거 오차데이터를 변인으로 하는 선형모형
To fit data to an ARMA model, we use the Akaike Information Criterion (AIC) across a subset of values for p,q to find the model with minimum AIC and then apply the Ljung-Box test to determine if a good fit has been achieved(정규성, 정상성), for particular values of p,q. If the p value of the test is greater the required significance, we can conclude that the residuals are independent and white noise.
4) ARIMA : AR + Integration + MA! 현재 가격의 t번 미분값(차분)이 과거 자신/오차를 변인으로 하는 선형모형
AR과 MA는 어디까지 과거 데이터를 변인으로 사용하는 선형모형! 정상성을 담보하지 않는다.
그러나 정상성이 있을 때, 선형모델의 힘이 제대로 발휘된다. 따라서 정상성을 갖기 위해 "차분"이 필요하다.
# ARIMA(p,q,d)의 최적 조합 찾기 for i in pq_rng: for d in d_rng: for j in pq_rng: try: tmp_mdl = smt.ARIMA(TS, order=(i,d,j)).fit(method='mle', trend='nc') tmp_aic = tmp_mdl.aic if tmp_aic < best_aic: best_aic = tmp_aic best_order = (i, d, j) best_mdl = tmp_mdl except: continue
'Statistics > Time Series Analysis' 카테고리의 다른 글
TSA - 3. 패턴분해 (0) | 2021.01.22 |
---|---|
TSA - 2. 일반회귀 (0) | 2021.01.22 |
TSA - 1. 시각화 및 벤치마크 예측기법 (0) | 2021.01.22 |
모수추정방법 / (0) | 2021.01.22 |
TSA - ARIMA + GARCH (0) | 2020.12.02 |