Statistics/Time Series Analysis11 TSA - 4. 자기회귀 # Unstationary Time series 정상화 방법 로그 : 분산변화 차분(빼기) : mth 차분 - 계절성 평균변화, 1차 차분 - 평균변화 (level 변화) 확인방법 : ACF가 0근처에 벗어남 # Stataionary Time series 1. 서로 다른 시간의 시계열값에 영향 주지 않음 고정된 길이(진폭/높이,파장/너비)를 갖지 않으면 주기도 예측불가능하다 장기적으로 볼 때 예측할 수 있는 패턴이 없음 2. 확인방법 ACF가 0근처에 분포함 KPSS Unit Root Test - H0 : 데이터에 정상성이 나타난다 3. 자기회귀 예측기법 : 자기 자신(변수)의 과거 값의 선형 조합을 이용하여 y예측 해석 베타 = 0 - 랜덤 베타 = 1 , 절편 = 0 - 랜덤워크 베타 = 1 , 절편.. 2021. 1. 22. TSA - 3. 패턴분해 시계열 패턴 추출기법 (Stationary Time Series) ; 시계열의 전환점 또는 변화의 방향를 해석하려면, 추세-주기 성분 >> 계절 성분 제거 데이터 # 고전적 시계열분해 예측기법 / 비추 1) 분해 종류 (계절성, 추세주기, 나머지) 곱셈 : 계절성 변동크기가 추세-주기 변동크기에 비례하여 변한다면 y = 추세 * 계절 * 나머지 덧셈 : 계절성과 추세주기가 독립일 때, 또는 곱셉의 로그변환 y = 추세 + 계절 + 나머지 2) 추세-주기 성분 추출(계절성 제거) 이동평균 중심화 이동평균, 이동평균의 이동평균 : 2*12MA(월) , 7MA(일) 가중이동평균 3) 사용하지 말아야 할 이유 계절성분이 매년 반복된다는 것을 가정함, 즉 계절성분의 반복주기가 변하면 추출못함. 일시적 특이패턴 추.. 2021. 1. 22. TSA - 2. 일반회귀 #선형회귀 예측기법 회귀모델 가정 검정하기 - 잔차진단 1) 필수가정 : 오차평균=0, 오차자기상관성=0, 오차-예측변수 상관성=0 , 예측변수는 랜덤아닌 통제변인. 2) 추가가정(for 예측구간) : 오차 등분산, 정규분포, --> 오차는 미지의 값이므로, 잔차로 가정을 검정한다. [필수1]잔차는 항상 평균 0임. [필수2]잔차 자기상관성(Breusch-Godfrey or Lagrange Multiplier 검정) : 어떤 특정한 순서까지 잔차에 자기상관이 없다는 결합 가설(joint hypothesis) 검증. : 회귀모델전용 자기상관성 검정임 (융박스검정은 보편적 자기상관 검정법) : ACF로 시각화 *자기상관성을 제거하지 않은 unstationary 데이터에 regression하지 말것. *잔차의.. 2021. 1. 22. TSA - 1. 시각화 및 벤치마크 예측기법 # 무엇을 예측하나? 비교적 높은 확률로 취할 수 있는 값들의 *범위(구간예측*) 가능한 미래 값의 평균값인 *점예측* 상대적인 확률 값에 따라 이 무작위 변수(미래값)가 가질 수 있는 값을 *예측분포* 예측분포의 대표값은 평균 또는 중간값이 됨. # 어떤 패턴을 예측해야 하나? 랜덤(white noise), 추세(trend.방향), 계절성(seasonality.고정빈도), 주기(cycle.반복되는 비슷한 형태)가 있다. 먼저 데이터에서 나타나는 시계열 패턴을 살피고, 그 다음 적절하게 패턴을 잡아낼 수 있는 기법을 선택해야 함. *추세로 인한 자기상관성은 시간이 지나면 줄어지만 계절성.주기성은 남는 경향있음. # 패턴을 분석하는 첫번째 방법 : 시각화(ggplot ) 계절그래프 - (연도의 월별 수익률.. 2021. 1. 22. 이전 1 2 3 다음