본문 바로가기

Statistics33

TSA - 3. 패턴분해 시계열 패턴 추출기법 (Stationary Time Series) ; 시계열의 전환점 또는 변화의 방향를 해석하려면, 추세-주기 성분 >> 계절 성분 제거 데이터 # 고전적 시계열분해 예측기법 / 비추 1) 분해 종류 (계절성, 추세주기, 나머지) 곱셈 : 계절성 변동크기가 추세-주기 변동크기에 비례하여 변한다면 y = 추세 * 계절 * 나머지 덧셈 : 계절성과 추세주기가 독립일 때, 또는 곱셉의 로그변환 y = 추세 + 계절 + 나머지 2) 추세-주기 성분 추출(계절성 제거) 이동평균 중심화 이동평균, 이동평균의 이동평균 : 2*12MA(월) , 7MA(일) 가중이동평균 3) 사용하지 말아야 할 이유 계절성분이 매년 반복된다는 것을 가정함, 즉 계절성분의 반복주기가 변하면 추출못함. 일시적 특이패턴 추.. 2021. 1. 22.
TSA - 2. 일반회귀 #선형회귀 예측기법 회귀모델 가정 검정하기 - 잔차진단 1) 필수가정 : 오차평균=0, 오차자기상관성=0, 오차-예측변수 상관성=0 , 예측변수는 랜덤아닌 통제변인. 2) 추가가정(for 예측구간) : 오차 등분산, 정규분포, --> 오차는 미지의 값이므로, 잔차로 가정을 검정한다. [필수1]잔차는 항상 평균 0임. [필수2]잔차 자기상관성(Breusch-Godfrey or Lagrange Multiplier 검정) : 어떤 특정한 순서까지 잔차에 자기상관이 없다는 결합 가설(joint hypothesis) 검증. : 회귀모델전용 자기상관성 검정임 (융박스검정은 보편적 자기상관 검정법) : ACF로 시각화 *자기상관성을 제거하지 않은 unstationary 데이터에 regression하지 말것. *잔차의.. 2021. 1. 22.
TSA - 1. 시각화 및 벤치마크 예측기법 # 무엇을 예측하나? 비교적 높은 확률로 취할 수 있는 값들의 *범위(구간예측*) 가능한 미래 값의 평균값인 *점예측* 상대적인 확률 값에 따라 이 무작위 변수(미래값)가 가질 수 있는 값을 *예측분포* 예측분포의 대표값은 평균 또는 중간값이 됨. # 어떤 패턴을 예측해야 하나? 랜덤(white noise), 추세(trend.방향), 계절성(seasonality.고정빈도), 주기(cycle.반복되는 비슷한 형태)가 있다. 먼저 데이터에서 나타나는 시계열 패턴을 살피고, 그 다음 적절하게 패턴을 잡아낼 수 있는 기법을 선택해야 함. *추세로 인한 자기상관성은 시간이 지나면 줄어지만 계절성.주기성은 남는 경향있음. # 패턴을 분석하는 첫번째 방법 : 시각화(ggplot ) 계절그래프 - (연도의 월별 수익률.. 2021. 1. 22.
모수추정방법 / linearmodel/statsmodels 패키지를 사용한 계량분석 총정리모수추정방법 3가지 Least Square EstimatorOLS : 분산공분산행렬 --> 모두 같은 분산, 공분산 = 0 이분산성이나 자기상관성이 너무 강할 때에는 GLS와 robust 추정GLS : 분산공분산행렬 --> 서로 다른 분산, 공분산 !=0 (*Mahalanobis length)WLS : 분산공분산행렬 --> 서로 다른 분산, 공분산= 0FGLS (feasible) GMM [참고] : 자기상관성 !=0 --> lagged dependent variableDynamic panel model에 사용continuously updating GMMSLS (Stage) : 잠재변수 (변수간 계층 관계)Maximum Likelih.. 2021. 1. 22.