디지털애널리틱스 개인 공부

2023. 11. 24. 22:19학교 수업/디지털 애널리틱스

시계열 데이터 그래프에서 판단해야 하는 것

 

-p,d,q 중 d (differences)를 해야하는지 안해야하는지 판단

 

-stationary(정상성) 판단

 

-ts.data > 0.05이면 차분을 진행할 것 (대립가설 채택을 목적으로 하는?) 

 

-차분 : 이전 데이터에서 차분

- 차분을 많이 진행 시 원래 데이터를 잃게 됨

 

aic : 에러사이즈를 측정하는 스코어

 

 

- 왼쪽 ma1이 실제 적는 weith 값임

-s.e는 에러 값 (0.0868)

 

yt=3.0975+wt(원래에러)+0.2097wt   (ar은 없는 상태임)

 

yt=3.0208+0.8353wt +wt - 0.6243wt (ar1 +wt + ma1) 

 

 

is(m1) : arima만 존재하는 것 확인 가능

ls(m1) : m1에 존재하는 변수들 확인

 

m1$aic : m1에 있는 오류값 

m$aic : m에 있는 오류값

 

-> m보다 m1의 aic가 더 작은 것을 확인 가능하다. => m1이 더 좋은 모델이라는 것 확인 가능

 

 

2번째 모델이 aic는 제일 작지만, 차분이 너무 많이 진행된 것을 확인 가능-> 2번 모델과 크게 차이나지 않고, 차분이 적절하게 진행된 1번째 모델을 선택하는 것이 좋음.

 

 

autoarima는 aic 대신 bic로 확인 (ic='bic')

 

BIC 방법은 베이지안 이론에서 우도함수와 사전분포를 이용하여 계산된 사후분포를 근사하여 유도된 통계량

 

 

 

'학교 수업 > 디지털 애널리틱스' 카테고리의 다른 글

R 실습 : 회귀분석  (0) 2023.11.20
R실습 : 통계검증1  (1) 2023.11.20