2023. 11. 24. 22:19ㆍ학교 수업/디지털 애널리틱스
시계열 데이터 그래프에서 판단해야 하는 것
-p,d,q 중 d (differences)를 해야하는지 안해야하는지 판단
-stationary(정상성) 판단
-ts.data > 0.05이면 차분을 진행할 것 (대립가설 채택을 목적으로 하는?)
-차분 : 이전 데이터에서 차분
- 차분을 많이 진행 시 원래 데이터를 잃게 됨
aic : 에러사이즈를 측정하는 스코어

- 왼쪽 ma1이 실제 적는 weith 값임
-s.e는 에러 값 (0.0868)
yt=3.0975+wt(원래에러)+0.2097wt (ar은 없는 상태임)

yt=3.0208+0.8353wt +wt - 0.6243wt (ar1 +wt + ma1)

is(m1) : arima만 존재하는 것 확인 가능
ls(m1) : m1에 존재하는 변수들 확인
m1$aic : m1에 있는 오류값
m$aic : m에 있는 오류값
-> m보다 m1의 aic가 더 작은 것을 확인 가능하다. => m1이 더 좋은 모델이라는 것 확인 가능

2번째 모델이 aic는 제일 작지만, 차분이 너무 많이 진행된 것을 확인 가능-> 2번 모델과 크게 차이나지 않고, 차분이 적절하게 진행된 1번째 모델을 선택하는 것이 좋음.

autoarima는 aic 대신 bic로 확인 (ic='bic')
BIC 방법은 베이지안 이론에서 우도함수와 사전분포를 이용하여 계산된 사후분포를 근사하여 유도된 통계량
'학교 수업 > 디지털 애널리틱스' 카테고리의 다른 글
R 실습 : 회귀분석 (0) | 2023.11.20 |
---|---|
R실습 : 통계검증1 (1) | 2023.11.20 |