개발/Data Science

데이터분석 준 전문가(ADsP) 3과목 : 데이터 분석-시계열 예측 기초개념

huiyu 2023. 2. 23. 06:47

* 시계열 자료(time series)
 - 시계열 자료 : 시간의 흐름에 따라 관측된 데이터, 시계열 분석을 위해서는 정상성을 만족해야 함
 - 정상성(stationary) : 시계열의 평균과 분산에 체계적인 변화 및 주기적 변동이 없다는 것, 미래는 확률적으로 과거와 동일하다는 것
 - 정상 시계열의 조건

 - 정상 시계열로 전환하는 방법
  1) 비정상시계열 자료는 정상성을 만족하도록 데이터를 정상시계열로 만든 후 시계열 분석을 수행한다
  2) 평균이 일정하지 않은 경우 : 원계열에 차분 사용
  3) 계절성을 갖는 비정상시계열 : 계절차분 사용
  4) 분산이 일정하지 않은 경우 : 원계열에 자연로그(변환)사용

- 차분 : 현 시점의 자료 값에서 전 시점의 자료 값을 빼주는 것을 의미

* 정상성
 - 평균값은 시간 t에 관계없이 일정하다
 - 분산값은 시간 t에 관계없이 일정하다.
 - 공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다.

* 시계열 데이터의 분석 절차 순서
 1) 시계열 그래프 그리기
 2) 추세와 계절 요인 파악 및 제거하기
 3) 잔차 예측하기
 4) 잔차에 대한 모델 적합하기
 5) 예측된 잔차에 추세와 계절성에 재반영하여 예측하기

 

728x90
반응형