* 시계열 자료(time series)
- 시계열 자료 : 시간의 흐름에 따라 관측된 데이터, 시계열 분석을 위해서는 정상성을 만족해야 함
- 정상성(stationary) : 시계열의 평균과 분산에 체계적인 변화 및 주기적 변동이 없다는 것, 미래는 확률적으로 과거와 동일하다는 것
- 정상 시계열의 조건
- 정상 시계열로 전환하는 방법
1) 비정상시계열 자료는 정상성을 만족하도록 데이터를 정상시계열로 만든 후 시계열 분석을 수행한다
2) 평균이 일정하지 않은 경우 : 원계열에 차분 사용
3) 계절성을 갖는 비정상시계열 : 계절차분 사용
4) 분산이 일정하지 않은 경우 : 원계열에 자연로그(변환)사용
- 차분 : 현 시점의 자료 값에서 전 시점의 자료 값을 빼주는 것을 의미
* 정상성
- 평균값은 시간 t에 관계없이 일정하다
- 분산값은 시간 t에 관계없이 일정하다.
- 공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다.
* 시계열 데이터의 분석 절차 순서
1) 시계열 그래프 그리기
2) 추세와 계절 요인 파악 및 제거하기
3) 잔차 예측하기
4) 잔차에 대한 모델 적합하기
5) 예측된 잔차에 추세와 계절성에 재반영하여 예측하기
728x90
'자격증 > ADsP(2023)' 카테고리의 다른 글
데이터분석 준 전문가(ADsP) 3과목 : 가설검정 (0) | 2023.02.25 |
---|---|
데이터분석 준 전문가(ADsP) 3과목 : 데이터 분석-오분류표를 활용한 평가지표 (0) | 2023.02.24 |
데이터분석 준 전문가(ADsP) 3과목 : 데이터 분석-주성분분석(PCA) (0) | 2023.02.22 |
데이터분석 준 전문가(ADsP) 3과목 : 데이터 분석-모형평가 (1) | 2023.02.21 |
데이터분석 준 전문가(ADsP) 3과목 : 데이터 분석-회귀분석(Regression Analysis) (0) | 2023.02.20 |