개발/Data Science

데이터분석 준 전문가(ADsP) 3과목 : 가설검정

huiyu 2023. 2. 25. 07:06

* 용어 정리
 - 가설 검정(Staticstical hypothesis testing) : 모집단에 대한 어떤 가설을 설정한 뒤에 표본 관찰을 통해 그 가설의 채택 여부를 결정하는 통계적 추론 방법
 - 귀무가설(H0) : null hypothesis, 가설검정의 대상이 되는 가설, 연구자가 부정하고자 하는 가설. 설정한 가설이 진실할 확률이 극히 적어 청므부터 버릴 것(기각)이 예상되는 가설
 - 대립가설(H1) : anti hypothesis, 귀무가설이 기각될 때 받아들여지는 가설, 연구자가 연구를 통해 입증 또는 증명되기를 기대하는 예상이나 주장

- 기각역(Critical region) : 검정통계량(t-value)의 분포에서 유의수준의 크기에 해당하는 영역, 계산한 검정통계량의 유의성(귀무가설의 기각)을 판정하는 기중

- 제 1종 오류 :  alpha error, 귀무가설이 참인데 기각하게 되는 오류
- 제 2종 오류 : beta error, 귀무가설이 거짓인데 채택되는 오류
 * 두가지 오류가 작을 수록 바람직함
 * 두가지를 동시에 줄일 수 없기 때문에 1종 오류를 범할 확률의 최대 허용치를 미리 어떤 특정값(유의수준)으로 지정해 놓고 제 2종 오류의 확률을 가장 적게 해주는 검정 방법 사용

- 유의 수준(a) : Significance level, 제 1종 오류의 최대 허용 한계, 0.05(5%)

- 유의확률(p-value) : 1종 오류를 범할 확률,우리가 내린 판정이 잘못되었을 확률
- 검정력(1-b) : 귀무가설이 사실이 아닐 때, 귀무가설을 기각할 확률

* 귀무가설 검증 프로세스

728x90
반응형