목차
시계열 분석 알고리즘을 공부하다보니, 가설 검정 및 기초 통계 지식이 탄탄해야하는 것을 느꼈다.
그래서 jargon free language로 공부 내용을 정리하고자 한다.
지난 글에서는 모집단, 표본, 샘플, 중심극한정리를 다루었다.
이번 글에서는 유의확률 및 유의수준 및 가설 검정을 어떻게 결론 짓는지에 대해 다루겠다.
양치기 소년 이야기를 예로 들겠다.
- 나의주장(B): 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 한다!
- 대중주장(A): 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 하지 않는다!
대립 가설 vs 귀무 가설
가설(Hypothesis)이란 아직 검증되지 않은 것에 대한 답을 찾기 위한 예측 방법, 제한된 증거에 기반한 아이디어 또는 제안을 말한다. 그래서 이미 검증된 삼각형 내각의 합은 180도다. 사각형 내각의 합은 360다는 가설이 될 수 없겠다.
- 귀무가설(H0):
Null Hypothesis, 현재의 상황이나 통념
~는 차이가 없다. ~의 효과는 없다. ~와 같다. 라는 말이 보통 붙는다. 모집단의 특성에 대하여 옳다고 제안하는 잠정적 주장이다.
양치기 예제에서는 A. 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 하지 않는다!
- 대립가설(H1):
Alternative Hypothesis, 새로운 현상이나 주장
귀무 가설에 반대되는 가설로 ~는 차이가 있다, ~의 효과는 있다 라는 말이 붙는다. 귀무 가설이 틀렸다고 잠정되었을 때 대안적으로 나오는 말이다. 그래서 대안 가설이라고도 부른다.
양치기 예제에서는 B. 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 한다!
연구는 검정해야 할 가설을 필요로 하는데, 일반적으로 연구에서 검정하는 가설을 귀무가설이라 하고, 귀무가설과 반대되는 가설을 대립가설이라고 한다. 대립가설은 연구자가 연구를 통해 입증되기를 기대하는 예상이나 주장하는 내용이다.