본문 바로가기

가설2

올바른 가설 설정 조건 3가지 (양치기 소년 예시) 분석 과제를 진행할 때, 1단계 문제 정의는 즉 가설을 어떻게 설정하느냐다. 이 1단계가 매우 중요한게, 문제 정의를 어떻게 하느냐에 따라서 필요 데이터나 x, y, f()가 바뀔 수도 있다. (캐글 예제 풀기에서나 1단계가 명확하지, 현실에서는 1단계를 구체화 하는 것도 어려울 수 있다.) 문제 정의가 제대로 되어 있지 않다면 2단계 3단계는 제대로 이행 될 수 없다. 양치기 소년을 예로 들겠다. 초기에 주어진 문제는 다음과 같다. 대립 가설 : 나의 주장(B): 양치기들은 거짓말쟁이다! 귀무 가설 : 대중 주장(A): 양치기들은 거짓말쟁이가 아니다! 위와 같이 애매모호한 가설로는 이후 데이터/통계 분석이 진행되기 힘들다. 보다 제대로 된 문제 정의를 위하여, 올바른 가설 설정을 위한 3가지를 설명하겠.. 2023. 12. 27.
데이터 분석 준비 (4) 문제 정의, 가설 검정 과정 패스트 캠퍼스 김경원 강사님의 강의를 주로 참고하여 정리한 노트입니다. 복습: 이전 글(현실적인 데이터분석 단계별 목적) 에서 데이터 분석을 위와 같이 3단계로 나누었었다. 1단계: 문제정의 2단계: 해당 문제 풀기 3단계: 평가 및 검증. 실제 많은 데이터 분석 강의에서 진행하는 실습은 대부분 2단계만 다룬다. 이미 명확히 정의된 문제가 주어지며, 무엇을 풀어나가야 할지 지시가 내려진다. (예: 대학과제, 캐글) 하지만 현실세계에서는 1단계 및 3단계가 만만치 않으며, 이것이 제대로 이행이 되어야 2단계의 성과가 날 수 있다는 사실을 잊지 말자. 문제 정의 및 의사 결정을 위한 실험 설정 실험 설정이 왜 필요한가? 대부분의 분석은 "비교(A/B Test)"를 기반으로 하며 (가설 검정도 A/B 테스트를.. 2023. 12. 25.