본문 바로가기

카테고리 없음

통계적 가설 - 귀무가설, 대립가설의 설명과 예제

통계학에서 사용되는 가설에 대하여 설명하는 글을 제 나름대로 해석한 내용을 설명 드리고자 합니다.

 

우선 통계적가설은 귀무가설과 대립가설 두가지로 나뉘는데 이를 쉽게 표현하자면 O,X 라고 생각합니다.

그렇다면 무엇에 대한 O,X 인지도 한번 알아봐야되는데요.

그전에 우리가 통계학에서 왜 가설을 세우는지 한번 생각 해보아야 합니다.

 

 

 

위 그림 처럼 우리는 모집단 정보 전체에 대해서 정보를 알기가 매우 어렵습니다.

ex) 전 세계인 사람들의 평균 키, 연봉 등... 시간과 비용등 구하기가 까다롭기 그지 없습니다.

 

그렇기 때문에 표본 추출 방법으로 표본을 뽑아 표본으로 모집단 값을 추정 하는 것 입니다.

이를 통계적 추론 이라고 합니다.

 

그렇다면 표본을 뽑았을때 표본의 평균과 모집단의 평균이 일치 할 확률은 얼마나 될까요?

 

예시를 들어 보겠습니다.

 

전세계 대학생의 평균 키는 177cm 이고 이를 모집단의 평균이라고 예상 하였다고 해봅시다.

이를 그럴리 없다고 여긴 어느 한 대학교의 교수가 다양한 나라의 학생들의 키를 조사하여 표본을 만들었는데

이때 교수가 구한 평균의 키는 175cm였습니다.

우리가 알고있던 기존정보의 전세계 대학생의 평균 키는 177cm이고 표본A에서 나온 평균 키는 175cm 입니다.

 

그럼 우리는 우리가 알고 있던 177cm라는 기존의 정보가 틀렸고 175cm가 맞다라고 할 수 있을까요?

반대로 175cm가 틀렸고 177cm가 맞다라고 할 수 있을까요?

 

이를 통계적으로 해석 하기 위해선 아래와 같이 얘기 할 수 있어야 됩니다.

우리가 알고있던 177cm를 가진 모집단의 데이터에서 평균 175cm를 가진 표본이 나올 확률은 얼마나 될것인가?

그럼 이 확률은 우연히 나올 수 있는 확률인가? 아니면 매우 드물게 일어 날법한 확률인가?

이 값을 가지고 우리가 알고있던 177cm 가 맞느냐 아니면 175cm가 좀더 맞는거 같으냐를 우리는 통계적 가설 검정을 통해서 구하게 됩니다. - 통계적 가설 검정은 다음에..

 

그럼 다시 돌아와서 그래서 귀무가설, 대립가설이 무엇이냐?

 

귀무가설은 우리가 알고 있던 기존의 정보 혹은 모집단의 값이라고 추정 하는 값 혹은 가설 입니다.

대립가설은 우리가 표본으로 부터 얻은 정보가 귀무가설에 대립하여 맞을 것이라고 추정하는 가설 입니다.

위의 예시에서 귀무가설과 대립가설을 구하면 귀무가설과 대립 가설은 각각

귀무가설 : 평균이 177cm이다!

대립가설 : 아니 귀무가설 너 아닐껄? 175cm가 평균일껄?

이렇게 볼 수 있습니다.

 

이 두가지의 상황을 놓고 통계적 가설 검정을 통하게 된다면 값이 0 ~ 1 사이의 값을 가지는 P-value 라는 녀석이 나오게 됩니다.

이녀석 P-value를 유의 수준이라고 하는데요.

통계학적으로 많이들 이 값이 0.05 보다 작으면

즉, 모집단이라고 예상한 데이터에서 표본을 뽑았는데 표본의 평균이 175cm이고 표준편차가 S가 나왔을 확률이 0.05보다 작으면 이 상황은 매우 이례적이므로 대립가설이 유의 할거야 라고 할수있고

0.05 이상의 값을 가진다면 표본이 이렇게 나올수 있어 하고 대립가설 너 아닌거 같아 기각!이라고 할 수 있습니다.

 

이처 귀무가설과 대립가설은 서로가 다른 결과를 이야기 하고 있기 때문에

귀무가설이 채택되면 대립가설은 기각이 되고, 반대로 귀무가설이 기각되면 대립가설은 채택이 됩니다.