본문 바로가기

통계학

[통계]쉽게 익히는 검정통계량(Test statistics)

by m_ahh 2017. 6. 2.
반응형

쉽게 익히는 "검정 통계량"




 먼저 t 분포에 대해 알아보자. t분포란 Student's t-distribution 으로 정규분포의 평균을 측정 할 때 주로 사용되는 분포이다.  t분포는 우리가 잘 알고있는 맥주회사 기네스의 양조공장에서 근무한 윌리엄 고셋이 고안하였다. 윌리엄 고셋은 맥주에 사용되는 보리의 질을 시험하기 위해 다음 분포를 도입하였고, 경쟁사들에 이 통계기법을 숨기기 위해 "스튜던트" 라는 필명으로 발표하였다고 한다. 


 이 스튜던트 t분포는 다음 식 Z/√(V/v) 으로 정의 된다. Z는 표준 정규 분포를 나타낸다. V는 자유도 v 인 카이제곱 분포이다. t분포는 bell-shaped(종모양)으로 대칭을 이루고, 평균이 0이고 분산이 1인 정규분포를 가진다. 



  T분포의 모양샘플 사이즈에 영향을 받고(T-table), 자유도(degree of freedom, df) 에 영향을 받는다. 자유도가 커질수록 T분포의 모양은 normal distribution 을 닯아가게 된다



 Test Statistic, 검정 통계량에 대해 알아보자. t검정통계량은 t분포를 사용하는 t검정을 위한 통계량이다. 가설 검정을 위해서 확률과 분포가 필요한데, t검정은 t분포를 사용하는 검정법이다. t분포는 y축이 확률을 나타내고, x축값이 t값이다. 


 이때 표본자료에 기초하여 계산된 검정통계량은 귀무가설 H0가 참인 경우에 해당 표본이 우리가 얼마나 벗어나 있는지를 측정해준다. 통계량의 값이 큰 경우에는 귀무가설이 해당자료와 일치하지 않는 다는 것을 알 수 있다. 검정 통계량은 어떠한 값을 실제로 관찰되는 것 보다 더 극단적으로 받아들일 수 있는 확률을 검정의 p-value 라고 하며, 이는 귀무가설을 참으로 가정한 후에 계산된다.  p값이 작아질수록 귀무가설과 상반되는 증거는 더 증가한다. 



 가설의 종류에 대해 잠깐 알아보면 귀무가설과 대립가설이 있다. 두 가설은 항상 mutually exclusive 한 관계를 가진다.


1. 귀무가설, H0, null hypothesis

 : the parameter you are interested in takes a specific value - will be rejected if the data in your sample suggest that it is a highly unlikely expectation.


2. 대립가설, H1, alternative hypothesis

 : Claims that the parameter you are interested in falls within an alternative Range of value.

반응형

댓글