본문 바로가기

통계학

[통계]쉽게 익히는 확률분포의 개념

by m_ahh 2017. 5. 29.
반응형

"확률분포" 개념 쉽게 정리하기





 확률분포란? Probability Distribution 으로 확률변수가 어떠한 특정한 값을 가질 확률을 나타내는 함수를 의미한다. 

예를 들어 주사위를 던져 나올 수 있는 특정한 값에 대한 확률변수가 있을때 확률분포로 볼 수 있다. 


 그럼 확률변수란 무엇일까? 확률변수는 Random variable 으로 어떠한 확률적인 과정에 따라 그 값이 결정되는 변수를 나타낸다. 같은 확률공간에서 여러가지 확률변수가 있을 수 있고, 이들 간의 조건부 확률과 사건의 독립성 여부 들을 정의할 수 있다. 

 이 확률변수의 정의역 공간은 확률변수의 '확률공간'이라고 한다. 또한 확률 변수의 공역은 확률변수의 '상태공간' 즉, state space 이다. 


 

 다시 확률분포 개념으로 돌아와서, 확률분포의 종류에 대해 알아보자. 

 확률분포는 크게 2가지 개념으로 나눌 수 있다. 확률변수 X에 대해서 나올수 있는 분포는 이산형 확률분포연속형 확률분포가 있다. 영문으로는 discrete 와 continuous 이다. 


 이산 확률분포는 이산확률변수가 가지는 분포를 의미하는데, 여기에서 이산형이라는 것은 확률변수가 가질수 있는 값 X가 헤아릴 수 있는 Countable 한 수라는 것이다. 이 이산확률분포는 확률질량함수, Probability mass function 으로 표현할 수 있고, 누적함수로 표현할 경우 계단형 그래프로 증가하게 된다. 

 이산형 확률분포로는 이산균등분포, 베르누이 분포, 기하분포, 이항분포, 다항분포, 포아송분포, 초기하분포 등이 있다.


 

 그에비해 연속형 확률변수는 그 확률변수 X에 대해 가산할 수 없다. 무한대의 가능한 값을 가지고 있고, 이는 확률밀도함수를 통해 표현할 수 있다. 확률값 P(x)를 y축으로 놓고, x와 p(x)에 대해 그래프를 그리면, 특정한 구간 x1~x2 사이의 확률변수를 가질 확률은 그 아래 면적을 통해 구할 수 있다. 

 누적함수로 이를 그린다면 y축의 최고점은 probability의 합으로 1이 되고, 그 가운데 값 0.5 probability 에서의 x축값을 보면 mean = median 으로 구할 수 있다. 

 연속형 확률분포에는 정규분포, 연속균등분포, 카이제곱분포, 감마분포, 베타분포 등이 있다. 

반응형

댓글