본문 바로가기

통계학

[통계]쉽게 익히는 정규분포[normal distribution]

by m_ahh 2017. 5. 30.
반응형

쉽게 익히는 "정규분포"



 정규분포는 정식으로 통계학을 배우지 않았더라도 한번씩 들어봤을 법한 용어다. 그럼 이 정규분포의 정확한 개념은 무엇일까? 확률과 통계학에서 정규분포, normal distribution 이란 연속확률분포 가운데 하나이다. 이를 다른 이름으로 가우스 분포(Gaussian distribution)라고도 한다. 

 


>>> 연속형확률분포란? 클릭

 


  정규분포에도 표준정규분포인 Standard Normal distribution 이 존재한다. 이는 평균이 0 이고 표준편차가 1인 정규분포를 의미한다. 이를 Z-distribution 이라고도 부른다. =N(0,1)

 이 Z값을 구할때에는 x=μ+zσ 식을 변형하여 z = (x-μ)/σ 식을 통해서 구할 수 있다. 



 정규분포는 앞서 얘기했듯이 연속형 확률분포의 일종으로 p(x) 를 y축으로 한 누적 함수를 그릴 수 있다. 그 때 y축의 최고값은 probability 의 합이기 때문에 1 이고, 그 가운데 y축이 0.5가 되는 p(x)에서 x축 값을 읽는다면 그것이 평균과 중앙값으로 볼 수 있다. 



 또한 연속형 확률분포로 Probability density function 으로 표현할 수 있다, 즉, 확률 밀도 함수속확률변수가 주어진 어떠한 구간에서 포함될 확률을 나타내는 것다. 확률변수가 취할 수 있는 값이 유한하거나 세어릴수 있는 이산확률변수 x에 대응하는 함수로, 간단히 확률함수라고도 한다. 

 이 확률함수는 취할 수 있는 x값의 범위는 알고있으나, 그 중 어떤 값을 취하는지 확률적인 값만 알수 있는 변수를 확률변수라고 하는데, 그 확률변수가 가질수 있는 함수이다. 확률 변수 X가 x와 x+dx 사이에 있는 확률이 f(x) · dx로 표시되었을 때 확률 f(x)를 확률 밀도 함수라고 한다



 추가적으로 이항분포, Binomial distribution 에 대해 알아보자. 이는 정규분포가 연속적인 분포를 나타냄에 비해 이항분포는 이산적 확률분포에 속하는 차이점을 나타낸다. 이는 정규분포와 마찬가지로 모집단이 가지는 이상적 분포형 중의 하나이다. 이항분포를 B(n,p)로 나타낼 때, 평균값은 m=np이고 분산 σ^2은 σ2=npq(q=1-p)이며, p가 0이나 1에 가깝지 않고 n이 충분한 크기이면 이항분포는 정규분포에 가까원 진다고 볼 수 있다. 

반응형

댓글