본문 바로가기

통계학10

[통계]쉽게 익히는 검정통계량(Test statistics) 쉽게 익히는 "검정 통계량" 먼저 t 분포에 대해 알아보자. t분포란 Student's t-distribution 으로 정규분포의 평균을 측정 할 때 주로 사용되는 분포이다. t분포는 우리가 잘 알고있는 맥주회사 기네스의 양조공장에서 근무한 윌리엄 고셋이 고안하였다. 윌리엄 고셋은 맥주에 사용되는 보리의 질을 시험하기 위해 다음 분포를 도입하였고, 경쟁사들에 이 통계기법을 숨기기 위해 "스튜던트" 라는 필명으로 발표하였다고 한다. 이 스튜던트 t분포는 다음 식 Z/√(V/v) 으로 정의 된다. Z는 표준 정규 분포를 나타낸다. V는 자유도 v 인 카이제곱 분포이다. t분포는 bell-shaped(종모양)으로 대칭을 이루고, 평균이 0이고 분산이 1인 정규분포를 가진다. T분포의 모양은 샘플 사이즈에 영향.. 2017. 6. 2.
[통계]쉽게 익히는 통계적 추론(추정,가설검정,신뢰구간) 쉽게 익히는 통계적 추론(추정, 가설검정, 신뢰구간) 통계적 추론(Statistical Inference) 이란 통계의 표본정보(sample)에 근거하여 전체 모집단의 특성, 파라미터 등을 추정하는 과학적 과정이다. 통계적 추론은 크게 두 단계로 나눌 수 있다. 첫째는 통계적 추정이고, 가설 검정이다. 통계적 추정(Estimate)에는 표본으로 부터 모집단을 추정하는 과정에 따라 점추정과 구간추정으로 나눈다. 점추정이란 모집단의 모수를 가장 잘 대표하는 하나의 값을 구하는 과정이고, 점 추정량(Point estimator)은 미지의 모수를 가장 잘 추정하는 통계량을 의미한다. 표본평균, 표본 분산 등이 그 예이다. '점추정치'란 추정량에서 결정되는 특정한 값을 의미한다. 구간추정(Interval Esti.. 2017. 6. 1.
[통계]쉽게 익히는 표본분포와 표본추출법 쉽게 익히는 "표본분포"와 "표본추출법" 표본분포의 개념에 앞서 '표본 통계량' (Sample statistic) 의 개념을 보자면, 모집단의 관측 표본에 의해 결정되는 확률변수로, 확률 분포를 가지는 통계량을 의미한다. 즉, 표본을 어떻게 정의하냐에 따라 항상 달라지므로 확률변수로 취급되는 것이다. 표본은 전체 모집단의 일부로 통계적인 값을 구할때 쓰이고 이는 Roman letters 로 쓰인다. 즉, X- 가 평균을 나타내고, S가 표본의 표준편차를 의미한다. 이 표본으로 우리는 Inferential statistics 를 통해 전체 모수의 parameter 를 추론하게 된다. 모수의 통계량은 Greek letters 로 쓰인다. μ로 평균을 표시하고 σ로 표준편차를 나타낸다. 다시 본론으로 돌아가서.. 2017. 5. 31.
[통계]쉽게 익히는 정규분포[normal distribution] 쉽게 익히는 "정규분포" 정규분포는 정식으로 통계학을 배우지 않았더라도 한번씩 들어봤을 법한 용어다. 그럼 이 정규분포의 정확한 개념은 무엇일까? 확률과 통계학에서 정규분포, normal distribution 이란 연속확률분포 가운데 하나이다. 이를 다른 이름으로 가우스 분포(Gaussian distribution)라고도 한다. >>> 연속형확률분포란? 클릭 정규분포에도 표준정규분포인 Standard Normal distribution 이 존재한다. 이는 평균이 0 이고 표준편차가 1인 정규분포를 의미한다. 이를 Z-distribution 이라고도 부른다. =N(0,1) 이 Z값을 구할때에는 x=μ+zσ 식을 변형하여 z = (x-μ)/σ 식을 통해서 구할 수 있다. 정규분포는 앞서 얘기했듯이 연속형 .. 2017. 5. 30.
[통계]쉽게 익히는 확률분포의 개념 "확률분포" 개념 쉽게 정리하기 확률분포란? Probability Distribution 으로 확률변수가 어떠한 특정한 값을 가질 확률을 나타내는 함수를 의미한다. 예를 들어 주사위를 던져 나올 수 있는 특정한 값에 대한 확률변수가 있을때 확률분포로 볼 수 있다. 그럼 확률변수란 무엇일까? 확률변수는 Random variable 으로 어떠한 확률적인 과정에 따라 그 값이 결정되는 변수를 나타낸다. 같은 확률공간에서 여러가지 확률변수가 있을 수 있고, 이들 간의 조건부 확률과 사건의 독립성 여부 들을 정의할 수 있다. 이 확률변수의 정의역 공간은 확률변수의 '확률공간'이라고 한다. 또한 확률 변수의 공역은 확률변수의 '상태공간' 즉, state space 이다. 다시 확률분포 개념으로 돌아와서, 확률분포의.. 2017. 5. 29.
[통계] 쉽게 익히는 베이즈 정리(Bayes' theorem) 베이즈 정리(Bayes' theorem) ▶개요 베이즈의 정리는 영국의 목사 토머스 베이즈가 정립한 조건부확률에 대한 통계적 정리이다. 사건A와 B가 있을때, 사건 B가 일어난것을 전제로, 사건A에 대한 확률을 구하고 싶을때 사용할 수 있다. 현재 알고있는 것은 조건부 확률이 아니라 사건A와 B각각의 확률에 대한 것일 뿐일때 베이즈의 정리를 사용할 수 있다. 즉, B사건이 일어났다는 전제 하의 A사건의 확률은? ▶베이즈의 통계학(베이지언 통계학) 베이즈의 정리를 이용해 통계학에 접근하는 것이다. 자신이 가진 가설에 다른 자료들을 반영하여 새로운 것을 만드는 것으로 볼 수 있다. 하지만 베이지언 통계학은 확률,추정에 대해 기존 통계학과 많이 달라서 비판적으로 보는 사람도 있다. 이는 심리학, 신경과학, 인.. 2017. 5. 24.
[기초] 통계학 요약 정리 4 [기초] 통계학 요약 정리 4 ▶ Randomness 와 Probability Randomness, 즉 우연성이란 어떠한 사건의 소유물이 아니라, 필연성의 반대되는 말으로 예상하지 못하는 사건들을 뜻한다. 인간은 이 우연성을 재는 능력이 보통 떨어지고, 우연성에 대한 과한 해석을 하게 되는데 이를 apophenia 라고 한다. 우연성의 예를 들어보면 대표적으로 주사위게임을 들 수 있다. 보통 주사위를 흔들고 굴리면 무엇이 나올지 전혀 예상하지 못한다. 이를 우연성이라고 한다. 다만 이 우연성에 대한 확률적 계산은 가능할 수 있다. Probability 란 확률을 의미한다. 발생 할지 안할지의 여부가 불확실한 어떤 사건에 대해 그 가능성을 수치화 하여 표현한 것이다.(Quantify randomnes). .. 2017. 5. 19.