본문 바로가기

통계학10

[기초] 통계학 요약 정리 3 [기초] 통계학 요약 정리 3 ▶ Correalation, Pearson's R(피어슨 R) Correalation 은 상관관계이다. Scatter plot 은 Quantitative variables 을 나타내는데 사용할 수 있다. 더욱 일직선 형태로 나타날 수록 더 Strong linear realation 을 나타낸다. 피어슨의 상관계수는 상관계수의 한 형태로, 변수 X와 Y간의 선형적 관계성의 척도를 -1 에서1 사이의 값에서 나타내는 것이다. 즉 Scatter plot 의 Strong 혹은 weak 정도를 나타낸 것이 피어슨 상관계수라고 볼 수 있다. 피어슨 상관계수의 값이 -1 이라면 perfect negative 를 나타내고 1 이라면 perfect positive 를 나타낸다. 만약 0 값.. 2017. 5. 7.
[기초] 통계학 요약 정리 2 [기초] 통계학 요약 정리 2 ▶ Box Plot (상자그림)7, 8, 10, 10, 11, 15, 12, 10, 9, 1 통계학에서 범위, Range 란 데이터 값들이 분포되어있는 방식을 계산하는 방법으로 Highest value - Lowest value 를 해주면 된다. 장점으로는 쉽고 간편하다. 단점으로는 Variability 정보가 크게 나타나지 않는다는 것이다. 위의 데이터 집합에서 range 를 구하면 15 - 1 = 14 이 된다. 또한 Interquartile Range 라는 것이 있다. 우리말로 사분범위라고 하는데, 사분범위가 크면 보다 흩어진 분포를 보이고, 사분범위가 작으면 밀집된 분포를 지닌 것이다. 또한 자료의 extreme value 에 대해 영향을 덜 받게 되는 장점이 있다... 2017. 5. 6.
[기초] 통계학 요약 정리 1 [기초] 통계학 요약 정리 1 ▶ 통계기초, Variable, Statistical methods 통계는 기본적으로 두 가지 방법으로 분류 될 수 있습니다. 첫 번째로 기술통계 - descriptive statistic - 가 있습니다. 이는 수집한 정보를 정량적으로 묘사하거나, 혹은 요약하는 통계적 기법을 의미합니다. 두번째는 추리통계 - inferential statistic - 입니다. 이는 수집한 정보를 이용하여 추론하고, 예측하는 통계적 기법을 의미합니다. 우리가 수집하는 데이터들은 Variables 와 Case 로 나타낼 수 있습니다. Variables 는 어떠한 사물이나 대상의 특징을 나타내는 것이고 Case 는 어떠한 사물이나 대상 그 자체로 볼 수 있습니다. 예를 들어 야구에 대한 데이터.. 2017. 5. 6.