초간단 통계
-
6. 평균(mean), 중간값(median), 최빈값(mode)초간단 통계 2022. 12. 6. 23:45
이런 값들을 대푯값이라고 한다. 평균은 전체 변량의 총합을 변량의 개수로 나눈 값이다. 중앙값은 변량을 작은 값부터 크기 순서로 나열할 때, 중앙에 위치한 값을 의미한다. 최빈값은 변량 중에서 가장 많이 나타나는 값을 말한다. 5. 편포도의 설명에서 소득 분포는 고소득자들이 우측 아웃라이어가 되기 때문에 우측 편포의 경향이 있다고 했다. 소득의 경우 같은 이유로 평균값보다는 중간값이나 최빈값이 더 좋은 대푯값이 될 확률이 높다. 평균값을 뽑아본들 의외로 주위에 그런 사람이 드물... 우측 편포(오른쪽 꼬리가 긴 경우)에서는 최빈값 - 중간값 - 평균값의 순서가 ... 좌측 편포(왼쪽 꼬리가 긴 경우)에서는 평균값 - 중간값 - 최빈값의 순서가 된다. 어찌 되었건 중간 값은 세 값의 중간에 위치한다는 것만..
-
5. 편포도(skewness)초간단 통계 2022. 12. 6. 23:15
https://ko.wikipedia.org/wiki/%EB%B9%84%EB%8C%80%EC%B9%AD%EB%8F%84 비대칭도 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. 비대칭도 실험 자료의 예 확률 이론 및 통계학에서 비대칭도(非對稱度, skewness) 또는 왜도(歪度)는 실수 값 확률 변수의 확률 분포 비대칭성을 나타내는 지표이 ko.wikipedia.org 정규 분포 비스무리한데 한쪽으로 쏠리는 경우가 있다. 대표적인 것이 소득 분포.. 이를 편포도 또는 왜도라고 하며, 소득 분포처럼 오른쪽에 긴 꼬리를 갖는 오른쪽 꼬리 분포를, 우측(right), 정적, 양적(positive) 편포(왜도)라 부른다. 반대라면 좌측(left), 부적, 음적(negative) 편포(왜도..
-
4. 정규 분포초간단 통계 2022. 12. 6. 21:29
https://namu.wiki/w/%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC 정규분포 - 나무위키 중학교의 내신 성적표에는 등급만 표기되어 있을 뿐 석차는 교육정책에 의해 표기되어 있지 않다. 하지만 원점수의 전체평균과 표준편차가 알려져 있고, 원점수의 분포가 정규 분포와 비슷하다 namu.wiki https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%EB%B6%84%ED%8F%AC 정규 분포 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. 확률론과 통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분..
-
3. 표준 편차(standard deviation)초간단 통계 2022. 12. 6. 18:19
길이가 각각 1, 2, 3, 4, 5cm 인 연필이 있다. (연필 길이의 평균은 3cm이다.) 이 값들이 (다른 세트들에 비해) 얼마나 분산되어 (펼쳐져) 있는지 알아보자.. 먼저 각 연필의 길이와 평균의 차이를 알아야 겠다. 이를 편차라고 한다. 이걸 알아야 얼마나 펼쳐져 있는 지 알 수 있겠지... 값들이 얼마나 펼쳐져 있는 지 편차를 이용해서 표현할 수 있는 방법은 뭘까? 편차의 평균으로 분산 정도를 알 수 있을까? 편차의 평균은 항상 0이 나오니 곤란하다. 연필의 길이 1 2 3 4 5 연필 길이의 평균 3 편차 -2 -1 0 1 2 편차의 평균 (-2-1+0+1+2) / 5 = 0 편차의 제곱 4 1 0 1 4 편차 제곱의 평균 (4+1+0+1+4) / 5 = 2 이것을 해결하려면 어떻게 할까?..
-
2. 분포(distribution)란초간단 통계 2022. 12. 6. 17:14
https://ko.wikipedia.org/wiki/%ED%99%95%EB%A5%A0_%EB%B6%84%ED%8F%AC 확률 분포 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. ko.wikipedia.org https://namu.wiki/w/%ED%99%95%EB%A5%A0%EB%B6%84%ED%8F%AC 확률분포 - 나무위키 확률 변수의 종류에 따라 크게 이산확률분포와 연속확률분포로 나뉜다. 기하분포(geometric distribution) 성공 확률이 p인 독립 베르누이 시행에서 최초로 성공인 시행이 나오기까지 시도한 횟수를 namu.wiki 위키에 따르면 확률 분포(probability distribution)는 확률 변수(random variable)가 특정한 값을 가..
-
1. 연속(continuous) vs 불연속(discrete)초간단 통계 2022. 12. 6. 16:50
범주형 자료 명목 척도 범주 순위 척도 범주 순위 연속형 자료 간격 척도 범주 순위 같은 간격 비 척도 범주 순위 같은 간격 절대 영점 예 명목 척도: 남과 여의 구분, 혈액형. 서열이 없이 이름으로만 의미가 있음. 순위 척도: 반 등수. 악성 종양의 병기. 간격 척도: 우울증 설문지 점수(0~40점). 물의 온도. 비 척도: 나이, 키 등... 주의 연속형 자료와 범주형 자료의 구분이 중요. 순위 척도는 범주형 자료임. 자료의 성격은 변할 수 있다. 키는 비 척도 자료지만, 10대 20대 등으로 구분하면 간격척도나 순위척도, 성인과 미성년자로 구분하면 명목 척도로도 볼 수 도 있다.