초간단 통계
-
위양성, 위음성초간단 통계 2022. 12. 20. 14:55
https://www.khan.co.kr/science/science-general/article/202009250600015어떤 진단 키트의 정확도는 95% 이다. (이 키트의 민감도와 정확도는 같다.)이 병의 유병률(전체 인구 중 환자의 비율)은 1%이때 (1) 병에 걸렸지만 음성으로 나올 확률과 (2) 음성이지만 병에 걸려 있을 확률을 알아보자...10000명을 대상으로 한다고 가정했을 때 유병률이 1%이니 환자는 100명, 건강한 사람은 9900명정확도가 95% 이므로 환자 100명 중 5명은 환자가아니다. 건강인 9900명 중 475명은 환자이다. 즉 다음과 같은 상황이 펼쳐질 때... 양성음성 환자95(진양성)5 (위음성)100건강인475 (위양성)94..
-
12. T 분포초간단 통계 2022. 12. 13. 14:38
https://ko.wikipedia.org/wiki/%EC%8A%A4%ED%8A%9C%EB%8D%98%ED%8A%B8_t_%EB%B6%84%ED%8F%AC 스튜던트 t 분포 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. 스튜던트 t 분포 확률 밀도 함수 누적 분포 함수 매개변수 ν > 0 {\displaystyle \nu >0} 자유도(실수값) 지지집합 x ∈ ( − ∞ ; + ∞ ) {\displaystyle x\in (-\infty ;+\infty )\!} ko.wikipedia.org https://namu.wiki/w/t%EB%B6%84%ED%8F%AC t분포 - 나무위키 이 저작물은 CC BY-NC-SA 2.0 KR에 따라 이용할 수 있습니다. (단, 라이선스가 명시된 ..
-
11. 비율 검정초간단 통계 2022. 12. 12. 15:59
이전까진 평균과 표준 편차를 이용해 검정을 했다. 이제 비율을 이용한 검정을 해보자. [집에 태블릿 PC 있다] 2019년 19% → 2021년 24% 2019년 설문조사에 따르면 한국 가정의 19%가 태블릿을 가지고 있다고 한다. 2021년 무작위로 400가구를 조사했더니 96가구가 태블릿을 가지고 있었다. (통계적 지식 없이도 전체 가구의 태블릿 보유율은 증가한 것으로 예상되지만,) 한국 가정의 태블릿 기기를 보유율의 증감을 95% 신뢰도(양측 검정)로 검정해 보자. 귀무가설: 2021년 19%의 가구가 태블릿을 가지고 있다. 대립가설: 2021년 19% 이상, 또는 이하의 가구가 태블릿을 가지고 있다. p = 0.19 q = 1 - 0.19 = 0.81 p위에 - 씌운 것을 p hat이라고 하는 데..
-
10. 가설 검정초간단 통계 2022. 12. 12. 11:25
모모 전자회사는 스마트폰 배터리의 만충시 최대 사용 가능 시간(이후 사용 시간이라 한다)을 평균 24시간, 표준 편차는 4시간이 되도록 생산관리중이다. 새로운 공법이 개발되었고, 새로운 공법에 의해 생산한 배터리는 기존의 배터리에 비해 사용 시간이 길어졌다고 주장한다. 이 주장을 확인하기 위하여 36개의 표본을 임의로 추출하여 사용 시간을 측정한 결과 평균이 26시간이었다. 이 자료들로 새로운 공법에 의한 배터리의 사용 시간이 기존 배터리의 사용 시간보다 달라졌다고 확신할 수 있는가? 양측검정에 유의수준은 0.046 (= +-2σ = 신뢰수준 95.4%) 정규 분포, 중심극한정리, 귀무가설과 대립가설 모두를 설명했으니 이를 합쳐서 어떻게 활용할 수 있는 지 알아보자. 귀무가설과 대립가설 귀무가설과 대립가..
-
9. 통계적 유의성, 귀무가설, 대립가설초간단 통계 2022. 12. 9. 14:46
동전 던지기와 확률 조작된 동전인지 아닌지 알 수 없는 상태에서 동전 던지기를 한다. 동전을 던졌다. 그런데 앞면이 나왔다. 앞면이 나올 확률 1/2 또 던졌다. 그런데 앞면이 나왔다. 앞면이 나올 확률 1/4 또 던졌다. 그런데 앞면이 나왔다. 앞면이 나올 확률 1/8 n번 던졌을 때 모두 앞면이 나올 확률: 1/(2**n) for n in range(1, 10): print(f'{n}회: {1 / 2 ** n * 100}%') 1회: 50.0% 2회: 25.0% 3회: 12.5% 4회: 6.25% 5회: 3.125% 6회: 1.5625% 7회: 0.78125% 8회: 0.390625% 9회: 0.1953125% 몇 회부터 조작된 동전이라고 의심하게 될까? 느낌적으로~! 예민한 사람은 3~4회 정도에서..
-
8. 표본 분포, 중심극한정리초간단 통계 2022. 12. 8. 15:01
모집단의 모수를 추정하기 위해 표본을 추출했다. 표본이라는 건 모집단과 비슷할수록 좋은 표본일 거다... 상식적으로 표본의 크기가 클수록 모집단과 가까워진다는 것은 당연한데... 표본을 키우는 방식 말고 조금 다른 방향으로 접근해 보자. 표본을 여러 개 추출하는 것에서 시작하자. 똑똑한 분들이 여러 개의 샘플들의 분포에서 뭔가 경향성을 찾았거든... 1~1000번까지 1000명의 사람이 있고 10명씩으로 구성된 표본을 수십 ~ 수백 개 ~ 또는 그 이상 추출한다고 생각하자. 표본의 크기는 모두 같고 표본은 겹칠 수 있다. 즉 1번 사람이 여러 표본에 포함될 수도 있다. 표본을 매우 많이 (극한) 추출할 때 이 표본 각각의 평균들은 정규분포를 드러낸다. 이를 중심 극한 정리라고 한다. 이것이 재미있는 것은..
-
7. 모집단(population)과 표본(sample)초간단 통계 2022. 12. 7. 00:01
정리하려니 번거롭다..... https://drhongdatanote.tistory.com/44 [개념 통계 11] 모집단과 표본이란 무엇인가? 안녕하세요. 홍박사입니다. 이전 포스팅까지는 기술통계(Descriptive Statistics)에 대한 내용을 다루었습니다. 이번 포스팅 부터는 추리통계(Inferential Statistics)에 대한 내용을 다룰 계획입니다. 기술 drhongdatanote.tistory.com 모집단과 표본.. 듣는 순간 느낌이 왔을 것이다. 모집단의 통계를 직접 조사하기 힘드니까 표본으로 모집단을 추정하기 위해서 이런 단어를 만들었구나... 모집단 전체를 전수 조사하면 간단(?)하고 정확한데.. 굳이 표본을 동원하는 이유는 ㅇㅇ 모집단 전수 조사는 불가능할 때가 많다. 그..