10. 가설 검정

10. 가설 검정

초간단 통계 2022. 12. 12. 11:25
반응형
모모 전자회사는 스마트폰 배터리의 만충시 최대 사용 가능 시간(이후 사용 시간이라 한다)을 평균 24시간, 표준 편차는 4시간이 되도록 생산관리중이다.
새로운 공법이 개발되었고, 새로운 공법에 의해 생산한 배터리는 기존의 배터리에 비해 사용 시간이 길어졌다고 주장한다.
이 주장을 확인하기 위하여 36개의 표본을 임의로 추출하여 사용 시간을 측정한 결과 평균이 26시간이었다.
이 자료들로 새로운 공법에 의한 배터리의 사용 시간이 기존 배터리의 사용 시간보다 달라졌다고 확신할 수 있는가?
양측검정에 유의수준은 0.046 (= +-2σ = 신뢰수준 95.4%)

정규 분포, 중심극한정리, 귀무가설과 대립가설 모두를 설명했으니
이를 합쳐서 어떻게 활용할 수 있는 지 알아보자.

귀무가설과 대립가설

귀무가설과 대립가설의 설정은 어렵지 않을 것이다.

'귀무가설'은 '배터리의 성능이 같다.'
'대립가설'은 '배터리의 성능이 다르다.'

우리의 목표는 귀무가설을 기각, 대립가설을 채택하는 것이다.

귀무 가설이 성립한다면,
배터리의 성능이 같다는 말이고,
위 '새 공정 샘플(표본)의 평균'은
'기존 공정 표본 평균'의 분포에서
가운데(평균)에 가까운 부분에 있을 것이다.

우리는 기존 배터리 전체(모집단)의 평균(24시간)과 표준 편차(4시간)를 알고 있기 때문에
기존 배터리를 36개씩 '무한번 표본 추출'했을 때 그 '각 표본의 평균'들이 어떤 분포를 가질 지 알 수 있다.

중심 극한 정리에 의해
표본 평균의 평균은 24시간이 되고,
표본 평균의 표준 편차는 (모집단의 표준 편차) / ((표본 개수) ** 0.5) 이다.
4 / (36 ** 0.5) = 0.67시간

기존 공정 표본 평균의 평균: 24시간
기존 공정 표본 평균의 표준편차: 0.67시간

양측 검정이며, 유의 수준은 0.046 이라 하였으니..
새 공정의 배터리가 기존 공정의 배터리와 차이가 없다면
하늘색 부위 0.954 안에 있어야 한다.

'새 공정 표본 평균'을 '구 공정 표본 평균'의 분포와 비교하려면, 정규화가 필요하다.

새 공정과 구 공정이 같다고 가정(귀무가설)하기 때문에
'구 공정 표본 평균'의 평균과 표준편차를 사용한다.

'새 공정 표본 평균'에서 '구 공정 표본 평균의 평균'을 빼면 26 - 24=2이다.
이것을 '구 공정 표본 평균의 표준 편차'로 나눠주자. 2 / 0.67 = 2.99

표준 편차의 2.99배 위치에 있으며 점을 찍어보면 붉은 색 정도의 위치가 된다.

2.99의 백분율은 상위 0.139%, 아래부터 99.861% 에 해당되는 값이다.
표준정규분포표 참고. 표준 정규 분포표의 0은 0.5 이다.

~~이 사실을 알고 그래프를 보면~~
~~그래프의 첨도 왜 이 모양인가라는 생각이...~~
~~인터넷에서 아무거나 가져오다 보니...~~

기존 공정(과 같은 수준의 공정)의 결과물 중에서는
이런 샘플이 뽑힐 확률은 매우 낮다는 게 1차 결론.

이렇게 발생 가능성이 매우 낮은 일이 발생한 이유는
다른 이유가 없다면, 전제 조건이 잘 못 되었기 때문...
옛 공정과 새 공정이 같다고 한 것 때문이다.

'성능이 달라졌다'라고 하면 모든 것이 쉽게 이해되는 상황인데,
'성능이 같다' 라고 주장하면서 모든 게 다 꼬여버린 것 이다.

최종 결론은
귀무가설 = '배터리의 성능이 같다'는 기각
대립가설 = '배터리의 성능이 달라졌다'는 채택

물론 새 공정이 바뀌면서 품질이 달라진 것이 아니라 뽑기가 우연의 일치로 잘 된 걸 수도 있다.
이런 건 오류의 영역.. 오류의 가능성은 존재한다...

양측 검정, 단측 검정

일반적으로

귀무가설 : 배터리 성능의 변화가 없다.
대립가설 : 배터리 성능의 변화(상승, 하락)가 있다.
로 설정할 경우는 양측 검정을 주로 사용하고,

귀무가설 : 배터리 성능이 그대로다.
대립가설 : 배터리의 성능이 증가했다.
로 설정할 경우는 단측 검정을 주로 사용한다.

양측 검정시 95%의 신뢰구간의 z-score는 1.96
(2에 거의 가깝다. 약식으론 2를 잡기도 한다)
단측 검정시 95%의 신뢰구간의 z-score는 1.65이다.
알고 있으면 좋지만 몰라도 상관 없다.

import math def z2p(z_score): return .5 * (math.erf(z_score / 2 ** .5) + 1) def main(p_mean, p_sd, s_mean, s_size): print('구공정 베터리의 평균:', p_mean) print('구공정 베터리의 표준편차:', p_sd) p_s_m_sd = p_sd / s_size ** .5 print('구공정에서 추출한 표본 평균의 표준편차:', p_s_m_sd) print('신공정 표본의 평균:', s_mean) z_score = (s_mean - p_mean) / p_s_m_sd print('z-score:', z_score) print(f'100분위: {(1 - z2p(-z_score)) * 100:.3f}%, {(z2p(-z_score)) * 100:.3f}%') main(24, 4, 26, 36)

구공정 베터리의 평균: 24 구공정 베터리의 표준편차: 4 구공정에서 추출한 표본 평균의 표준편차: 0.6666666666666666 신공정 표본의 평균: 26 z-score: 3.0 100분위: 99.865%, 0.135%

정규분포를 가우스 분포(Gaussian distribution)라고도 한다고 했다.
math.erf 는 오차함수(error function) 이다. 가우스 오차함수라고도 한다.
가우스 분포와 가우스 오차함수는 본질적으로 같다.
약간의 변환으로 완전히 같아진다.

가우스형 쵝오~!

https://docs.python.org/ko/3/library/math.html#math.erf

https://ko.wikipedia.org/wiki/%EC%98%A4%EC%B0%A8_%ED%95%A8%EC%88%98
반응형
관련글 관련글 더보기

ABOUT ME

ComDoc ComDoc

귀무가설과 대립가설

티스토리툴바

ABOUT ME

귀무가설과 대립가설

관련글 관련글 더보기

티스토리툴바