-
반응형
https://ko.wikipedia.org/wiki/%EC%8A%A4%ED%8A%9C%EB%8D%98%ED%8A%B8_t_%EB%B6%84%ED%8F%AC
https://namu.wiki/w/t%EB%B6%84%ED%8F%AC
https://ko.wikipedia.org/wiki/T-%ED%85%8C%EC%8A%A4%ED%8A%B8
정규 분포는 가우스 분포이고 가우스 오차 함수와 같다는 것을 잘 알고 있으리라...
T 분포는 독일형들이 만들었지만 잘 알려지지 않았고,
영어권인 고셋 형 덕에 널리 알려졌는데,
고셋형은 기네스 양조장에서 품질 관리를 위해 만들었고.
품질 관리의 비밀을 숨기기 위해 필명 스튜던트로 작성한 것이
스튜던트 라는 이름이 붙은 유래라고 한다.왜 T 분포를 써야하는가...
앞서 정규분포를 생각해 보면
모 평균과 모 표준 편차를 이용해서
모 표본 평균의 분포를 그리고
거기에 비교할 표본의 위치를 찾아서
가깝네 머네를 따지는 것이 전부(?)라는 걸 이제는 알 수 있다.....그런데 현실적으로 모 표준 편차를 찾는 건 참 어려운 일이다..
모집단의 전수 조사를 해야하는 건데...
공정 관리를 아주 빡세게 하는 공장 정도가 아니면...
현실에서 보기가 쉽지 않을 것 같다...T 분포는 표본의 표준 편차로 모 평균을 추측하는 것이다.
작은 샘플로 모집단을 추측하는 방법이다.T 분포에는 자유도라는 변수를 쓰는데
샘플 크기에서 1을 뺀다...1을 왜 빼냐규?
자유도란 종속 변수의 수인데...
x + y + z = 3 가 있을 때 x, y 가 정해지면 z는 따라 정해지기 때문이다.자유도가 무한대로 가면
T 분포는 정규분포로 수렴한다.이상의 사실들을 수학적으로 이해해도 좋겠지만
아래의 그래프로 이해하는 것도 좋다.샘플의 개수가 작을 수록
위 그래프의 2~4 부위가 많이 넓어진다.우리가 정규분포의 2σ(약 95%)부터는
신뢰도(유의수준)으로 잘 활용하는 부분이다.
(σ = 시그마, 표준 편차)저 부위가 넓어진다는 말은
정규분포에서 신뢰도 95% 부분이 2σ였는데...
T 분포에서는 신뢰도 95% 부분이 2.5σ가 될 수 있다는 말이다.
(자유도에 따라)표본의 숫자가 작을 수록
좀 더 엄격한 기준을 가지게 변형된 정규 분포라고
이야기 할 수 있다.그리고 샘플의 갯수가 30개에 되면
거의 정규분포에 일치하게 된다.모집단 표준 편차를 알 수 없고
표본의 크기가 30보다 작은 경우
T 분포를 쓴다.T 검정은
정규분포를 이용한 Z 검정에서
표본 평균의 표준 편차가 있어야할 자리에
(표본 표준 편차) / (자유도) ** 0.5 가 들어간다.t = (xBar - 𝜇) / (s / ν ** 0.5)
ν: 누 라고 읽는다.
이제 실제 사례로 알아보자.
모모 전자회사는 스마트폰 배터리의 만충시 최대 사용 가능 시간(이후 사용 시간이라 한다)을 평균 24시간이 되도록 생산관리중이다. 새로운 공법이 개발되었고, 새로운 공법에 의해 생산한 배터리는 기존의 배터리에 비해 사용 시간이 길어졌다고 주장한다. 이 주장을 확인하기 위하여 10개의 표본을 임의로 추출하여 사용 시간을 측정한 결과 평균이 26시간, 표준 편차는 4시간 이었다. 이 자료들로 새로운 공법에 의한 배터리의 사용 시간이 기존 배터리의 사용 시간보다 길어졌다고 확신할 수 있는가? 단측검정에 신뢰도는 99%
귀무가설: 새 공법의 배터리는 평균 24시간 이하의 사용시간을 가진다.
대립가설: 새 공법의 배터리는 평균 24시간 이상의 사용시간을 가진다.(26 - 24) / (4 / (10 - 1)) ** .5
3.03.0이라는 t-score를 얻었다.
이를 T 분포표에서 찾아보자.
자유도 9일 때 단측검정 신뢰도 99%는 2.821 이라는 T 스코어..
새 배터리의 점수는 그 보다 더 높기에 아웃라이어다.따라서 귀무가설을 기각할 수 있다.
새 공법의 배터리도 평균 24시간 이상의 사용시간을 가진다.반응형