확률과 통계 가설검정 프린트 내용

5. 가설 검정
학습 목표 : 1. 통계적 가설 검정의 뜻을 안다.
2. 귀무가설, 대립가설, 기각역, 유의수준, 유의확률의 뜻을 안다.
3. 모평균에 대한 통게적 가설을 검정할 수 있다.
4. 모비율에 대한 통계적 가설을 검정할 수 있다.


5.1 가설 검정의 원리
생각열기: 어떤 질병에 대한 표준 치료법을 사용하면 치료율이 40%라고 한다. 이제, 신약이 개발되어 이를 사용하면 치료율이 표준 치료법보다 높은 것으로 예상된다고 하자.
20명의 환자에게 신약을 투여한 결과 14명이 치료되었다고 할 때, 다음 물음에 답하여라.
(1) 신약의 치료율을 추정하여라.
(2) 신약의 치료율이 표준 치료율보다 높다고 할 수 있는가?
통계적 추론 중에는 앞에서 다룬 모수의 추정 이외에 어떤 추측이나 가설의 타당성을 조사하는 가설 검정의 문제가 있다.
어떤 수학적인 추측이나 주장을 검정하기 위하여 이를 수학적으로 증명하든지 또는 반례를 들어 부정하면 된다. 이때, 얻어진 결론은 100%의 확신도를 가진다.
한편, 모수에 대한 예상이나 주장 또는 단순한 추측 등을 통계적 가설이라고 한다. 통계적 가설은 항상 오류의 가능성을 가지고 있으며, 이들의 옳고 그름을 판정하는 과정을 통계적 가설 검정 또는 간단히 검정이라고 한다.
예를 들어, 한국인의 남자의 평균 수명은 여자보다 5년이 짧다든가, 흡연은 폐암에 큰 영향을 미친다 등의 주장은 통계적 가설이다.
통계적 가설을 편의상 두 종류로 나누어 생각할 수 있는데, 표본 자료를 이용하여 입증하고자 하는 가설을 대립가설이라 하고, 이에 반대되는 가설을 귀무가설이라고 한다. 여기서는 귀무가설을 H0, 대립가설을 H1로 나타내기로 한다.
흔히 통계적 가설은 모집단의 특성값인 모수를 이용하여 나타낼 수 있다. 예를 들면, 앞의 생각열기에서 신약의 치료율을 p로 나타내면 귀무가설과 대립가설을 각각

H0 : p≤0.4
H1 : p>0.4
와 같이 나타낼 수 있다.
 
문제 1 […]
 
표준 치료법은 과거의 오랜 임상 실험과 경험에 의해 이루어진 것에 반하여, 확실한 증거 없이 신약을 채택하여 새로운 치료법으로 널리 사용하는 것은 매우 위험한 일이다. 따라서, 귀무가설 H0과 대립가설 H1을 검정하는 데 있어 대립가설에 대한 강력한 증거가 나타나지 않는 한 귀무가설을 기각해서는 안 된다.
 
이제, 가설을 검정하기 위하여 20명의 환자에게 신약을 투여하여 치료된 인원 수 X를 살펴보면, X는 하나의 확률변수로 이항분포 B(n, p)를 따른다. 이때, 어느 정도의 X값이 관찰될 때 대립가설 H1에 대한 강력한 증거가 나타났다고 말할 수 있는가? 직관적으로 말하면 X의 값이 19나 20과 같이 매우 크면 H1이 참일 가능성이 높고, 1, 또는 2와 같이 매우 작을 경우에는 H1이 거짓일 가능성이 높을 것이다.
그러면 X의 값이 어떤 범위에 있을 때, 대립가설 H1을 채택하고 귀무가설 H0을 기각할 것인가를 검정하여 보자.
예를 들어, X≥12일 때 H1을 채택하고 H0을 기각하는 검정을 생각할 때, {X≥12}={12≤X≤20}을 기각역이라 하고, 이때 사용되는 통계량 X를 검정통계량이라고 한다. 이 검정에 따르면, X의 실제 관찰값이 12 이상으로 나타나면 검정의 결론은 H0을 기각하게 되고, 12 미만으로 나타나면 H0을 기각하지 못하게 될 것이다.
여기서 알려져 있지 않은 p의 값이의 실제값이 0.4보다 클 때, 검정 결과가 H0의 기각이면 올바른 결정을 내린 것이 되지만, H0을 기각하지 못하면 오류를 범하게 된다. 그런데 X의 값이 0과 20 사이의 모든 정수값을 가질 수 있으므로, 이 두 가지 경우가 모두 일어날 수 있다.
역으로, p의 실제값이 0.4 이하일 때, 검정의 결론이 H0을 기각시지 않으면 올바른 결정을 한 것이지만, H0을 기각하게 되면 오류를 범하는 것이 된다.
어떤 검정을 하던지 위의 두 종류의 오류를 범할 가능성이 항상 존재하게 되는데, 이를 정리하면 다음과 같다.
 
 
표 1 […]
 
즉, 제 1종 오류는 H0이 참인데도 불구하고 H0을 기각시키는 잘못된 결정을 내리는 것을 말하며, 제 2종 오류는 H1이 참인데도 H0을 기각하지 못하는 잘못된 결정을 내리는 것을 말한다.
 
그래프 1 […]
 
앞에서 구한 제 1종 오류의 확률은 p의 값이 [0, 0.4] 사이에서 변할 때 서로 다른 값을 갖는다. 따라서, 두 종류의 오류를 범할 확률을 가능한 한 작게 해주는 것이 바람직한 검정일 것이다. 보통 한 종류의 오류를 범할 확률을 줄이려 하면 다른 종류의 오류를 범할 확률이 커지게 마련이다. 그런데 두 가지 오류를 범할 확률을 동시에 최소로 하는 검정법은 존재하지 않음이 알려져 있다. 그러므로 채택 여부가 실제적으로 중요한 의미를 줄 때에 범하는 오류의 확률을 미리 지정된 값이 이하로 하여 주는 검정법을 찾도록 하는 것이 통계학에서의 전통적인 방법이다. 대체적으로 제1종 오류는 제2종 오류보다 심각하게 간주되므로, 제1종 오류를 범할 확률을 미리 지정된 확률 이하로 하는 검정법을 찾는다.
이때, 제1종 오류를 범할 확률의 최대 허용한계를 유의수준이라 하고, 기호
 
a [알파: 편의상 a로 나타냄]
 
로 나타낸다.
다시 말하면, 유의수준은 제1종 오류를 범할 확률의 최대값으로, 대개 p의 값이 H0과 H1의 경계점일 때 결정된다. 예를 들면,
 
a= max(0≤p≤0.4) P(제1종 오류)
=P(제1종오류|p=0.4)
=P(X≥12|p=0.4)
=0.057
 
이제, 우리는 a의 값이 7% 이하가 되는 검정을 하기를 원한다고 하자.  다시 말하면, 이는 제1종 오류를 범할 확률을 최대 7%까지만 허용하겠다는 뜻이다. 이때,
 
(1) 검정 1: 기각역이 {X≥11}인 경우
a=P(X≥11|p=0.4)=0.128이므로 a의 값이 7%를 초과하게 되어 검정 1을 사용할 수 없다.
(2) 검정 2: 기각역이 {X≥12}인 경우
a=0.057이 되어 7% 이하이므로 검정 2를 사용할 수 있다.
(3) 검정 3: 기각역이 {X≥13}인 경우
a=0.021이 되어 7% 이하이므로 검정 3을 사용할 수 있다.
 
여기서 우리는 검정 2와 3을 모두 사용할 수 있으나 검정 2의 기각역이 검정 3의 기각역보다 범위가 넓으므로, 검정 2의 제2종 오류를 범할 확률이 항상 더 작음을 알 수 있다. 다시 말하면, 유의수준을 최대 7%까지 허용할 때, 위의 세 가지 검정 중 가장 좋은 검정은 검정 2이고, 이를 사용하면 제2종 오류를 범할 확률이 최소화된다.
 
만일, 우리가 기각역을 {X≥12} 대신 {X≥13} 또는 {X≥14}를 사용하면 어떠했을까?
위의 보기에서와 마찬가지로 치료된 환자가 14명이므로 H0을 기각하는 동일한 결론을 얻을 것이다. 그러나 기각역을 {X≥14}로 사용했다면, 이 때의 유의수준 a는
 
a=P(X≥14|P=0.4)=0.006
 
으로서 매우 작은 값이다.
 
이와 같은 유의수준 a의 값, 즉 표본 관측값에 의하여 귀무가설 H0을 기각시킬 수 있는 최소의 a의 값을 유의확률 이라고 한다.
따라서, 유의확률은 유의수준보다 작으며, 이 유의확률이 작으면 작을수록 H0의 기각에 대한 타당성은 더욱 뚜렷하다고 할 수 있다.
 
이상으로부터 가설 검정의 순서를 요약하면 다음과 같다.

가설 검정의 순서
[1] 귀무가설 H0과 대립가설 H1을 설정한다.
[2] 검정통계량을 선택한다.
[3] 유의수준 a를 정한다.
[4] 기각역을 구한다.
[5] 주어진 표본 자료를 이용하여 검정을 하고 결론을 유도한다.
[6] 유의확률을 계산하고 이를 해석한다.

  1. 달큼

    밸리에서 처음 방문합니다..

    그런데 네이버에서 통계관련해서 검색하다가 다시 들어오게 된거 있죠. 좀 신기하네요..ㅋ

    통계설명 잘 참고 하고 갑니다-u-