Sunday, September 4, 2016

P-Value (유의확률)

P-value에 대해서 알기전에 귀무가설(Null Hypothesis: H0)과 대립가설(Alternative Hypothesis: H1)에 대해서 이해를 해야 합니다.
우리가 어떤 가설을 만들었을 때, 가설 검정 절차에서 선행되어야 할 부분이 귀무가설과 대립가설의 설정이고, 두 개의 가설이 정반대로 설정되어야 합니다.

귀무가설, 대립가설 설정 방법

귀무가설은 기존에 일반적으로 받아들여지고 있는 내용이며,아래와 같이 세 가지 유형이 있습니다.
~와 같다. (=), ~ 이상이다. (>=), ~ 이하이다. (=<)
그리고 대립가설은 귀무가설과 반대되는 새롭게 검정하고자 하는 주장입니다. 귀무가설과 정반대로 설정해야 하고 세 가지 유형이 있습니다.
~ 와 같지 않다. (!=), ~ 미만이다. (<), ~ 초과이다. (>)
가설 검정은 “같다”, “크다”, “작다”의 세 가지 내에서 이루어집니다. 이 상황을 벗어난 표현은 수학 특성상 처리하기가 어렵기 때문입니다.
이제 예제를 보면,
제품의 불량률이 5%이다. 하지만 제품에 대한 고객 Claim이 자주 일어나서 불량률이 5% 보다 클 수 도 있다는 주장이 나오고 있다. 이 부분을 검정 하기 위한 귀무가설과 대립가설을 설정하시오.

대립가설로 불량률이 5%보다 클 수 도 있다는 주장이 나왔으므로
H1: p > 0.05
로 설정합니다.

귀무가설은 대립가설과 정반대이므로 아래처럼 설정합니다.
H0: p <= 0.05

P-value 이해하기

P-value는 귀무가설이 올바르다는 전제를 가지고 통계값이 실제로 관측된 값 이상일 확률을 의미합니다. 관찰된 데이터가 귀무가설을 지지하는 정도를 보여줍니다. (= 유의수준)
P-value가 작을 수록 귀무가설을 지지하는 정도가 낮아지므로 귀무가설은 기각되게 됩니다. (=대립가설 채택)
즉, 귀무가설이 맞다고 가정함으로써 귀무가설을 기준으로 삼고 관찰된 검정 통계량이 얼마나 멀리 떨어져있는지 보는 것입니다.

위의 그래프처럼 P-value가 알려주는 것은 차이가 생겨나는 것이 우연한 것인지 변수에 따른 것인지에 대한 여부입니다.

일반적으로 95%의 신뢰구간이면 0.95의 신뢰수준으로 생각하시면 됩니다. 유의수준은 1에서 신뢰수준을 뺀 값입니다. (1– 0.95 = 0.05), P-value < 0.05 라고 하면 귀무가설이 일어날 확률이 5%이하인 것을 의미합니다. P-value를 가지고 모든 것을 판단 할 수는 없습니다. P-value는 관측되지 않은 사실들의 확률도 포함하고 있기 때문입니다.

유의확률은 가설이 옳다거나 차이에 대해서 알려주는 지표가 아니기 때문에 가설이 자료와 일치하는지 아닌지만 판별할 수 있습니다.

0 comments:

Post a Comment