Professional Insights/Technology & Innovation

[내가 이해하는 통계용어 100]1.P-value

Melissa Levasseur 2015. 11. 29. 13:44

"나는 OO동 살인사건의 범인이 김세모 같아!!!!" -> "그래 모든 증거들이 김세모가 범인이라고 말하고 있어!"(귀무가설)

  -> "다른 사람이 범인이 될 수 있지 않을까?"(대립가설)


"그런데 김세모가 범인이 아닌데 유죄 판결을 받으면 어떡하지?"(1종 오류)

"아니면 이네모가 살인범이었는데 죗값을 치르지 못하면 어떡하지?"(2종 오류)

= 대부분의 사람들이 1종 오류가 더 심한 오류라고 느낌! (억울함 때문인가??)


 "김세모가 범인이 아닌데 유죄판결을 받을 확률"(1종 오류를 범하게 될 확률 = P-VALUE) 

=> "다른 사람이 범인이 될 수 있다는 것을 지지해주는 의견"(대립가설 지지) 즉, P-VALUE가 높을 수록 다른 사람이 범인 일 가능 성이 높아짐!!!


"그런데 오류를 범하더라도 이 정도까지는 감당할 수 (봐줄 수) 있지 않나?"(유의 수준 = a

= 법에 있어서 이런 건 없어야 하겠지만.... 통계학 적으로 봤을 때!!!


유의 수준 1%, 5%, 10%를 단위로 쓰고 있다. 대부분 5%(0.05)를 쓰고 있는 데, 오류 결과의 심각성을 고려하여 판정의 기준이 변하기도 한다.


p-value =< 유의 수준(a=0.05) (감당할 수 있는 범위 내에서 오류가 범해지는 거니까) 귀무가설 기각

p-value > 유의 수준(a=0.05) (감당할 수 없는 범위 내에서 범해지는 오류!!) 귀무가설이 역시 맞았어..


to be continued..