[통린이의 역습]여러분과 유의수준/확률의 다른 점 찾기! 🔎

조회수 13239

뉴스레터 콘텐츠로 바로 가기! 📚


오늘도 어김없이 돌아온 <통린이의 역습> 5️⃣번째 시간! 통린이(통계 왕초보🐥) 여러분은 증명하고 싶은 주장이 있으신가요? 이러한 주장을 증명하기 위해서는 어떠한 과정을 거쳐야 하는 것일까요? 바로 내가 증명하고 싶은 가설을 설정하고, 이러한 가설을 검정하기 위한 값을 활용하여 나의 주장이 옳은지, 그른지를 판단해야 하죠! 그렇다면, 가설을 검정하는 방법을 알아보기 위해서 함께 통계로 역습해 볼까요?🔥 


-에이블런 리사 드림💌 





전수조사 VS 표본조사 복습하기! 😏

#관심대상_전수조사 #조금만뽑으면_표본조사


통린이🐥는 통조림 회사의 품질 관리를 맡고 있는 연구원입니다. 통조림 회사에서 생산하는 가정용 통조림🥫의 무게는 100g이며, 해당 값을 크게 벗어나는 경우 불량품으로 취급하고 있습니다. 이때, 통린이🐥가 가정용 통조림의 품질을 관리하는 방법은 2가지가 있는데요! 

첫 번째는 모든 통조림의 무게를 하나씩 재는 ‘전수 조사’ 방법입니다. 하지만, 수 만개의 통조림 무게를 모두 측정한다면, 통린이의 팔은 너무 아프겠죠.😖 따라서 두 번째 방법이 더욱 적절할 텐데요. 두 번째 방법은 무작위로 통조림의 일부를 골라 선택된 통조림의 무게를 재는 ‘표본 조사’ 방법입니다. 즉, 표본으로 얻은 데이터를 바탕으로 전체 통조림의 무게를 추정하는 것이죠. (전수 조사와 표본 조사가 더 궁금하다면, 여기 클릭!) 하지만, 아무리 정교하게 표본을 뽑는다고 하더라도 오차가 발생할 수밖에 없는데요. 일반적으로 통계학에서는 허용하는 오차를 5%로 지정해 줍니다.




가설이 2가지로 나뉜다고요? 🤔

#귀무가설_기존의사실 #대립가설_기존의사실과반대


그렇다면 통조림🥫의 품질을 관리를 하는 통린이🐥가 해야하는 것은 무엇일까요? 바로 통조림의 무게가 100g인지 아닌지에 대한 가설을 세워야 합니다! 이때, 가설이란 연구를 통해서 발생할 것으로 예상되는 결과에 대한 구체적이고, 검증 가능한 예측을 말하죠! 이러한 가설은 귀무가설과 대립가설로 구분되는데요. 귀무가설(Null hypothesis)이란 기존에 사실이라고 받아들여지는 주장입니다. 통조림 회사에서 생산하는 가정용 통조림🥫의 무게는 100g으로 제조되었기 때문에 귀무가설은 ‘가정용 통조림의 무게는 100g이다’ (가정용 통조림의 무게 = 100g)가 될 수 있어요. 이러한 귀무가설은 반드시 등호(=)를 포함해서 작성이 되죠. 반면, 대립가설(Alternative hypothesis)이란 기존의 사실인 귀무가설과는 대립되는 연구자가 입증해야 하는 주장인데요. 통조림의 품질을 관리하는 통린이는 100g이 아닌 통조림을 찾고 싶어 하기 때문에 대립가설은 ‘가정용 통조림의 무게는 100g이 아니다’라고 할 수 있어요! 

그런데, 잠깐! 🖐🏻 대립가설인 ‘가정용 통조림의 무게는 100g이 아니다’가 여러 경우의 수가 있다는 사실, 눈치채셨나요?🙄 바로 통조림의 무게가 100g보다 작은 경우, 100g보다 큰 경우, 앞선 두 경우인 100g보다 작거나 100g보다 큰 경우를 합친 것도 있어요. 이처럼 대립가설은 단측 검정과 양측 검정에 따라서 다르게 표현될 수 있는데요! 먼저, 단측 검정이란 모집단인 가정용 통조림의 평균 무게인 100g을 기준으로 왼쪽이나 오른쪽 중 하나의 경우만 고려해 주는 것입니다. 왼쪽을 고려하면 ‘가정용 통조림의 무게는 100g보다 작다’ (가정용 통조림의 무게 < 100g)는 것이 되며, 오른쪽을 고려하면 ‘가정용 통조림의 무게는 100g보다 크다’ (가정용 통조림의 무게 > 100g)는 것이 되죠. 양측 검정이란, 모집단인 가정용 통조림의 평균 무게인 100g을 기준으로 왼쪽과 오른쪽의 경우를 모두 고려해 주는 것으로 ‘가정용 통조림의 무게는 100g이 아니다’ (가정용 통조림의 무게 ≠ 100g)가 될 수 있어요.





오류도 2가지로 나뉜다고요? 😮

#1종오류_참인_귀무가설_기각 #2종오류_거짓인_귀무가설_채택


앞선 내용을 통해 귀무가설과 대립가설에 대해 알아보았는데요. 연구자인 통린이🐥는 대립가설을 입증하고 싶어 합니다. 따라서 ‘가정용 통조림의 무게는 100g이다’라는 귀무가설을 세우고, 이러한 귀무가설을 기각할 수 있는 ‘가정용 통조림의 무게는 100g이 아니다’라는 증거를 수집하죠!


이렇게 귀무가설을 기각해야 하는 통린이🐥는 2가지 오류를 범할 수 있는데요. 이러한 2가지 오류를 ‘제 1종 오류’와 ‘제 2종 오류’라고 부릅니다. ‘제 1종 오류’는 귀무가설이 참인데도, 귀무가설을 기각하고 대립가설을 선택하는 경우입니다. 즉 가정용 통조림의 무게가 100g이지만, 100g이 아니라고 잘못 판단하는 것이죠. ‘제 2종 오류’는 귀무가설이 거짓임에도, 귀무가설을 기각하지 않고 채택하는 경우입니다. 즉 가정용 통조림의 무게가 100g이 아니지만, 100g이라고 잘못 판단하는 것이죠. (참인 귀무가설을 채택하거나 거짓인 귀무가설을 기각하는 것은 옳은 결정입니다.)




유의수준ꞏ확률의 다른점 찾기! 🔎

#유의수준_α_알파 #유의확률_p-value_p-값_피벨류


지금까지 가설의 2가지 종류인 귀무가설과 대립가설, 오류의 2가지 종류인 제 1종 오류와 제 2종 오류에 대해 살펴보았는데요. 그렇다면 연구자인 통린이🐥가 대립가설을 입증하기 위하여 귀무가설을 기각하는 방법을 알아보도록 해요! 이때, 단측 검정과 양측 검정의 해석이 다르게 적용되는데요. 먼저, 단측 검정 방법 중에서도 ‘가정용 통조림의 무게는 100g보다 크다’ (가정용 통조림의 무게 > 100g)는 상황부터 살펴볼게요! 해당 방법을 이해한다면, ‘100g보다 작다’는 상황도 비슷하게 생각해 주면 되죠! (이때, 통계 값을 더욱 쉽게 계산하기 위해 표준정규분포로 바꿔주는데요. 표준정규분포가 궁금하다면, 여기 클릭!)



귀무가설을 기각하거나 채택하는 기준이 되는 확률은 무엇일까요? 🤷🏻‍♀️🤷🏻‍♂️ 바로 유의수준인데요! 유의수준(Level of Significance)은 제 1종 오류의 위험성을 부담하는 최대 확률로 α(알파)라고 부르며 0.05의 값으로 주로 사용해요. 즉, 앞서 살펴보았던 통계학에서 허용하는 오차인 5%를 의미하며, 제 1종 오류가 일어날 확률이 최대 5%라는 의미이죠! 위 사진에서도 알 수 있듯이 표준정규분포에서 유의수준(α)의 면적인 0.05를 하늘색으로 표시했어요. (이때, 신뢰할 수 있는 정도인 신뢰수준은 ‘1-유의수준’으로, 95%(1-0.05=0.95)로 계산되며 신뢰구간을 100번을 구했을 때, 해당 신뢰구간에 가정용 통조림의 모평균인 100g은 95번 포함된다고 해석할 수 있어요. 표준정규분포에서 하늘색 면적 이외의 면적인 0.95를 신뢰수준으로 이해하면 됩니다) 


여기서 또 하나의 개념인 유의확률이 등장하는데요. 유의확률(Significance Probability)은 귀무가설이 옳다고 가정했을 때, 통계치가 관측될 확률로, p-value(피-밸류) 또는 P-값(피-값)이라고 불러요. 이제 유의수준과 유의확률을 비교하여 귀무가설을 채택하거나 기각할 수 있는데요. 결론을 먼저 공개하면, 유의확률(p-값)이 유의수준(α)인 0.05보다 작다면 귀무가설을 기각하고 대립가설을 채택합니다. 그 이유는 무엇일까요? 🤷🏻‍♀️🤷🏻‍♂️ 어떤 사건이 우연히 발생할 확률이 0.05보다 작을 가능성은 거의 없으며 만약 발생하더라도 그것은 우연히 일어난 것(귀무가설)이 아니라 유의(대립가설)했기 때문에 일어났다고 해석합니다. 따라서 귀무가설을 기각하고, 대립가설을 채택하는 것이죠!



그렇다면 위의 그림을 통해 유의수준(α)과 유의확률(p-값)을 비교하여 귀무가설을 채택하거나 기각해보도록 해요! 먼저, 표준정규분포에 유의확률(p-값)의 면적을 빨간색 빗금으로 추가해주었어요. 만약 왼쪽 사진과 같이 빨간색 유의확률(p-값)의 면적이 하늘색 유의수준(α)인 0.05보다 작다면 귀무가설을 기각하고, 대립가설을 채택합니다. 즉, ‘가정용 통조림의 무게는 100g이다’라는 귀무가설을 기각하고, ‘가정용 통조림의 무게는 100g보다 크다’는 대립가설을 채택하는 것이죠! 반대로 오른쪽 사진과 같이 빨간색 유의확률(p-값)의 면적이 하늘색 유의수준(α)인 0.05보다 크다면 귀무가설을 기각하지 못하고, 채택하는데요. 따라서 ‘가정용 통조림의 무게는 100g이다’라는 귀무가설이 채택되는 것이죠!



마지막으로 양측검증의 유의수준(α)과 유의확률(p-값)을 살펴보도록 할텐데요! 바로 ‘가정용 통조림의 무게는 100g이 아니다’라는 대립가설을 채택할지 기각할지 알아보도록 해요. 양측검정에서 사용되는 유의수준(α) 개념은 단측검정과 동일합니다. 이때, 양측인 왼쪽과 오른쪽의 경우를 모두 고려해 줘야 하기 때문에 위 사진에서도 알 수 있듯이 유의수준(α)인 0.05를 반으로 나눈 0.025(α/2)를 표준정규분포의 왼쪽과 오른쪽에 하늘색 면적으로 표시했어요. 이때, 여전히 유의수준(α)은 왼쪽의 0.025와 오른쪽의 0.025를 더한 0.05가 된답니다!


양측검정의 유의확률(p-값)에 관한 해석은 단측검정의 유의확률(p-값)과 동일한데요. 단 한 가지 다른 점은 양측검정의 경우, 앞서 계산한 유의수준(α)인 0.05를 반으로 나눈 값인 0.025와 유의확률(p-값)을 비교하여 귀무가설을 채택할지 기각할지 결정해 준다는 것입니다. 하지만 앞선 두 개의 값인 0.025와 유의확률(p-값)에 각각 2씩 곱해준다면, 0.05와 2*유의확률(2를 곱한 p-값)이 됩니다. 이러한 계산을 한다면, 유의수준(α)을 0.05로 맞춰줄 수 있다는 장점이 생기게 되는 것이죠! 즉, 양측검정의 유의확률(p-값)에 2를 곱하여 0.05의 유의수준(α)과 비교해 준다는 것이 차이점입니다. 


지금까지 통린이🐥와 함께 통계에서 중요하게 사용되는 가설인 귀무가설과 대립가설을 알아본 후,  이러한 가설들로 발생하는 오류인 제 1종 오류와 제 2종 오류를 살펴보았습니다. 더 나아가 양측검정과 단측검정 별, 유의수준과 유의확률의 비교하는 방법을 통해 귀무가설을 기각할 것인지 채택할 것인지도 배워보았죠! 점차 성장하고 있는 통린이🐥, 오늘도 미션 클리어😎



지금 이 콘텐츠 공유하기👇