[통린이의 역습]확률 추출방법, 드루와 드루와! 🤲🏻

<통린이의 역습>이 궁금하다면, 여기 클릭🐥



오늘도 어김없이 돌아온 <통린이의 역습> 4️⃣번째 시간! 통린이(통계 왕초보🐥) 여러분은 일상생활에서 흔하게 경험하는 로또 추첨이나 선거 출구 조사에도 확률 추출방법이 숨어있다는 사실, 알고 계셨나요? 이러한 확률 추출방법은 무작위 또는 일정한 간격, 특정한 층이나 집단을 기준으로 계산할 수 있는데요. 과연 어떠한 종류의 확률 추출방법이 있는지 알아보기 위해서 함께 통계로 역습해 볼까요?🔥
 

-에이블런 리사 드림💌





💬 모집단과 표본을 복습해요! 📊

#관심대상_모집단 #조금만뽑으면_표본 


본격적인 확률 추출방법에 대해 살펴보기 전, 모집단과 표본의 개념을 알고 있어야 하는데요. 통린이🐥와 함께하는 복습시간입니다.📚 지난 <통린이의 역습> 1탄에서 공부한 모집단과 표본의 뜻을 기억하시나요? (기억 안 난다면, 여기 클릭!) 모집단이란 관심의 대상이 되는 전체 집단이며, 표본은 모집단에서 일부를 뽑아낸 결과였죠. 이때, 전체 집단을 전부 조사하는 전수 조사가 불가능할 정도로 모집단이 크다면, 전체집단을 조사하는 것은 시간과 비용 측면에서 비효율적입니다. 따라서 모집단의 일부를 추출하여 조사하는 표본 조사 방법을 통해 표본의 특성을 파악하고, 그것을 바탕으로 모집단의 특성을 추측(추정)해야 해요. 여기서 통린이는 한 가지 궁금증이 생기게 됩니다.🙋🏻‍♀️🙋🏻‍♂️ 


🐥 : 그렇다면 모집단에서 표본을 어떻게 추출하는 것일까요?

통린이가 예리한 질문을 했어요. 이러한 표본 추출의 방법은 크게 2가지로 ‘확률 표본추출’과 ‘비확률 표본추출’로 구분되는데요. (비확률 표본추출은 뒷부분에서 좀 더 자세히 알아봐요.) 확률 표본추출이란 내가 연구하고자 하는 대상이 표본으로 추출될 확률이 알려져 있는 경우로 모집단의 대표성이 높게 나타나 일반화가 가능합니다. 이러한 확률 표본추출의 종류로는 단순 무작위 추출, 계통 추출, 층화 추출, 군집 추출이 있죠! 그렇다면, 통린이🐥와 함께 각각의 확률 추출방법을 살펴보도록 할게요.




💬 4가지 확률 추출방법 파헤치기 🧐 

#단순무작위추출 #계통추출 #층화추출 #군집추출 



먼저, 가장 기본적인 표본 추출방법인 단순 무작위 추출에 대해 알아보도록 해요. 이름에서도 알 수 있듯이 단순 무작위 추출이란 단순하게 무작위로 추출하는 표본 추출방법으로 모집단의 개체들이 표본으로 선택될 확률이 동일합니다. 위의 사진에서는 10개의 모집단에서 3개의 표본을 무작위로 추출하였는데요. 이때, 모든 개체들이 표본으로 선택될 확률은 3/10으로 동일하죠.


이러한 단순 무작위 추출은 45개의 숫자 중 6개의 숫자를 무작위로 선택하는 로또에 적용됩니다. 단순 무작위 추출은 이해하기 쉽다는 장점이 있지만, 대규모인 모집단에서 표본을 뽑는 것은 쉽지 않기 때문에 소규모에 조사나 기초 단계에서만 사용된다는 단점이 있습니다.



이번에는 계통 추출을 살펴볼 텐데요. 계통 추출이란 모집단에 있는 모든 집단에 임의의 순서를 부여하고, 일정한 간격으로 표본을 추출하는 방법입니다. 위 사진에서는 12개의 모집단에서 4명의 표본을 선정하려고 하는데요. 이때 각각의 모집단에 순서(1~12)를 부여했고, 첫번째 표본을 3번째 사람으로 선정했기 때문에 일정한 간격으로 6번째, 9번째, 12번째 사람을 표본으로 선정한 것이죠.


이러한 계통 추출은 출구 조사에서 유용하게 사용이 됩니다. 출구조사는 전체 유권자들의 특성을 반영해야 하기 때문에 치우침 없이 랜덤으로 선정되는 것이 중요한데요. 따라서 계통 추출을 활용해 최초 유권자를 기준으로 하여 5명을 간격으로 1명을 랜덤하게 뽑는 것이죠! 계통 추출은 손쉽게 무작위적인 표본을 추출할 수 있다는 장점이 있지만, 특정 패턴을 가진 모집단이라면 왜곡된 결과가 나온다는 단점이 있어요. (위 사진처럼 3의 배수만 표본으로 선정했는데, 이러한 표본들이 모두 특정한 패턴인 극단적 정치 성향을 가진다면 왜곡된 출구조사 결과가 나오겠죠? 😵)



다음으로는 층화 추출을 파헤쳐 보아요. 층화 추출이란 각 표본을 비슷한 특징으로 묶어 층을 나눈 후, 각 층에서 표본을 추출하는 방법입니다. 위 사진처럼 A 학교에는 3학년의 학생 수가 1,2학년의 2배라고 가정해 볼게요. 이때 전체 학생을 대상으로 학교에 대한 만족도를 조사한다면, 각 학년별로 표본의 수를 동일하게 추출하는 것이 맞을까요? 정답은 아닙니다! 🙅🏻‍♀️🙅🏻‍♂️ 만약 1,2,3학년의 표본의 수를 동일하게 추출한다면 인원수가 2배로 많은 3학년의 특성이 무시되는 것이죠. 따라서 층화 추출을 활용하여 모집단의 특성인 학년별로 층을 나누고, 각 집단 내에서 모집단의 크기와 비례하게 표본을 뽑아 1학년 1명, 2학년 1명, 3학년 2명을 추출했어요. 

이러한 층화 추출은 통계 조사에서 지역이나 성별, 연령 등을 고려할 때 적용됩니다. 층화 추출은 층을 나눠 계산하기 때문에 표본의 크기가 크지 않아도 대표성이 보장된다는 장점이 있지만, 모집단의 층에 대한 정확한 정보를 알아야 적용할 수 있다는 단점이 있어요. (위 사진처럼 1,2,3학년의 학생수를 정확히 알아야 각 층의 표본의 수를 정할 수 있겠죠? 😮)



마지막으로 군집 추출을 살펴보도록 하겠습니다. 군집 추출이란 모집단을 여러 개의 군집으로 형성하고, 단순 무작위 추출로 군집을 추출하는 방법인데요. 이번에는 위 사진처럼 A 학교 1학년 (1반~4반)의 학교 만족도를 조사한다고 생각해 볼게요. 이때, 각 반을 하나의 무리인 군집으로 생각하여 1,2,3,4반의 군집을 형성하였고, 군집에서 무작위 추출을 하여 4반을 표본으로 선정하였어요. 

이러한 예시와 유사하게 군집분석은 대규모 실태조사를 위해 도/특별시/광역시를 무작위 추출하는 방법에 적용됩니다. 군집 추출은 전체 모집단의 목록을 사용하지 않아 시간과 비용이 적게 든다는 장점이 있어요. (위 사진에서 1,2,3,4반의 목록을 전체 조사하지 않고, 군집으로 추출된 4반만 조사했죠.) 하지만, 집단 안의 표본들이 너무 동일하다면, 대표성이 떨어진다는 단점을 가지고 있습니다. (위 사진에서 4반은 초록색, 파란색, 핑크색으로 적절하게 이질적으로 뽑혔지만, 만약 모두 동일한 요소라면 대표성이 떨어져요.)


지금까지 통린이🐥와 함께 확률 표본추출인 단순 무작위 추출, 계통 추출, 층화 추출, 군집 추출의 개념과 장단점을 살펴보았어요. 이제 확률 표본추출방법 마스터 성공! 😎




💬 비확률 표본추출도 있다고요? 

#편의추출 #유의추출 #눈덩이추출


통린이🐥는 4가지 확률 추출방법인 단순무작위 추출, 계통 추출, 층화 추출, 군집 추출의 개념 배운 후, 통계에 자신감이 생겼습니다.✌🏻 따라서 4가지 확률 추출방법 이외의 비확률 추출방법에도 관심을 갖게 되는데요! 비확률 추출방법이란 내가 연구하고자 하는 대상이 표본으로 추출될 확률이 사전에 알려지지 않고, 조사하는 사람의 편의나 판단에 의존해 표본을 추출하는 경우입니다. 확률 추출방법보다는 모집단의 대표성이 낮지만, 간편하고 비용이 적게 든다는 장점이 있죠. 그렇다면, 통린이와 함께 비확률 추출방법인 편의 추출과 유의 추출, 눈덩이 추출도 역습해 볼까요?🔥


  • 편의 추출 - 모집단에 대한 정보가 없을 경우, 편리함에 초점을 맞춰 길거리 설문조사와 같이 조사자가 임의로 표본을 선정하는 방법 

  • 유의 추출 - 조사자가 가지고 있는 경험이나 지식을 통해 표본을 선정하는 방법

  • 눈덩이 추출 -  폐쇄적인 집단의 경우, 조사가 어렵기 때문에 처음에 선정하는 표본을 조사자가 선정하고, 이들에게로부터 다음 표본을 추천받아 눈덩이처럼 늘려가는 방법




이번주 에이블레터 어떠셨나요?
좋았어요😁 아쉬웠어요😕

지난 <통린이의 역습> 다시 보기
모집단과 표본의 차이가 뭔데!
데이터라고 다 같지 않다고요?🤨
여러분의 취침-출근 시간의 인과관계는? 


지금 이 콘텐츠 공유하기👇