
<노코드 머신러닝>이 궁금하다면, 여기 클릭📊
오늘도 어김없이 돌아온 <노코드 머신러닝> 2️⃣번째 시간! 어려운 프로그래밍 대신 평소에 자주 사용하는 엑셀로 머신러닝을 해볼 텐데요! 오늘은 순진하다는 의미인 ‘나이브’(Naive)와 ‘베이즈 정리’를 합친 나이브 베이즈를 알아보도록 하죠! 엑셀로 순진한 베이즈 정리인 ‘나이브 베이즈’ 하는 방법, 궁금하지 않으신가요? 이 뉴스레터를 보면 좋은 사람은? 👶🏻 : 러닝머신? 머신러닝? 머신러닝을 처음 들어보는 왕왕왕초보! 👲🏻 : 실무에서 사용하는 엑셀로 노코드 머신러닝 하고 싶으신 분! 👸🏻 : ‘나도 어디서 나이브 베이즈 해봤어~’ 라고 자랑하고 싶으신 분! -에이블런 리사 드림💌 |
💬 넌 왜 나이브 베이즈야?
#독립사건 #확률의곱 #순진한_베이즈정리
여러분, 지난 <노코드 머신러닝> 1탄의 베이즈 정리를 기억하시나요? (기억 안 난다면, 여기 클릭!) 베이즈 정리란 ‘두 확률변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리’인데요. 이러한 베이즈 정리가 순진해졌다고 해요.🥴 국어사전에 따르면, 순진하다는 것은 마음 꾸밈이 없고 순박한 것을 의미하는데요. 베이즈 정리가 순진하다는게 도대체 뭐야!😵
'나이브 베이즈’가 바로 순진한 베이즈 정리인데요. 순진하다는 의미인 ‘나이브’(Naive)와 ‘베이즈 정리’(Bayes' theorem)가 합쳐진 단어죠. 통계학적으로 순진하다는 의미인 ‘나이브’는 데이터들이 서로 완전히 독립적으로 발생하는 사건을 의미합니다. 여기서 중요한 핵심 단어는 독립인데요. (앗! 저는 대한‘독립’만세 밖에 모른다고요🤯)
통계학적으로 독립이란, 한 사건이 일어날 확률이 다른 사건이 일어날 확률에 영향을 미치지 않는다는 것을 의미해요. 여러분이 2개의 주사위를 던진다고 생각해 볼까요? 첫 번째 주사위의 눈금이 1️⃣이 나왔습니다. 이번에는 두 번째 주사위를 던져볼게요. 두 번째 주사위의 눈금은 4️⃣가 나왔어요! 그런데, 첫 번째 주사위의 눈금이 1️⃣이 나올 확률이 두 번째 주사위의 눈금이 4️⃣가 나올 확률에 영향을 미쳤을까요? NO! 🙅🏻♀️🙅🏻♂️ 따라서 두 주사위에 나타나는 눈금의 수는 독립이라고 말할 수 있어요.

이러한 특별한 ‘독립’은 신기한 특성을 가지고 있는데요. 독립인 경우, 사건이 동시에 일어날 확률은 각 사건의 확률 곱으로 나타낼 수 있다는 것이죠! 첫 번째 주사위의 눈금이 1️⃣이 나올 확률은 무엇일까요? 바로 6개의 눈금 중, 눈금 1️⃣ 하나가 나올 확률이기 때문에 1/6이 됩니다. 그렇다면, 두 번째 주사위의 눈금이 4️⃣가 나올 확률은 무엇일까요? 바로 6개의 눈금 중, 눈금 4️⃣ 하나가 나올 확률이기 때문에 1/6이 됩니다. 그렇다면, 첫 번째 주사위의 눈금이 1️⃣이 나오고, 두 번째 주사위의 눈금이 4️⃣가 동시에 나올 확률은 무엇일까요? 이때, 바로 독립의 신기한 특성이 적용되는데요. 첫 번째 주사위의 눈금이 1️⃣, 두 번째 주사위의 눈금이 4️⃣가 동시에 일어나는 경우인 교집합(∩)은 각 사건의 확률곱인 1/6*1/6으로 1/36이 됩니다.

💬 베이즈 정리 VS 나이브 베이즈
#베이즈정리는_1개조건 #나이브베이즈는_여러개조건
지금까지 나이브 베이즈에 대하여 열심히 알아보았어요. 나이브 베이즈는 ‘데이터들을 독립적이라고 생각하는 베이즈 정리’였죠! 그런데, 아직도 베이즈 정리와 나이브 베이즈의 차이점을 잘 모르시겠다고요? 🤷🏻♀🤷🏻♀🤷🏻♀ ‘베이즈 정리 VS 나이브 베이즈’ 뭐가 다른지 한눈에 알아보아요!
베이즈 정리와 나이브 베이즈의 차이점을 알기 위해서는 사후 확률을 떠올려야 해요. (사후 확률을 잘 모르시겠다면, 여기 클릭!) 사후 확률은 특정 사건이 발생한 후에 다른 사건이 발생할 확률이었죠. 이러한 사후 확률을 수식으로 나타내면 P(관심사|조건)로 작성했어요. 즉, 어떤 사건이 이미 일어났다는 조건이 있을 때, 다른 관심사 사건이 일어날 확률을 표현한 것이죠.
바로 여기서 베이즈 정리와 나이브 베이즈의 차이점이 나타납니다. 먼저, 베이즈 정리는 하나의 조건만 있어요. 하지만, 나이브 베이즈는 여러 개의 조건이 있으며, 이러한 조건들이 서로 독립인 것이랍니다!

💬 유튜브로 알아보는 나이브 베이즈
#조건부확률 #엑셀 #독립사건
그렇다면 나이브 베이즈를 유튜브 사례로 자세히 알아보도록 할게요. 지난 <노코드 머신러닝> 1탄의 베이즈 정리에 등장한 튜튜👱🏻♀️씨를 기억하시나요? (튜튜씨가 기억 안난다면, 여기 클릭!) 유튜브는 새로운 가입자인 튜튜👱🏻♀️씨를 사로잡기 위해 노력했었죠! 그래서 튜튜씨에게 여행 콘텐츠를 추천한 후, 그것을 시청한 튜튜씨가 좋아요를 누를 확률인 P(👍🏻|🛫)을 계산했습니다. 이러한 확률은 ‘여행 콘텐츠’를 시청한다는 1가지 조건이 있는 베이즈 정리였습니다.
하지만, 유튜브에 좋아요를 누르는 이유로는 다양한 콘텐츠뿐만 아니라 짧은 영상시간, 흥미로운 썸네일, 관련 국가 등 다양한 요인이 있을 수 있어요. 따라서 이번에는 튜튜👱🏻♀️씨에게 한국 채널의 여행 콘텐츠를 추천한 후, 그것을 시청한 튜튜씨가 좋아요를 누를 확률에 관심을 갖기로 하였습니다. 엇! 이번에는 한국 채널이라는 조건이 추가되었네요! 즉, ‘한국 채널’의 ‘여행 콘텐츠’를 시청한다는 2가지 조건이 있는 나이브 베이즈가 된 것이죠!
그렇다면 나이브 베이즈를 단계별로 알아보도록 해요. 먼저 튜튜👱🏻♀️씨가 ‘한국 채널’의 ‘여행 콘텐츠’를 시청한다는 2가지 조건이 있어요. (한국 채널은 이모티콘을 🇰🇷로 작성할게요!) 이 2가지 조건은 동시에 일어나기 때문에 교집합(∩)으로 묶어서 작성해 줘요. 즉, 조건인 ‘한국 채널이면서 여행 콘텐츠인 경우’는 막대(|)의 오른쪽에 적어야 하죠. 그렇다면, 우리의 최종 관심사는 무엇일까요? 바로 앞선 조건일 때, 튜튜씨가 유튜브에 좋아요나 싫어요 중 어떤 것을 누를지 알고 싶어요. 따라서 우리의 관심사인 ‘좋아요/싫어요’를 막대(|)의 왼쪽에 적어줬어요. 이때, 우리의 관심사가 ‘좋아요’라면, 그 확률은 P(👍🏻|🇰🇷∩🛫)로, ‘싫어요’라면 그 확률은 P(👎🏻|🇰🇷∩🛫)로 작성할 수 있죠. 그렇다면, 아래의 사진을 봐볼까요? 왼쪽의 확률은 한국 채널의 여행 콘텐츠를 시청하였을 때, 좋아요를 누를 확률이며 오른쪽 확률은 한국 채널의 여행 콘텐츠를 시청하였을 때, 싫어요를 누를 확률입니다. 만약 왼쪽 확률이 더 크게 계산된다면 우리는 “좋아요”를 누를 것이라고 예측하고, 오른쪽 확률이 더 크게 계산된다면 우리는 “싫어요”를 누를 것이라고 예측하게 되죠!

그런데, 혹시 잊으신 건 없으신가요? 🙄🙄🙄 앞에서 배운 ‘독립’의 개념은 어디에 사용되나요? 바로 지금이요! 우리는 독립인 경우, 사건이 동시에 일어날 확률을 각 사건의 확률 곱으로 나타낼 수 있다고 말했어요. 먼저, 한국 채널의 여행 콘텐츠를 시청하였을 때, 좋아요를 누를 확률인 P(👍🏻|🇰🇷∩🛫)을 살펴볼게요. 나이브 베이즈는 데이터들이 모두 독립으로 일어난다고 가정해요. 따라서 해당 경우의 사건이 일어날 확률을 모두 곱하면 계산할 수 있죠. 따라서, 좋아요를 누를 확률인 P(👍🏻)와 좋아요를 눌렀을 때 한국 채널일 확률인 P(🇰🇷|👍🏻), 좋아요를 눌렀을 때 여행 콘텐츠일 확률인 P(🛫|👍🏻)의 곱과 유사하답니다!

그렇다면, 한국 채널의 여행 콘텐츠를 시청하였을 때, 싫어요를 누를 확률인 P(👎🏻|🇰🇷∩🛫)도 싶게 계산할 수 있겠죠! 바로 싫어요를 누를 확률인 P(👎🏻)와 싫어요를 눌렀을 때 한국 채널일 확률인 P(🇰🇷|👎🏻), 싫어요를 눌렀을 때 여행 콘텐츠일 확률인 P(🛫|👎🏻)의 곱과 유사하답니다!

지금까지 열심히 계산한 2개의 확률인 P(👍🏻|🇰🇷∩🛫)와 P(👎🏻|🇰🇷∩🛫)를 비교해 줄 일만 남았어요. 만약 한국 채널의 여행 콘텐츠를 시청하였을 때, 좋아요를 누를 확률인 P(👍🏻|🇰🇷∩🛫)이 더 크다면 유튜브는 튜튜👱🏻♀️씨에게 ‘한국 채널’의 ‘여행 콘텐츠’인 한국 여행 브이로그를 추천해줄 가능성이 크게 되겠네요! 나이브 베이즈 미션클리어 😎

엑셀로 따라하는 나이브 베이즈 관련 영상 보러가기
지금까지 유튜브 사례로 알아본 나이브 베이즈, 엑셀로 해보고 싶으시다고요? 그럼 위에 있는 유튜브 사진을 클릭해 주세요! 🔼🔼🔼
이번주 에이블레터 어떠셨나요?
좋았어요😁 아쉬웠어요😕
지난 <노코드 머신러닝> 다시 보기
엑셀로 베이즈 정리 따라하기


이 뉴스레터 공유해주기💌
교육서비스 경험을 혁신하는 에이블런입니다. 📣
● 비전공자를 위한 데이터 활용교육 > ABLEARN
● 1인 교육담당자를 위한 온라인 교육지원서비스 > &SPACE
<노코드 머신러닝>이 궁금하다면, 여기 클릭📊
오늘도 어김없이 돌아온 <노코드 머신러닝> 2️⃣번째 시간! 어려운 프로그래밍 대신 평소에 자주 사용하는 엑셀로 머신러닝을 해볼 텐데요! 오늘은 순진하다는 의미인 ‘나이브’(Naive)와 ‘베이즈 정리’를 합친 나이브 베이즈를 알아보도록 하죠! 엑셀로 순진한 베이즈 정리인 ‘나이브 베이즈’ 하는 방법, 궁금하지 않으신가요?
이 뉴스레터를 보면 좋은 사람은?
👶🏻 : 러닝머신? 머신러닝? 머신러닝을 처음 들어보는 왕왕왕초보!
👲🏻 : 실무에서 사용하는 엑셀로 노코드 머신러닝 하고 싶으신 분!
👸🏻 : ‘나도 어디서 나이브 베이즈 해봤어~’ 라고 자랑하고 싶으신 분!
-에이블런 리사 드림💌
💬 넌 왜 나이브 베이즈야?
#독립사건 #확률의곱 #순진한_베이즈정리
여러분, 지난 <노코드 머신러닝> 1탄의 베이즈 정리를 기억하시나요? (기억 안 난다면, 여기 클릭!) 베이즈 정리란 ‘두 확률변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리’인데요. 이러한 베이즈 정리가 순진해졌다고 해요.🥴 국어사전에 따르면, 순진하다는 것은 마음 꾸밈이 없고 순박한 것을 의미하는데요. 베이즈 정리가 순진하다는게 도대체 뭐야!😵
'나이브 베이즈’가 바로 순진한 베이즈 정리인데요. 순진하다는 의미인 ‘나이브’(Naive)와 ‘베이즈 정리’(Bayes' theorem)가 합쳐진 단어죠. 통계학적으로 순진하다는 의미인 ‘나이브’는 데이터들이 서로 완전히 독립적으로 발생하는 사건을 의미합니다. 여기서 중요한 핵심 단어는 독립인데요. (앗! 저는 대한‘독립’만세 밖에 모른다고요🤯)
통계학적으로 독립이란, 한 사건이 일어날 확률이 다른 사건이 일어날 확률에 영향을 미치지 않는다는 것을 의미해요. 여러분이 2개의 주사위를 던진다고 생각해 볼까요? 첫 번째 주사위의 눈금이 1️⃣이 나왔습니다. 이번에는 두 번째 주사위를 던져볼게요. 두 번째 주사위의 눈금은 4️⃣가 나왔어요! 그런데, 첫 번째 주사위의 눈금이 1️⃣이 나올 확률이 두 번째 주사위의 눈금이 4️⃣가 나올 확률에 영향을 미쳤을까요? NO! 🙅🏻♀️🙅🏻♂️ 따라서 두 주사위에 나타나는 눈금의 수는 독립이라고 말할 수 있어요.
이러한 특별한 ‘독립’은 신기한 특성을 가지고 있는데요. 독립인 경우, 사건이 동시에 일어날 확률은 각 사건의 확률 곱으로 나타낼 수 있다는 것이죠! 첫 번째 주사위의 눈금이 1️⃣이 나올 확률은 무엇일까요? 바로 6개의 눈금 중, 눈금 1️⃣ 하나가 나올 확률이기 때문에 1/6이 됩니다. 그렇다면, 두 번째 주사위의 눈금이 4️⃣가 나올 확률은 무엇일까요? 바로 6개의 눈금 중, 눈금 4️⃣ 하나가 나올 확률이기 때문에 1/6이 됩니다. 그렇다면, 첫 번째 주사위의 눈금이 1️⃣이 나오고, 두 번째 주사위의 눈금이 4️⃣가 동시에 나올 확률은 무엇일까요? 이때, 바로 독립의 신기한 특성이 적용되는데요. 첫 번째 주사위의 눈금이 1️⃣, 두 번째 주사위의 눈금이 4️⃣가 동시에 일어나는 경우인 교집합(∩)은 각 사건의 확률곱인 1/6*1/6으로 1/36이 됩니다.
💬 베이즈 정리 VS 나이브 베이즈
#베이즈정리는_1개조건 #나이브베이즈는_여러개조건
지금까지 나이브 베이즈에 대하여 열심히 알아보았어요. 나이브 베이즈는 ‘데이터들을 독립적이라고 생각하는 베이즈 정리’였죠! 그런데, 아직도 베이즈 정리와 나이브 베이즈의 차이점을 잘 모르시겠다고요? 🤷🏻♀🤷🏻♀🤷🏻♀ ‘베이즈 정리 VS 나이브 베이즈’ 뭐가 다른지 한눈에 알아보아요!
베이즈 정리와 나이브 베이즈의 차이점을 알기 위해서는 사후 확률을 떠올려야 해요. (사후 확률을 잘 모르시겠다면, 여기 클릭!) 사후 확률은 특정 사건이 발생한 후에 다른 사건이 발생할 확률이었죠. 이러한 사후 확률을 수식으로 나타내면 P(관심사|조건)로 작성했어요. 즉, 어떤 사건이 이미 일어났다는 조건이 있을 때, 다른 관심사 사건이 일어날 확률을 표현한 것이죠.
바로 여기서 베이즈 정리와 나이브 베이즈의 차이점이 나타납니다. 먼저, 베이즈 정리는 하나의 조건만 있어요. 하지만, 나이브 베이즈는 여러 개의 조건이 있으며, 이러한 조건들이 서로 독립인 것이랍니다!
💬 유튜브로 알아보는 나이브 베이즈
#조건부확률 #엑셀 #독립사건
그렇다면 나이브 베이즈를 유튜브 사례로 자세히 알아보도록 할게요. 지난 <노코드 머신러닝> 1탄의 베이즈 정리에 등장한 튜튜👱🏻♀️씨를 기억하시나요? (튜튜씨가 기억 안난다면, 여기 클릭!) 유튜브는 새로운 가입자인 튜튜👱🏻♀️씨를 사로잡기 위해 노력했었죠! 그래서 튜튜씨에게 여행 콘텐츠를 추천한 후, 그것을 시청한 튜튜씨가 좋아요를 누를 확률인 P(👍🏻|🛫)을 계산했습니다. 이러한 확률은 ‘여행 콘텐츠’를 시청한다는 1가지 조건이 있는 베이즈 정리였습니다.
하지만, 유튜브에 좋아요를 누르는 이유로는 다양한 콘텐츠뿐만 아니라 짧은 영상시간, 흥미로운 썸네일, 관련 국가 등 다양한 요인이 있을 수 있어요. 따라서 이번에는 튜튜👱🏻♀️씨에게 한국 채널의 여행 콘텐츠를 추천한 후, 그것을 시청한 튜튜씨가 좋아요를 누를 확률에 관심을 갖기로 하였습니다. 엇! 이번에는 한국 채널이라는 조건이 추가되었네요! 즉, ‘한국 채널’의 ‘여행 콘텐츠’를 시청한다는 2가지 조건이 있는 나이브 베이즈가 된 것이죠!
그렇다면 나이브 베이즈를 단계별로 알아보도록 해요. 먼저 튜튜👱🏻♀️씨가 ‘한국 채널’의 ‘여행 콘텐츠’를 시청한다는 2가지 조건이 있어요. (한국 채널은 이모티콘을 🇰🇷로 작성할게요!) 이 2가지 조건은 동시에 일어나기 때문에 교집합(∩)으로 묶어서 작성해 줘요. 즉, 조건인 ‘한국 채널이면서 여행 콘텐츠인 경우’는 막대(|)의 오른쪽에 적어야 하죠. 그렇다면, 우리의 최종 관심사는 무엇일까요? 바로 앞선 조건일 때, 튜튜씨가 유튜브에 좋아요나 싫어요 중 어떤 것을 누를지 알고 싶어요. 따라서 우리의 관심사인 ‘좋아요/싫어요’를 막대(|)의 왼쪽에 적어줬어요. 이때, 우리의 관심사가 ‘좋아요’라면, 그 확률은 P(👍🏻|🇰🇷∩🛫)로, ‘싫어요’라면 그 확률은 P(👎🏻|🇰🇷∩🛫)로 작성할 수 있죠. 그렇다면, 아래의 사진을 봐볼까요? 왼쪽의 확률은 한국 채널의 여행 콘텐츠를 시청하였을 때, 좋아요를 누를 확률이며 오른쪽 확률은 한국 채널의 여행 콘텐츠를 시청하였을 때, 싫어요를 누를 확률입니다. 만약 왼쪽 확률이 더 크게 계산된다면 우리는 “좋아요”를 누를 것이라고 예측하고, 오른쪽 확률이 더 크게 계산된다면 우리는 “싫어요”를 누를 것이라고 예측하게 되죠!
그런데, 혹시 잊으신 건 없으신가요? 🙄🙄🙄 앞에서 배운 ‘독립’의 개념은 어디에 사용되나요? 바로 지금이요! 우리는 독립인 경우, 사건이 동시에 일어날 확률을 각 사건의 확률 곱으로 나타낼 수 있다고 말했어요. 먼저, 한국 채널의 여행 콘텐츠를 시청하였을 때, 좋아요를 누를 확률인 P(👍🏻|🇰🇷∩🛫)을 살펴볼게요. 나이브 베이즈는 데이터들이 모두 독립으로 일어난다고 가정해요. 따라서 해당 경우의 사건이 일어날 확률을 모두 곱하면 계산할 수 있죠. 따라서, 좋아요를 누를 확률인 P(👍🏻)와 좋아요를 눌렀을 때 한국 채널일 확률인 P(🇰🇷|👍🏻), 좋아요를 눌렀을 때 여행 콘텐츠일 확률인 P(🛫|👍🏻)의 곱과 유사하답니다!
그렇다면, 한국 채널의 여행 콘텐츠를 시청하였을 때, 싫어요를 누를 확률인 P(👎🏻|🇰🇷∩🛫)도 싶게 계산할 수 있겠죠! 바로 싫어요를 누를 확률인 P(👎🏻)와 싫어요를 눌렀을 때 한국 채널일 확률인 P(🇰🇷|👎🏻), 싫어요를 눌렀을 때 여행 콘텐츠일 확률인 P(🛫|👎🏻)의 곱과 유사하답니다!
지금까지 열심히 계산한 2개의 확률인 P(👍🏻|🇰🇷∩🛫)와 P(👎🏻|🇰🇷∩🛫)를 비교해 줄 일만 남았어요. 만약 한국 채널의 여행 콘텐츠를 시청하였을 때, 좋아요를 누를 확률인 P(👍🏻|🇰🇷∩🛫)이 더 크다면 유튜브는 튜튜👱🏻♀️씨에게 ‘한국 채널’의 ‘여행 콘텐츠’인 한국 여행 브이로그를 추천해줄 가능성이 크게 되겠네요! 나이브 베이즈 미션클리어 😎
엑셀로 따라하는 나이브 베이즈 관련 영상 보러가기
지금까지 유튜브 사례로 알아본 나이브 베이즈, 엑셀로 해보고 싶으시다고요? 그럼 위에 있는 유튜브 사진을 클릭해 주세요! 🔼🔼🔼
이번주 에이블레터 어떠셨나요?
좋았어요😁 아쉬웠어요😕
지난 <노코드 머신러닝> 다시 보기
엑셀로 베이즈 정리 따라하기
이 뉴스레터 공유해주기💌
교육서비스 경험을 혁신하는 에이블런입니다. 📣
● 비전공자를 위한 데이터 활용교육 > ABLEARN
● 1인 교육담당자를 위한 온라인 교육지원서비스 > &SPACE