엑셀, 피벗 테이블만 NO! 데이터 분석도 YES!

#엑셀 #데이터분석 #클릭_몇번이면_분석_끝!


파이썬, 자바, C언어, C++.... 프로그래밍 언어는 왜 이렇게 복잡하고 어려운지😢😢 평소에 자주 사용하는 엑셀로 데이터 분석을 하고 싶었던 분 있으신가요? 🙋🏻‍♀️🙋🏻‍♂️ (저요 저요!) 그렇다면, 어렵다고 생각했던 데이터 분석을 EXCEL로도 쉽게 따라할 수 있는 <노코드 데이터분석> 어떠신가요? 실무에서 자주 사용하는 엑셀로 데이터분석까지!

 

이 뉴스레터를 보면 좋은 사람은?

👶🏻 : 통계의 ‘통’자도 모르는 통계 왕왕왕초보!

👲🏻 : 실무에서 사용하는 엑셀로 노코드 데이터 분석 하고 싶으신 분!

👸🏻 : ‘나도 어디서 통계 해봤어~’ 라고 자랑하고 싶으신 분!


-에이블런 리사 드림💌



💬  평균만 믿으면 배신당할 수도 있다고?

#평균의 함정 #평균만은_NO #갑자기_분위기_조던

여러분은 통계 관련 용어 중 어떤 것이 가장 먼저 떠오르시나요? 이러한 질문에 대부분의 사람들이 ‘평균’이라고 답합니다. (아마도 학창시절👩🏻‍🏫에 국영수 점수를 평균낼 때, 많이 사용해본 경험이 있어서 아닐까요?) 이처럼 평균은 모든 값들을 대표하기 위해 주로 사용됩니다. 


하지만, 평균만 믿다가는 배신 당할 수도 있다고요? 😓 1985년도 노스캐롤라이나 대학교의 지리학과 졸업생 평균 초봉은 10만 달러(우리돈으로 약 1억 3천만 원)였다고 합니다. 그렇다면 이때의 지리학과 졸업생들이 모두 10만 달러를 받을만큼 유능했던 걸까요? 😎 물론 그럴수도 있지만, 그 비밀은 바로 농구🏀의 황제인 마이클 조던 때문입니다. 왜 갑분조(갑자기 분위기 조던)냐고요? 마이클 조던은 노스캐롤라이나 대학교를 졸업한 후 시카고 불스에 입단하며 거액의 연봉을 받았고, 이것이 졸업생들의 평균 초봉에 반영된 것입니다. 좀 더 쉽게 설명하면, 엄청나게 높은 마이클 조던의 초봉과 상대적으로 낮은 다른 졸업생들의 초봉이 평균화되면서 10만 달러💵라는 큰 값으로 계산된 것입니다. 이같이 소득의 차이가 많이 나는 상황에서는 평균의 의미가 사라지고, 오히려 평균의 함정에 빠질 수 있습니다.



💬  그래서 평균한테 배신 당하지 않는 방법은?

#다른_대표값들도_함께! #CV는_변동계수 #표준편차/평균


그렇다면 평균의 함정에 빠지지 않기 위한 방법은 무엇일까요? 바로 평균 이외의 다른 대표값들도 함께 고려하는 것이 중요합니다. 여러가지 대표값들 중 이번에는 변동계수에 대해 알아보도록 하겠습니다. 재미있는 사례로 알아보는 변동계수! 너 도대체 뭐니? 🤔🤔🤔


여러분은 퇴근 후, 어떻게 시간을 보내시나요? 스트레스를 풀기 위해 시원한 한강 바람을 맞으며 한강 러닝을 하시는 분들도 계실텐데요!🏃‍♀🏃 여러분들이 달린 거리를 측정한 결과, 평균적으로 하루에 5KM를 달렸다고 가정해보도록 하겠습니다. 한편, 세계적으로 유명한 케냐의 마라톤 선수인 킵초게 역시 매일 마라톤 연습을 하며, 시합 전에는 평균적으로 하루에 약 30KM를 달린다고 합니다. 하지만, 달리는 거리가 매번 똑같을 수는 없겠죠? (신나서😆 더 많이 달리고 싶은 날도 있고, 조금 지쳐서 😫 그만 달리고 싶은 날도 있잖아요) 이렇게 여러분들이 달린 평균 거리에서 벗어나서 생기는 차이를 계산한 값을 표준편차라고 부르며, 변동성을 측정하기 위해 사용합니다. 이때, 두 사람의 달리기 거리와 관련된 표준편차가 동일하다고 생각해보겠습니다. 즉, 평균 거리에서 벗어나 더 달리거나 덜 달린 거리를 계산한 값이 같다는 의미죠.

그렇다면, 한강 러닝을 하는 여러분과 세계적인 마라톤 선수인 킵초게의 달리기 거리 변동성은 동일한 걸까요? 당연히 아닙니다! 🙅🏻‍♀️🙅🏻‍♂️ 곰곰이 생각해보면 두 사람의 평균 달리기 거리에서부터 차이가 존재합니다. 그렇다면, 이러한 차이를 반영하기 위해서는 중요한 대표값인 표준편차와 평균을 모두 사용하는 새로운 개념이 필요할 텐데요. 이렇게 탄생된 변동계수는 표준편차를 평균으로 나누어 계산합니다. ‘변동성’에 초점을 맞췄기 때문에 표준편차를 분자에 두고, 각 집단의 평균을 함께 고려하기 위하여 분모로 나눠주는 것입니다! 이러한 변동계수는 비교할 자료들의 측정 단위가 달라서 직접적인 비교가 힘들 때 더욱 유용하게 사용됩니다. 표준편차(분자)와 같은 단위를 가지는 평균(분모)으로 나누어 계산하기 때문에 단위에 대한 고려를 하지 않아도 된다는 편리한 점이 있는 거죠.




💬  단 2️⃣2️⃣초 만에 엑셀로 변동계수 계산하기
 

그렇다면, 지금까지 살펴본 변동계수를 엑셀로 계산할 차례입니다. 바로 분석 START ~ 🎬 그런데, 아직 [데이터 분석] 기능이 없으시다고요? 사진 한 장으로 [데이터 분석] 기능 추가하기 (⬅ 여기 클릭!)
 

여러분은 원자재를 구매하는 의사 결정권자👷🏻👷🏻‍♂로서 좋은 원자재를 구입할 미션을 부여받았습니다! 물론 저렴한 가격의 원자재도 중요하지만, 원활한 재료의 수급을 위하여 가격 변동성이 가장 낮은 원자재를 선호하고 있습니다. 적절한 원자재를 찾기 위하여 산업통상자원부의 2011년 7월부터 2020년 5월까지의 철강원자재 가격을 파악한 결과, 일반적으로 고철이라 불리는 철스크랩을 미국($/톤)과 일본(엔/톤)에서 수입하는 것을 알 수 있었습니다. 그렇다면, 여러분은 미국과 일본의 철스크랩 중 어떤 원자재를 선택하시겠나요? 단 22초 만에 여러분의 고민을 엑셀로 해결해 보도록 하겠습니다! 22초 시작 💨


22초 만에 변동계수를 구할 수 있다니! 신기하신가요?👏🏻👏🏻👏🏻 아래 사진은 동영상에서 보았던 미국의 철스크랩($/톤)과 동일한 엑셀 데이터 분석으로 도출한 일본 철스크랩(엔/톤)의 기술 통계표 및 변동계수입니다.


기술통계표가 조금은 복잡해보일 수도 있지만, 우리가 집중할 것은 평균, 표준편차, 변동계수 딱 3가지입니다. 만약 우리가 변동계수를 배우지 않았다면 어떤 결론을 내렸을까요? 단순히 변동성을 확인할 수 있는 표준편차 값만을 고려하여 표준편차 값이 더욱 작은 미국의 철스크랩($/톤)을 선택하였을 것입니다. 하지만, 맨 위의 필드값을 자세히 살펴볼까요? 👀 눈치채신 분들도 있겠지만, 두 변수간에는 측정단위의 차이가 존재합니다. 미국의 철스크랩 단위는 달러($)이며, 일본의 철스크랩 단위는 엔입니다. 그렇다면 단위에 대한 고려를 하지 않아도 되는 대표값인 변동계수를 사용하는 것이 좋겠네요! 엑셀을 활용하여 각각의 철스크랩 표준편차를 평균으로 나눠준 결과인 변동계수가 맨 아래에 있습니다. 바로 일본의 철스크랩(엔/톤)의 변동계수인 0.22001이 미국의 철스크랩($/톤) 변동계수인 0.24297보다 작은 것을 확인할 수 있습니다. 따라서 여러분은 가격 변동성이 작아 원활한 재료 수급에 효과적인 일본의 철스크랩을 수입하는 것이 더욱 효과적일 것으로 예측됩니다. 미션 클리어😎

 




교육서비스 경험을 혁신하는 에이블런입니다. 📣

● 비전공자를 위한 데이터 활용교육 > ABLEARN

● 1인 교육담당자를 위한 온라인 교육지원서비스 > &SPACE



이 뉴스레터 공유해주기💌