[노코드데이터분석]한 번 수집하면 알아서 업데이트 되는 데이터가 있다?👀

뉴스레터 콘텐츠로 바로가기! 📖



여러분들은 원하는 정보를 주로 어디서 찾으시나요?
네이버 또는 구글, 인스타그램, 유튜브까지.. 여러 답변이 들릴 것 같은데요!
수많은 웹페이지, SNS 등 산발적으로 퍼진 정보들 중 필요한 것만 한데 모아볼 수 있다면 얼마나 편할 지..! 상상해보신 적 있으신가요?
오늘은 데이터를 “효율적으로” 모아보는 방법에 대해 알아보도록 해요!

이 뉴스레터를 보면 좋은 사람은?
👶🏻 : 통계의 ‘통’자도 모르는 통계 왕왕왕초보!
👲🏻 : 실무에서 사용하는 엑셀로 데이터 수집을 하고 싶으신 분!
👸🏻 : ‘나도 API 활용해봤어~’ 라고 자랑하고 싶으신 분!

 

- 에이블런 비키 드림💌



디지털 세상의 연결고리🔗, API



🔗API란?
Application Programming Interface
: 운영체제나 프로그래밍 언어에서 파일 제어, 창제어, 화상 처리, 문자 제어 등을 처리할 수 있는 인터페이스


..여기까지만 읽고도 단번에 이해하신 분들, 혹시 계실까요?👀
뼛속까지 문과의 피가 흐르는 분들이라면(저 포함😅) 아직 이해하기 어려운 게 당연합니다! 제일 낯선 단어인 ‘Interface’를 영어 그대로 풀어본다면 접두사 inter는 ‘~사이에’라는 뜻을, face는 ‘면, 표면 등’의 뜻을 가진다는 점으로 미루어보아 ‘어떤 두 개체 사이의 면’을 의미하겠죠? 정확히 말하자면 ‘둘 이상의 장치 혹은 소프트웨어 간의 접점/대면지점’을 뜻하는데요, 가장 가까운 예시로 우리가 매일같이 접촉하는 스마트폰 디스플레이📱를 들 수 있습니다. 디스플레이는 손가락과 스마트폰 하드웨어 간의 물리적인 접촉면이자, ‘우리가 디스플레이를 터치함으로써 화면이 켜지는 일련의 상호작용을 돕는 매개체 역할이죠! 다만 이 경우에는 ‘사용자’와 ‘장치 및 소프트웨어’가 만나는 지점이기 때문에 User Interface, UI가 되겠네요!



 


디스플레이와 달리, API는 우리가 육안으로 확인할 수 없는, 디지털 환경 속 서로 다른 프로그램들 간의 소통을 돕는 중간 장치로서 작용합니다. 특히 앱 개발에 있어 API는 큰 도움을 줄 수 있는데요, 예를 들어 ‘굿닥’🧑‍⚕️어플은 정부 3.0 공공데이터 개방 정책으로 건강보험심사평가원의 오픈 API를 활용해 전국의 병원 및 약국 정보를 제공하고 있습니다. 건강보험심사평가원의 API가 없었다면, 일일이 지역별 병원과 약국을 검색하고 기록해야 했을 뿐 아니라 변동사항이 있을 때마다 다시 정보를 수정하는 등의 번거로움이 있었을 텐데요!


이게 바로 “API가 유용한 이유입니다. 내가 가지고 있지 않은 정보를 수시로 찾아다니고, 확인 및 수정을 거칠 필요없이 관련 정보가 축적된 데이터베이스의 API만 있다면, 연동된 현 시점의 데이터를 사용할 수 있답니다!  그렇다면 이 API를 과연 어떻게 가져올 수 있는지! 예시로 든 ‘굿닥’🧑‍⚕️처럼 공공데이터 API를 통해 알아볼까요?🕺






누구에게나 열린 문🚪, 오픈 API?

 

🚪누구든지 환영! 모두에게 개방되어 수집 및 활용 가능한 APIOpen API 또는 Public API라고 하는데요, 행안부에서 운영하는 국내 공공데이터 제공 플랫폼, 공공데이터포털을 통해 Open API형 데이터를 수집해보도록 하겠습니다! +) 


여러분들을 위한 꿀팁💁

공공데이터포털은 각 공공기관이 보유하고 있는 공공데이터를 하나로 통합 및 관리하는 창구 역할로, 굉장히 방대하고 다양한 빅데이터들이 축적되어 있기 때문에 원하는 데이터를 관련어나 키워드로 검색하여 찾는 것이 가장 빠른 방법이랍니다..!



 

근데..
공공데이터는 뭔가요?💬

✔️공공데이터 : 데이터베이스나 전자화된 파일 등 공공기관이 법령 등에서 정하는 목적을 위하여 생성하거나 취득하여 관리하는 자료나 정보
✔️국내/글로벌벌 공공데이터 제공 플랫폼 :공공데이터포털 / 서울 열린데이터 광장 / 국가통계포털 / e-나라지표 /



🚪이번 시간에는 공공데이터포털 속 다양한 정보들 가운데 ‘국민연금 가입 사업장 내역’에 대한 오픈API를 통해 엑셀로 옮겨와보도록 할텐데요!


시작 전 준비사항부터 살펴보자면, 웹으로는 공공데이터포털🌐 홈페이지 로그인이 필요하고, PC로는 엑셀📊과 메모장🗒️을 켜두시면 됩니다. 마음의 준비까지.. 다 되셨다면? 아래 영상을 눌러 ‘노코드데이터수집’의 영상가이드와 함께 해볼까요?👇

 


'국민연금 가입 사업장 내역' 오픈 api형 데이터 수집해보기



공공데이터 플랫폼에서 원하는 데이터를 찾는 것부터 엑셀로 불러오는 것까지(+간단한 데이터 정리) 영상으로 만나보았습니다! 아래 좌측 사진은 참고문서 ➁ 응답 메세지 명세(p.9) 상으로 확인되는 데이터값에 대한 안내이고, 우측은 영상 속 과정을 거쳐 오픈api로 불러온 데이터입니다. 동일한 정보들이 우측 엑셀에는 데이터 분석에 용이하도록, 열 방향으로 정리되어 나타난 것을 확인해볼 수 있답니다!👇



 


근데..
제 엑셀 화면은 실습영상이랑 조금 다른데요?💬

영상 속 데이터 수집과정을 그대로 따라해보기 위해서는 엑셀 추가 기능인 ‘파워쿼리’가 필요합니다! 엑셀 2010, 2013 또는 그 이전 버전인 경우, 별도로 ‘파워쿼리’ 기능을 설치해주셔야 하며, Mac용 Excel에서는 파워쿼리 기능 자체가 지원되지 않아 사용이 불가능하답니다..!😿






업무 효율성🔼의 길잡이, 파워쿼리

🔽노코드 데이터 수집을 완성시키는 핵심은 바로 엑셀 파워쿼리입니다. 파워쿼리가 설치 완료된 엑셀 프로그램에서만❗ 위 영상 그대로 API를 통한 데이터수집이 가능하답니다. 그렇다면 대체 이 파워쿼리가 무엇인지 함께 알아볼까요?🔍



 Excel 2019 파워커리 설치 완료 화면



🔽파워쿼리(Power Query)란 데이터 변환과 가공을 위한 도구이자 프로그램으로, 기존에는 엑셀이 아닌 MS 액세스(Access)에서 사용할 수 있었던 ‘쿼리’기능을 엑셀에서도 만나볼 수 있게 새로 업데이트된 것이랍니다! (쿼리란, ‘데이터베이스에 특정 정보를 요청하는 것’을 말합니다.) 파워쿼리를 이용하시면 내 컴퓨터 속 흩어진 정보들부터 웹에 널린 데이터까지! 원하는 형식으로 변형해 엑셀 시트에서 모아볼 수 있습니다. 또한 위 영상처럼 수집한 데이터를 정제 및 가공하여 데이터분석에 돌입할 준비를 시켜주는, 쉽고 효율적인 데이터 관리 툴입니다.






이렇게나 유용한 엑셀 툴, 파워쿼리! 활용법이 궁금하지 않으신가요?😉 다음 #노코드데이터분석 8️⃣번째 시간에 파워쿼리의 데이터 ETL(추출, 변환 및 로드) 기능들에 대해 더욱 자세히 알아볼 예정이니, 궁금하신 분들은 에이블레터를 구독해 다양한 ‘디지털’ 소식들을 만나보세요✨

 

바쁘다 바빠 현대사회🤹‍♂️ 뉴스레터 구독자분들을 위한 “3줄 요약”


📍 프로그램들 간의 연결고리가 되는 API, 데이터 자동 업데이트가 장점!
📍 공공데이터는 오픈 API를 통해 바로 데이터수집 가능!(위 실습영상 참고☝️)
📍 데이터 수집 및 정리는 코딩없이 엑셀 내 파워쿼리 기능 활용!



👇에이블레터 TMI (There’s a lot More Information)
엑셀로 시작하는 #노코드데이터분석 더 알고 싶으시다면?


[예스24] [교보문고] [알라딘]





[오늘의 에이블레터는 어떠셨나요?🗣️]


[지난 뉴스레터 다시 보기💌]