-
[에이블런 2주차] 데이터 리터러시 엑셀 강의-1서비스 기획/Next Gen 2024. 5. 28. 16:54
Orange3 강의가 끝난 후 다음 강의로는 엑셀을 기반으로 한 데이터 리터러시이다. 결론부터 말하자면 강의 내용이 썩그리 마음에 들지 않았다. 첫번째로는 강의가 너무 루즈하다. 많은 양의 정보를 나열하기 바쁘고 뭔가 머릿속에 주입되는 내용이 별로 없는 듯 하다. 두번째는 강의 실습 자료의 준비 부족이다. 일단 파워쿼리를 알려주기 위해서 엑셀을 깔아야했다. 하지만 실제로 파워쿼리를 이용해서 알려주는 내용은 일부분에 불과하다. 무엇보다 실습에 사용되는 데이터의 크기가 너무 크다보니 학생들이 편하게 써보기 너무 어려웠다. 그래도 하루동안 얻어간게 없진 않기 때문에 관련된 내용들을 정리해두고자 한다.
데이터 리터리시란?
데이터를 읽을 줄 아는 능력을 통해 비지니스적 인사이트를 얻고자 함이 최종 목표이다.
데이터 활용 능력
데이터 읽기: 이론 및 분석
데이터 작업하기: 수집 및 관리
데이터로 소통하기: 시각화
실제로 데이터를 응용한 사례
강사님이 소개해준 사이트의 예시 중 1854년 콜레라 발병맵이 매우 흥미로웠다. 아래 그림과 같이 지도에서 콜레라가 발병한 횟수를 차트로 나타내었고 지리적인 특징과 빈도수를 종합적으로 분석한 결과 우물이 하수로 오염되어 콜레라가 퍼지는 것을 확인할 수 있었다. 매우 흥미로운 자료였으며, 비슷하게 finviz에서 보여지는 미국 주식시장의 시가총액을 기준으로 시각화해둔 맵 또한 생각이 났다. 다양한 데이터를 시각화해서 한눈으로 볼 수 있도록하는 아이디어는 항상 좋은 것 같다.
엑셀 파워쿼리(x) -> 피봇테이블
강사님이 소개해주신 엑셀의 파워쿼리 기능은 데이터를 전처리하고 필터링하기 좋은 기능 및 웹 크롤링 기능을 소개해주셨다. 하지만 너무나 아쉽게도 필자의 노트북은 맥북인 관계로 엑셀의 파워쿼리 기능을 온전히 사용해보진 못했다. 대신에 피봇테이블을 이용해 데이터를 가공하는 방법을 간단하게나마 아카이빙 해두고자 한다. 스프레드에도 똑같이 제공하므로 스프레드시트를 기준으로 작성해본다
데이터 탐색
실습에 사용된 데이터는 Orange3에서 사용된 데이터와 비슷하게 은행의 적금을 드는 고객에 대한 개인 정보 데이터를 기준으로 설명한다.
Ctrl + A 커맨드를 통해 전체 선택 후 삽입 > 피봇 테이블을 클릭하게되면 다음과 같은 화면이 나타나게 된다.
그 후 행 > marital, 열 > age, 값> marital 으로 지정하면 다음과 같은 테이블이 생성된다. 드래그 & 드롭으로도 각각의 요소들을 추가할 수 있으니 참고하자.
이를 바탕으로 이혼, 결혼, 싱글의 나이별 빈도수를 그려보면 다음과 같이 나타낼 수 있다.
결과는 우리가 아는 예상치랑 비슷하다. 20대 초반부터 30대 후반까지 결혼을 하는 빈도수가 점차 늘어나는 반면에 30대초반부터 이혼률이 점차 증가한다. 결혼하는 빈도수는 30대 후반을 기점으로 급격하게 낮아지는 반면 이혼율은 60대까지 꾸준하게 분포하고 있음을 알 수 있다. 추가로 알 수 있는건 싱글인 빈도수가 30대를 기점으로 급격하게 낮아진다는 점이다. 30대에 싱글이 가장 많으며 결혼비율도 가장 높은 것을 알 수 있다.
마치며
여러모로 아쉬움이 많이 남는 강의였다. 그래도 유의미한 데이터 관련 웹사이트를 많이 알려주시고 가셨다. 이와 관련해서 정리하고 글을 이만 마치도록한다. 아마 엑셀관련 강의가 1개 더 남았지만 관련해서 글은 쓰지 않을 예정이다. 별로 나에게는 그리 큰 인사이트가 없다고 느껴지기 때문이다.
공공데이터 사이트
검색어 트렌드 분석
'서비스 기획 > Next Gen' 카테고리의 다른 글
[에이블런 3주차] UX/UI: 사용자 경험을 높이는 서비스 기획-2 (0) 2024.06.03 [에이블런 2주차] UX/UI: 사용자 경험을 높이는 서비스 기획-1 (0) 2024.05.30 [에이블런 2주차] Orange3 실무강의-2 (0) 2024.05.27 [에이블런 1주차] Orange3 실무강의-1 (0) 2024.05.23 [에이블런 1주차] 구글 애널리틱스(GA4) 활용 강의-2 (0) 2024.05.23