-
[에이블런 2주차] Orange3 실무강의-2서비스 기획/Next Gen 2024. 5. 27. 17:34
저번 강의에 이어 이번 강의 또한 실무 데이터를 기반으로 분석하는 방법을 여러 소개해주었다. 강의를 시작하기에 앞서 강사님께서 Orange3가 서비스 기획에 어떻게 쓰일 수 있을지 말씀해주셨다. 처음에는 교육용이라고 언급하셨지만, 서비스 기획과 연결시켜보자면 기업의 매출과 관련된 데이터들을 분석할 때 사용하기 좋다고 추천해주셨다. 맞는 말씀인거 같다. 데이터를 모델링하고 분석하는건 항상 개발자 몫이라고 생각했지만, 기획자도 기본적인 분석을 기반으로 리포트를 쓸 수 있다면 좀 더 감정에 호소하는 글이 아닌 데이터를 기반으로 이야기할 수 있기에 좋은 접근법이라고 생각한다. 통계 및 확률과 머신러닝은 이제 모두의 기본 소양이 된 느낌이다.
RFM (Recency Frequency Montary) 분석
CRM(Customer Relationship Management) 기법 중 하나로, 사용자 별로 얼마나 최근에(Recency), 얼마나 자주(Frequency), 얼마나 많은 금액(Montary)을 지출했는지에 따라 사용자들의 분포를 확인하거나 사용자 그룹을 나누어 분류하는 분석 기법이다. RFM 분석을 위해서 필요한 데이터는 다음과 같이 분류할 수 있다.
데이터 형식
고객별 분석이기 때문에 고객번호 같은 고객 식별이 가능한 고유 데이터가 필요함
- 최근성: 고객이 얼마나 최근에 구매하였는가? (구매 일자)
- 행동 빈도: 고객이 얼마나 자주 구매하였는가? (고객 별 구매 횟수)
- 구매 금액: 고객이 얼마나 많이 구매하였는가? (고객 별 총 구매 금액)
데이터는 다음과 같이 구간별로 Score를 정의하여 분류 기준을 만든다. 보통 RFM의 정의는 기업마다 다르며 팀별마다 정의하기 나름이다.
Score Recency Frequency Monetary 3 <= 3M 100< 200,000< 2 3M < 마지막 구매일 <= 6M 50<구매 횟수 <= 100 100,000 < 지출 금액 <= 200,000 1 6M < <= 50 <= 100,000 RFM 데이터 테이블 예시
실습 결과
실습에 사용된 고객데이터의 개수는 총 10,000 개이며 결과를 테이블로 나타내보면 다음과 같이 나타낼 수 있다. 사용된 데이터는 상품구매를 하는 소비자에 대한 정보를 기입해둔 테이블 데이터였다.
RFM Score # of customer ratio (%) 333 (Best Customer: VIP 고객) 227 2.27 3nn (Recent Customer: 최근 구매 고객) 503 5.03 n3n (Frequency Customer: 충성 고객) 1269 12.69 nn3 (Monetary Customer: 큰손 고객) 1885 18.85 nnn (General: 일반 고객) 4379 43.79 이를 바이올렛 플롯으로 나타내보면 다음과 같다.
표를 통해서도 확인할 수 있지만 바이올렛 플롯을 보니 더 한눈에 알아보기 쉬웠다. 해당 데이터를 기반으로 큰 손고객이 전반적으로 고르게 분포해있음을 알 수 있고, 최근 구매 고객이 높은 고객이 비교적 적다는 것을 확인할 수 있었다. 데이터를 통해서 인사이트를 얻기 좋은 것 같다!.
군집화 (Clustering) 분석
두번째 실습데이터는 소비자의 나이(age), 소비 점수(spending score), 연간 수입(Annual Income)를 카테고리로 정리해둔 테이블 데이터였다. 이번에는 클러스터링을 통해 분류된 소비자들은 어떤 특징을 가지고 있는지 알아보고자 한다.
Scatter plot
첫번째로 클러스터링 결과를 나이 vs 연간 수입으로 나타낸 결과 어느 정도 클러스터링이 잘 되어 있는것 같았다. 나이 대 별로 수입에 차이가 있어 보인다.
두번째로 수입 vs 지출 정도를 살펴본 결과 C2, C4 그룹에서 겹치는 현상을 발견했다. 이러한 경우 강사님께서 다른 시각화 도구를 활용하여 C2, C4가 나뉘어 졌는지 확인가능하다며 Box plot을 추천해주셨다.
Box Plot
Box Plot을 통해 살펴본바, 나이로는 C2, C4가 클러스터링이 잘 되었음을 알 수 있었다.
그 외에 클러스터링을 사용할 수 있는 분야들
- 리테일(소매업) 부서: 유동인구 특성을 클러스터링하여 각 클러스터가 빈출하는 지역에 매장을 내는 전략을 구상해볼 수 있다. 같은 지역 내에서도 특정 골목이나, 주변 상권에 따라 빈출하는 유동인구 클러스터가 달라질 수 있기 때문이다.
- 마케팅 부서: 고객 세그먼트를 군집에 따라 분류하여 각 군집의 특성에 맞는 푸쉬 알림이나, 혜택을 제공하여 마케팅 성과를 높일 수 있다. 우리가 흔히 사용하는 컬리나, 쿠팡에서도 이와 같은 방식을 사용하여 사용자의 특성에 맞는 광고를 노출하여 매출을 개선하고 있다.
- 영업 부서: 마케팅과 유사하게 고객을 클러스터링하여 같은 군집의 고객에게 제공할 영업 기초 자료를 미리 준비해두어 영업에 드는 리소스를 줄일 수 있다.
Association Rule
Association rule은 큰 데이터베이스에서 변수들 간의 흥미로운 관계를 발견하기 위한 규칙기반의 기계학습 방법이다. 실제로 고객 구매 패턴 분석, 고객 추천에 많이 활용된다. 이를 활용해서 진열대에 고객이 같이 사는 물품들을 따로 모아 매출 상승으로 연결시키기도 한다.
실습 사례
실습에 사용된 데이터는 고객이 마트에서 구매한 목록을 나타난 데이터로 구매한 항목만 개수로 1로 표현되어 있고 그렇지 않은 항목은 빈 공백으로 채워져있다.
Association Rule 모델을 적용한 결과 다음과 같은 결과가 나타났는데 결과가 매우 흥미로웠다. 마트에서 가장 많이 구매한 품목은 사과인데, 사과랑 빵을 같이살 확률은 14%라는 것이다. 비슷하게 빵을 구매할 확률은 36%이며 빵과 같이 구매할 확률이 높은 품목은 버터로 16% 이다. 뭔가 말이된다!
Association Rule의 척도를 설명하자면 다음과 같다.
- Support: 전체 경우의 수에서 두 아이템이 같이 나오는 비율을 의미. Support 값이 높을 수록 두 아이템 사이의 연관성이 높음
- Confidence: X가 나온 경우 중 X와 Y가 함께 나올 비율을 의미. Conf값이 1에 가까울수록 유의미한 관계
- Lift: 1보다 높을 때는 positively correlation, 1일 때 independent, 1미만일 때 negatively correlation. lift값이 1보다 높은 값을 가질 때 유의미한 관계를 나타낸다.
실습결과를 바탕으로 설명하자면 빵, 치즈, 맥주, 달걀, 아이스크림을 구매한 고객의 경우 요거트를 구매한 빈도수가 다른 것을 구매한 빈도수보다 2.293 배 높다 라고 설명할 수 있다.
응용사례
- 영업: 고객의 정보를 통해 고객의 취향에 맞는 제품 및 서비스를 추천하여 매출을 높이는 데 적용가능
- 마케팅: 고객의 정보를 통해 고객에게 가장 적합한 컨텐츠를 노출 시키는데 적용 가능
- 마켓: 마트에서 구매 가능성이 높은 제품을 비슷한 위치에 배열하여 매출을 증진
- 컨텐츠: Youtube나 Netflix처럼 고객정보를 바탕으로 취향에 맞는 영상 컨텐츠를 추천해주는 서비스에 활용 가능
마치며
머신러닝을 공부했지만 실제 산업에서 사용되는 부분을 다양하게 접하다보니 내가 알고 있는 지식을 제대로 사용하고 있지 못했구나라는 깨달음을 얻는 순간이였다. 데이터분석 및 시각화를 위해 클러스터링은 많이 사용해보았지만, 실제 고객 데이터를 바탕으로 마케팅과 서비스로 연결짓는 부분이 가장 궁금했었는데 조금이나마 알 수 있었다. 흥미로웠던 실습사례는 Association Rule 모델이였다. 데이터와 수치를 기반으로 같이 구매할 확률이 높은 품목들을 추천해주는 간단한 모델링은 앞으로도 많이 사용해볼 것 같으며, 비슷하게나마 응용가능한 부분이 많을 것 같다.
'서비스 기획 > Next Gen' 카테고리의 다른 글
[에이블런 2주차] UX/UI: 사용자 경험을 높이는 서비스 기획-1 (0) 2024.05.30 [에이블런 2주차] 데이터 리터러시 엑셀 강의-1 (0) 2024.05.28 [에이블런 1주차] Orange3 실무강의-1 (0) 2024.05.23 [에이블런 1주차] 구글 애널리틱스(GA4) 활용 강의-2 (0) 2024.05.23 [에이블런 1주차] 구글 애널리틱스(GA4) 활용 강의-1 (0) 2024.05.21