[CRM 강의 후기] SeSAC 러닝스푼즈 데이터 드리븐 마케팅 강의 : 고객세분화 케이스스터디 & CRM 2단계 : 고객 취향 세분화
2023.08.01~08.02 수업 내용 연달아서 필기를 진행했습니다!
본격적인 crm 과 고객구분에 대한 진도를 나가기 시작했습니다!
고객 가치 세분화해보기 EX. 통신산업
- 유서깊은 구독형 서비스
- 과거에는 유/무선 서비스, 오늘날은 홈서비스(인터넷망 등) / 개인서비스(스마트폰)로 주로 구분되고 있음
=> 서비스 유형이 변화하면서 기존 유선 세그먼트 고객군 + 무선 세그먼트 고객군을 통합한 도출 MATRIX 구성했을듯
=> 매트릭스의 각 고객군 별 맞춤 전략을 도출해, 고객이 더욱 상위 세그먼트로 움직일 수 있도록 성장 프로그램 실행!
1. 고객 취향의 이해
1) 취향이란?
- 하고 싶은, 고객이라면 "구매를 하고 싶은" 마음이 생기는 경향
=> 경향이 비슷한 사람들로 그룹을 구성, 그들의 취향이 도출됨!!
=> 구매상품 데이터를 기반으로 유저간의 유사성 정도 판단, 유사성이 높은 사람들끼리 군집화, 군집의 특징을 도출!
(이때 개인이 몇개의 취향을 가졌는지는 불확실! )
신한 카드 사례) 결제 기록을 참고, 성별 별로 9개씩의 취향 군집 형성!
> 성별, 구매 패턴(금액 및 소비횟수), 구매품목의 업종 정보 등 고려한 것!
ex. 명품 브랜드 및 패션뷰티 구매 기록이 많은 남성 소비자를 하나의 그룹으로 패턴화하였음. (LOEL)
ex. 일정 수준 이상의 결제 금액을 지속적으로 지출하는 사람들 => 전문직으로 정의
ex. 주로 소비하는 카테고리 품목으로 싱글 / 기혼을 구분 (기혼이면 이성 배우자 및 자녀관련 물품 구매건 증가)
ex. 매달 결제 금액 정도가 일정수준을 유지하면 합리적&계획적 소비 패턴으로 구분
2) 데이터 측면에서의 '취향'
- 구매 상품은 유저의 '취향'의 결과물!!
=> 구매 단건은 전체 취향을 반영할 수 없으나, 장기적으로 누적되면 일정한 패턴이 나타남
- 제품의 특성을 담은 태그 및 카테고리 정보를 제공한다면 취향에 맞는 제품 서칭에 도움됨!
ex. 넷플릭스 : 작품의 구체적인 장르 및 연상되는 분위기 등의 키워드를 태그로 달아 정보 제공
실제 태그의 상용화는 애로사항이 많아, 카테고리 세분화를 통한 유저 취향 만족으로 접근하는 경우가 다수
(태그 담당자들의 관점에 따라 키워드가 달라지게 되어, 일관성 부족 발생)
3) 취향을 어떻게 만들 것인가?
- 작품/태그/카테고리 등은 대다수 "문자형" 정보 => 연산 x & 변수 증가
- '군집분석'을 통한 접근을 통해 여러 조합을 확인할 수 있다!
2. 군집화의 이해 : 군집 분석
군집분석이란? : 비슷한 패턴을 보이는 사람들을 하나의 그룹으로 분류 (집단별 평균 회귀)
1) 고객 군집화란?
- 고객들을 유사한 그룹으로 묶어 나누는 마케팅 전략
=> 구매하는 '상품 종류'를 기반으로 취향 유추, 집단 분류
cf. 세분화 / 군집화의 비교
- 세분화는 전체 분포 상태에서 데이터를 일정 기준으로 쪼개는 작업
=> 직관 & 경험적 / 분포 기반 / 변수 최소화 / 해석이 쉬움! / 그룹 수 & 비율 조정 쉬움!
- 군집화는 전체 분포 상태에서 서로 거리가 가까운 데이터들을 묶어주는 작업
=> 군집화 알고리즘 기반 / 거리(유사성) 기반 / 변수 다양 / 의미 해석 필요 / 그룹 수 & 비율 조정 어려움
2) 군집의 평가 기준
좋은 군집이란? : 집단 내 유사성 높고, 집단 간 차이가 크다!
=> 분산된 데이터의 거리를 기준으로 판단!
3) 군집화를 사용한 취향 생성
1- 목적 정의 : 어떤 취향을 만들것인가?
- 구매 카테고리; 구매하는 상품 및 카테고리 참고
- 고객 행동 패턴; 특정한 상품을 소비하는 패턴 참고
ex. 행동에 일정한 주기가 있는지, 특정 카테고리 집중형인지, 여러 상품을 복합 소비하는지 등
2- 데이터 선별 : 어떤 데이터를 기반으로 접근할지 결정하기
- 구매 상품 데이터 : 구매한 상품의 카테고리, 업종, 사용방식 등 제품 특성
- 상품 태그 (상품 스타일, 디자인, 프리미엄 여부 등)
- 장바구니 담기 / 찜하기
- 유저가 탐색한 상품 (로그 추적)
- 구매 횟수, 성별/연령대 등
3- 변수 생성 : 군집 간 거리 측정이 가능하도록 가공하기
- 대표 변수 선택 : 해석이 가능한 변수를 중심으로 활용 (구매 횟수, 구매 금액, 구매한 상품 수 등)
- 변수 가공 시 주의사항 : 차원의 저주
=> 변수가 늘어날 수록 알고리즘 성능 저하; 변수를 많이 넣으면 가까운 개체들도 거리가 멀게 나올 가능성 증가
변수는 10개 내외 정도로 적당히만 사용하자!
- 변수 단위 통일하기 : 평균을 기준하는 '표준화' / 0~1 사이의 상대적 크기를 활용하는 '정규화' 등 활용
cf. 이상한 데이터가 섞인 경우, 어떤 단위가 가시적인지; 표준화
cf. 문자형의 '명목형' 변수일 경우; dummy 변수화 가능 (동일하면 거리 0, 다르면 거리 1); 가급적 사용을 지양...
4- 군집화 알고리즘 선택 & 군집 조정 : 주로 K-MEANS 알고리즘이 자주 쓰임
5- 군집별 특성 분석 및 의미 부여
- 각 군집별 주요 특성 파악 : 변수의 분포 확인, 인구통계나 매출 등 보조 지표 참고
- 의미 부여 : 타 군집 대비 극단적으로 차이가 발생하는 값을 중심으로!
정리! 취향 세분화 4줄 요약!
- 데이터 확인
- 주요정보 선별
- 군집 형성
- 평가 및 프로파일링
3. 취향 세분화 케이스스터디 - 콘텐츠 회사
[참고] ML 방법론 : CRISP-DM
6가지 단계의 순환적 구성 : 비즈니스 이해하기 - 데이터 이해하기 - 데이터 선별 및 정리 - 모델링 - 평가 - 배포!
1. 배경 설정
- 플랫폼 기반의 만화, 소설, 동영상 콘텐츠 제공
- 구독x, 단권구매 주로!
- 푸쉬 메시지를 통해 작품 알리기 & 구매 권유
- 푸쉬 메시지 대상자 추출은 담당자 직관으로 운영중...?
=> 어떻게 하면 푸쉬메시지를 적절히 보낼 수 있을까??
2. 주요 이슈, 담당자 직관의 조건?
- 최근 N일 이내로 특정 작품 / 특정 카테고리 감상한 기록 참고
- 그러면 특정 카테고리를 읽지 않은 유저들은....? 유저가 소비하지 않은 카테고리 작품 소개는 푸쉬되지 못함
=> 고객이 함께 소비하는 카테고리가 궁금하다! 어느 카테고리까지 푸쉬해야 할까?
3. 문제 정의 : 고객이 함께 소비하는 카테고리군들을 파악, 이를 기반으로 취향을 만들자!
- 고객을 크게 N개의 유사집단으로 분류, 작품 소비하는 취향별로 마케팅
- 제약사항; 초창기부터 너무 세분화하면 활용 어려움 => 대 카테고리 수 < N < 소 카테고리 수 로 갯수 설정
4. 데이터 선별 : 얼마 동안의, 어떤 데이터를? ★
- '얼마 동안' 읽어야 취향으로 인정할 수 있을까?
- '얼마나 오래' 읽었을 때 독자의 패턴이 지속된다고 기대가 가능할까?
1) 기간을 짧게 잡을 때 : 신규 유입고객 대상으로 빠른 액션 가능 / 해당 데이터가 한시적인 이상치이거나, 유저 취향이 바뀌었을 때 대응 어려움
2) 기간을 길게 잡을 때 : 유저의 확실한 취향 파악 가능 / 분석할 유저 모수가 줄어듦;;;;
=> 를 판단하여 적절한 기간 선정
5. 데이터 가공 : 후보 데이터 도출 및 최종 선정
- 푸쉬 발송 반응도 (어떤 메시지에, 얼마나?) - 발송 후 결과 데이터가 쉽게 정리 안되어있어!!
- 유저가 읽은 작품
- 열람한 회차 정도
- 작품 구매 데이터 (돈 주고 구매) - 무료 열람 작품을 본 유저들은 취향 분석에서 빠진다!!
- 유저 반응 (찜하기/댓글 등) - 직접적인 반응을 보이는 유저는 너무 적다!!
=> 읽은 작품 수 / 읽고 있는 작품들의 회차수... 둘 중 무얼 기준으로?
; 1화 보고 나간 작품이 데이터에 포함되는 비중을 줄이고 싶어! > '회차수'를 기준으로!
=> 데이터를 숫자 그대로 활용 vs 정규화 vs 표준화할지
- 숫자 그대로는 콘텐츠 형식(만화/소설)에 따라 편차가 큼
6. 알고리즘 채택 : 모델링에서 고려할 사항
- 각 집단별 유저수는 일정 이상!
- 계산량이 너무 크지 않게!
- 랜덤 시드값 영향을 덜 받게!
- 알고리즘 결과값이 매회차마다 달라지지 않게!
7. 모델링 결과 분석
특정 장르 중심으로 다양한 콘텐츠를 보는지, 특정 콘텐츠 형식만 보는지, 아무거나 복합적인 장르/형식 소비하는지......
=> 카테고리 정리 및 유저 우선순위 분석
- 활용도 높도록 그룹 정리
- 마이너 카테고리는 전략적 제외
- 다양한 카테고리 소비 유저는 우선순위 반영하여 타 그룹에 분할
cf. 취향 없음으로 나오는 고객
분석에 필요한 데이터가 충분히 쌓이지 않은 유저 = 신규 / 복귀 유저
=> 복귀 유저 : 이탈 전 & 복귀 후 열람한 작품들 비교하여 추천할 카테고리 분석
=> 신규 유저 : 플랫폼 입성 후 초반에 본 작품은? 그 작품 및 카테고리 작품들을 꾸준히 읽고 있는지? = 해당 작품이 들어있는 카테고리를 취향으로 설정! (사실 관심 없으면 카테고리 들어가보지도 않는다)
8. 참고사항들; 운영 상의 문제
- 취향은 한순간에 바뀌지 않는다! => 바뀌어도 전체적인 비율이 유지될 가능성 높음
=> 업데이트 기간을 좀더 길게 가져가도 괜찮겠다!
- 그런데 크게 바뀐다면? 문제 요소 살펴보기
=> 특정 작품 대세화로 일시적 현상인가? / 추세의 변화인가? / 취향 로직의 문제인가? 등등