TIL

2024-07-24

여연찌 2024. 7. 24. 17:08
  • Today

프로젝트 기획 및 스터디

 


  • Today I Learned

 

프로젝트

 

재구매를 독려하고 이탈률을 낮추기 위해 데이터 분석을 진행

 

 

대희튜터님 멘토링

 

1. 개인 맞춤화 알고리즘까지 건드려볼 수 있는지? 

전처리 한 데이터에 대해서 어떤 라이브러리를 쓴다.

구글, gpt 등에 확인 후 진행하는 것이 더 효율적

⇒ 딥러닝 공부하는 시간을 따로 뺄 필요는 없음

 

2. 추가적인 분석 방법론

어떤 방법론을 쓸지는 중요하지 않음

어떤 지표를 선정해서 고객에게 어떻게 하겠다. 라는 지표가 있을 것인데

코호트, 리텐션 만으로도 충분함

코호트- 어떤 코호트로 분리해서 볼 것인지

리텐션- 리텐션 관련된 데이터가 있어야 하며, 리텐션을 설정하는 것만으로도 다양한 기준으로 나눌 수 있음

초반에 데이터를 볼때, 여러가지 방면으로 보는 것이 중요함

핵심지표: 1고객만족도 향상 2. 재구매 3. 이탈률

위 3가지를 구체화 시키는 것이 중요함

“우리가 어떤 지표를 선정했고, 그를 위해 많은 노력과 많은 방법을 사용해보았다”

위와 같이 딥하게 파고드는 것이 중요함

방법갯수보다 지표 몇개를 정해놓고 최대한 깊이있게 파보는 것이 중요함

실제회사에서도 핵심지표를 여러개를 두지 않음

⇒ 지금 방법론만으로도 괜찮다.

 

3. 원했던 방향과 기획안의 방향

기획서 안에서 구체화 시킬 것은

우리만의 기준이 있어야 함

파악한 구매패턴과 파악한 선호도, 행동파악 등과 같은 것을 구체화(정의 등/ 다른 사람들이 선호도가 어떤것인데? 하고 물어보지 않도록) 시키는 것이 중요함

⇒기획서 상에 담을 필요는 없으나 프로젝트를 진행하기 전 미리 바탕으로 선순위로 진행되어야 함

 

4. 문제 상황을 데이터를 가진 채로 그 안에서 파악하는 순서가 맞는지

문제정의를 크게 해둔 후 EDA 를 한 후에 구체화 하는 것

데이터를 아직 모르게 때문에 추상적으로 문제 정의 후 분석을 하며 문제를 구체화 시킬 것

실제회사에서도 목적,의도,문제정의, 가설 의 경우 프로젝트를 끝날때까지 변할 수 있음

 

5. 구매데이터, 행동 데이터 등 각 다른 데이터셋이 나올 수 있음(한 데이터셋 안에 들어있지 않음)

key 값을 임의로 설정하는 등으로 연결시켜도 문제가 없을지?

신뢰도가 떨어질 수 있으며, 이를 감안하고서라도 진행할 것인지

현재로서는 어떤 문제가 있는지 알 수 없으나 그로 인해 발생한 문제를 어떻게 처리 할 것인지에 대한 기획 회의가 필요함

 

 

 

[프로젝트 진행 전 사전 스터디]

1. e-커머스의 분석 흐름은 어떻게 되나?

  • 방문(유입)경로 어디서 많이 들어오는가? → 어떤 채널을 주로 이용하는가? 그 채널에 문제는 없는가? / 왜 많이 들어오게 되는가?
  • 방문율or방문 수 / 반송(유입 후 즉시 나가는 것)률 들어 오는 사람들의 수가 압도적으로 적지는 않은가? 들어오자마자 나가는 사람들이 많으면 그들을 어떻게 잡아 둘 것인가? 그냥 포기할 것인가? 왜 다음 서비스까지 보려고 하지 않을까?를 알아보아야 할 것
  • 어떤 서비스를 제공하고 있는가? ex. 장바구니까지 이어지지 않는다면 UI/UX의 문제거나 찾는 제품이 없거나 원하는 것을 제공받지 못했기 때문에 이탈하게 되는 것. 흥미를 끌 수 있는 무언가를 찾아야 한다가 목표가 될 수 있을듯? 여튼..
  • (실제 구매 여정) 장바구니 - 상품추가 - (구매)전환 / 포기율, 전환율 ex. 어느 단계에서 전환이 발생하지 않는가? (중도 포기를 하는가?)를 파악, 개선해야하는 부분을 판단할 수 있음
  • (배송 관련 서비스) 물류, 지연 / 불만족(평가 점수, 배송 이슈 확인 필요)인 경우 이탈로 판단 ex. 지연이 잦아 고객의 평가가 낮아진다면 어떻게 개선을 해야할까, 무엇이 문제일까 파악 필요
  • 전달(배송 완료)후 일회성 구매 or 재구매 확인 ex. 일회성 구매자가 많다면 어떻게 이들의 재구매율을 높일 것인가가 문제정의 및 목표가 됨

* AARRR 의 경우

전체적인 흐름 파악용으로는 좋겠으나 유입 채널 트래킹 프로덕트 가 존재해야 한다.

하지만 우리가 소유하고 있는 데이터셋에는 그러한 정보들이 없다보니 이 분석론은 채택하지 않기로 하였다.

 

 

2. 코호트 분석은 어떤 분석인가?

동일한 기간 동안 동일한 특성을 가진 사람들을 모아 분석하는 것

집단을 나눌 때에는 ‘기간’ 에 대한 정의와 ‘어느 유형’ 의 유저인지에 대한 정의가 필요

고려해야 할 점

나이/지역/구매 횟수/서비스 버전 등을 기준으로 집단을 나누어서는 안됨

세그먼트 : ‘특성’을 바탕으로 묶인 집단 코호트 : ‘기간’에 따른 ‘특성’을 바탕으로 묶인 집단

코호트 = 특정 기간에 특정 행동/특징/특성이 일치하는 집단

코호트 분석을 통해 차이를 확인 할 수 있는 지표

  1. 전환률
  2. 리텐셜율
  3. 이용자의 목표 달성률
  4. 이용자의 수익률
  5. 이용자 당 세션
  6. 이용자 당 페이지 뷰 수
  7. 이용자 당 세션 기간 (얼마나 오래 머물러 있는지)
  8. 이용자당 전환률

코호트 분석을 통하여 고려해볼 수 있는 문제점을 추측하여 가설 설정

ex. 재구매율이 낮아지고 있다.

어떤 문제가 있는지 가설 설정

→ 해당 서비스의 제품 수명 주기(시작-종료) 와 유저 수명 주기(유입-완전이탈) 를 알아낼 수 있음

코호트 분석을 통해 알아낼 수 있는 내용

  1. 이용률 예측
  2. 리텐션률 예측
  3. 특정 기간 내 이용자 집단 VS 다른 기간 이용자 집단의 행동 특성 및 차이점 파악 가능
  4. 온보딩/고객경험이 이들을 만족시켰는가에 대한 여부 파악 가능
  5. 제품의 품질과 운영 및 고객지원 서비스의 개선이 필요한가에 대한 여부 파악 가능

 

3. 리텐션 분석은 어떤 분석인가?

시간이 지날수록 얼마나 많은 유저가 제품으로 다시 돌아오는지를 측정한 것

리텐션 정의(서비스의 방문 빈도, 구매 빈도, 도메인 특성에 따라 다르게 정의됨/ 모든 액션에 대해서 설정 가능)

  1. 방문 후 재방문
  2. 구매 후 재구매
  3. 구매 후 로그인
  4. 로그인 후 로그인

→ 가장 많이 쓰이는 리텐션은 재방문, 재구매

⇒ 리텐션을 정의할 때 가장 중요한 것은 ‘ 그 행동이 비즈니스에서 중요하게 생각하는 고객의 핵심 행동인가? ‘

*서비스나 유저의 행동 패턴에 따라 다르게 선택되어야 함

<리텐션율 계산 방법>

  • 클래식(Classic / N-Day) 리텐션

: N일차 기준

매일 들어와야하는 서비스 (ex. 메신저 앱, SNS서비스, 숙제나 일일보상이 있는 게임 등)

클래식 리텐션 계산

Day N 에 다시 A 행동을 수행한 사람 / 기준 날짜 Day 0 에 A 행동을 수행한 사람

  • 범위(Bracket / Range /Bounded) 리텐션

: 일정 기간 기준

주기적인 서비스

범위 리텐션률 계산

설정한 주기에 들어온 사람 수 / 전체 인원

  • 롤링(Rolling / On or After / Unbounded) 리텐션

: 기준일 포함 그 이후에 한번이라도 온 사람 기준

사용 빈도가 높지 않은 서비스(여행,쇼핑몰,부동산 등)

**‘이탈의 기준’**을 잘 정의해야함

롤링 리텐션율 계산

(Day0 첫 A 행동을 수행한 사람 - DayN 이후 이탈한 사람) / Day0 첫 A 행동을 수행한 사람

 

 

 

[추가확인]

1. 사용할 데이터 유형 fix

구매데이터, 고객성향데이터

2. 사용할 데이터 셋 fix

E-commerce Analytics: Detailed Dataset

 

3. fix한 데이터 셋이 여러 개 라면, 어떻게 데이터를 합칠 것인가

 

 

 

 

CRM 세일즈에 대한 솔루션을 해주세요

영업의 파이프라인을 체계적으로 관리해서

고객 맞춤 영업을 할 수 있도록 해주세요

 

 


  • Next

컬럼을 해석하고, 프로젝트의 기획을 구체화 하고, 이상치와 결측치를 처리 하기로 했다!

 

 

'TIL' 카테고리의 다른 글

2024-07-26  (1) 2024.07.26
2024-07-25  (0) 2024.07.25
2024-07-23  (2) 2024.07.23
2024-07-22  (3) 2024.07.22
2024-07-19  (0) 2024.07.19