- Today
프로젝트 피피티 제작
- Today I Learned
프로젝트
리차드 튜터님 멘토링
> 클러스터 마다의 라벨링 짓기(모르는 사람도 보기 좋게!)
0번고객
: 충동고객
: 테크쪽으로 모을 수 있는? 덕후기질을 가진 충동고객 층
1번 고객
: 3일마다 한번씩인, 주기적으로 오는 고객?
...
<테무> 와 비슷한 비즈니스 모델이라는 근거
23년으로 올라가면서 매출이 급상승함
보충자료로 제시해서
테무와 엮어서 해보는 것도 좋을 듯
알리와 테무에서는 패션잡화, 의류 가 많음
쿠팡, 네이버 쇼핑: 식품. 식료품, 생활용품 (시간이 중요하고, 실생활에서 사용되기 때문에 안전성이 보장되어 있는 )
알리,테무: 알리- 사무/문구/취미용품, 가전/디지털제품, 테무 - 패션 잡화, 의류
(시간대와 상관없이, 쉽게 구매가능, 쉽게 반품 가능한 상품군이 다수)
리텐션 주기 또한 다른 업체에 비해서 테무가 월등히 높음
* 보충자료로 제시해서 테무와 엮어서 해보는 것도 좋을 듯
전체 흐름은 우리 데이터이고
비슷한 비즈니스 모델을 확인해보니 테무 와 비슷하다.
테무 비즈니스 모델을 참고하여 액션플랜을 제안하였다.
ppt 제작 전 어떤 구성으로 하면 좋을지 논의해보았다.
회사의 현황파악과 회사가 어떤 단계인지, 신규회원의 중요성 및 매출에 미치는 영향까지 중간발표회때 진행하기로 하고
이후 최종 발표회 때에는 신규회원의 구매 경향 및 특성, 최근 1년의 신규구매회원들의 클러스터, 테무와의 비슷한 경향이란 점, 액션플랜까지 진행해보기로 하였다.
이전 클러스터링에 대하여 정리중
라인그래프와 실제 데이터의 값의 순서가 다르다는것을 알게되었다.
라인그래프: 로그스케일링과 정규화가 된 후 그려진 그래프
표: 원본 데이터로 평균 낸 것
로그화를 하는 이유
: 편향 된 데이터를 정규분포 형식으로 바꾸기 위해
정규화를 하는 이유
: 각 데이터의 스케일을 조정하여 동일한 범위에 있도록 하기 위해
그렇기 때문에 로그 스케일링 후 정규화를 진행한다.
> 로그화를 하면서 간격의 차이를 매꾸기 위해 간격과 수치가 모두 변화될 수 있다.
> 이로 인해 정규화가 된 라인그래프에서 순서에 변화가 생길 수 있다.
> 라인그래프에서는 클러스터가 각 군집별 특성에 맞춰 잘 분류되었다는 참고용으로만 보아도 되는지?
(ex. 평균보다 길다, 짧다 등)
소현 튜터님 멘토링
산점도가 많이 뭉쳐있지 않고 분산되어 있는 것은 로그 스케일을 했기 때문
로그스케일을 하지 않고 정규화만을 진행 후 클러스터를 해볼 것
클러스터 분석이란 100% 해석할 수 없기 때문에
대표성을 띄는 클러스터를 파악하고 추가로 원본 데이터셋을 분석하여 부가 설명을 해야함
라인그래프를 통해서는 군집간의 차이점을 한 두개 보는 것
중간 발표회 때 클러스터 정도는 나오면 좋을 듯 하다.
최종발표회에는 클러스터 이후 인사이트 및 액션 플랜 찾기
우선 오늘은 초반 부분에 대하여 ppt 를 작성하고
내일은 클러스터를 한번 더 진행해보기로 하였다.
1~5(컬럼 가져오기)
6~12(단계파악~문제점)
13~16(신규 회원과 기존 회원 비교~ +신규연결고리 체크)
18~24(신규 고객경향~
2021
#f47c00
2022
#c67c30
2023
#a85703
- Next
클러스터 진행
'TIL' 카테고리의 다른 글
2024-08-07 (0) | 2024.08.07 |
---|---|
2024-08-06 (0) | 2024.08.06 |
2024-08-02 (0) | 2024.08.02 |
2024-08-01 (0) | 2024.08.01 |
2024-07-31 (0) | 2024.07.31 |