TIL

2024-08-05

여연찌 2024. 8. 6. 00:27
  • Today

프로젝트 피피티 제작

 


  • Today I Learned

 

프로젝트

 

 

 

리차드 튜터님 멘토링

 

> 클러스터 마다의 라벨링 짓기(모르는 사람도 보기 좋게!)

 

0번고객

: 충동고객

: 테크쪽으로 모을 수 있는? 덕후기질을 가진 충동고객 층

 

1번 고객

: 3일마다 한번씩인, 주기적으로 오는 고객?

 

...

 

<테무> 와 비슷한 비즈니스 모델이라는 근거

 

23년으로 올라가면서 매출이 급상승함

보충자료로 제시해서

테무와 엮어서 해보는 것도 좋을 듯

 

알리와 테무에서는 패션잡화, 의류 가 많음

쿠팡, 네이버 쇼핑: 식품. 식료품, 생활용품 (시간이 중요하고, 실생활에서 사용되기 때문에 안전성이 보장되어 있는 )

알리,테무: 알리- 사무/문구/취미용품, 가전/디지털제품, 테무 - 패션 잡화, 의류

(시간대와 상관없이, 쉽게 구매가능, 쉽게 반품 가능한 상품군이 다수)

 

리텐션 주기 또한 다른 업체에 비해서 테무가 월등히 높음

 

* 보충자료로 제시해서 테무와 엮어서 해보는 것도 좋을 듯

 

 

전체 흐름은 우리 데이터이고

비슷한 비즈니스 모델을 확인해보니 테무 와 비슷하다.

테무 비즈니스 모델을 참고하여 액션플랜을 제안하였다.

 


ppt  제작 전 어떤 구성으로 하면 좋을지 논의해보았다.

회사의 현황파악과 회사가 어떤 단계인지, 신규회원의 중요성 및 매출에 미치는 영향까지 중간발표회때 진행하기로 하고

 

이후 최종 발표회 때에는 신규회원의 구매 경향 및 특성, 최근 1년의 신규구매회원들의 클러스터, 테무와의 비슷한 경향이란 점, 액션플랜까지 진행해보기로 하였다.

 

 

 

이전 클러스터링에 대하여 정리중

라인그래프와 실제 데이터의 값의 순서가 다르다는것을 알게되었다.

 

라인그래프: 로그스케일링과 정규화가 된 후 그려진 그래프

표: 원본 데이터로 평균 낸 것

 

로그화를 하는 이유

: 편향 된 데이터를 정규분포 형식으로 바꾸기 위해

 

정규화를 하는 이유

: 각 데이터의 스케일을 조정하여 동일한 범위에 있도록 하기 위해

 

그렇기 때문에 로그 스케일링 후 정규화를 진행한다.

 

> 로그화를 하면서 간격의 차이를 매꾸기 위해 간격과 수치가 모두 변화될 수 있다.

> 이로 인해 정규화가 된 라인그래프에서 순서에 변화가 생길 수 있다.

> 라인그래프에서는 클러스터가 각 군집별 특성에 맞춰 잘 분류되었다는 참고용으로만 보아도 되는지?

(ex. 평균보다 길다, 짧다 등)

 

 

 

소현 튜터님 멘토링

 

산점도가 많이 뭉쳐있지 않고 분산되어 있는 것은 로그 스케일을 했기 때문

로그스케일을 하지 않고 정규화만을 진행 후 클러스터를 해볼 것

 

클러스터 분석이란 100% 해석할 수 없기 때문에

대표성을 띄는 클러스터를 파악하고 추가로 원본 데이터셋을 분석하여 부가 설명을 해야함

라인그래프를 통해서는 군집간의 차이점을 한 두개 보는 것

 

중간 발표회 때 클러스터 정도는 나오면 좋을 듯 하다.

최종발표회에는 클러스터 이후 인사이트 및 액션 플랜 찾기

 

 


우선 오늘은 초반 부분에 대하여 ppt 를 작성하고

내일은 클러스터를 한번 더 진행해보기로 하였다.

 

1~5(컬럼 가져오기)

6~12(단계파악~문제점)

13~16(신규 회원과 기존 회원 비교~ +신규연결고리 체크)

18~24(신규 고객경향~

 

2021

#f47c00

2022

#c67c30

2023

#a85703

 

 

 


  • Next

클러스터 진행

 

 

'TIL' 카테고리의 다른 글

2024-08-07  (0) 2024.08.07
2024-08-06  (0) 2024.08.06
2024-08-02  (0) 2024.08.02
2024-08-01  (0) 2024.08.01
2024-07-31  (0) 2024.07.31