TIL

2024-08-06

여연찌 2024. 8. 6. 18:59
  • Today

1. 클러스터링

2. ppt 초안

 


  • Today I Learned

 

프로젝트

 

로그 스케일링을 하지 않고, 클러스터 분석을 다시 진행해보기로 하였다.

 

더보기

1.

pca_n_component = 2 , k = 4

사용 컬럼: 첫 주문 월, 총 주문 수, 카테고리 수, 제품 수, 평균 구매 수량, 평균 구매 주기, 첫 주문까지 걸리는 기간

pca 분산 설명력 : 0.67, 실루엣 계수 : 0.50

 

 

2.

pca_n_component = 2 , k = 4

사용 컬럼: 첫 주문 월, 총 주문 수, 제품 수, 평균 구매 수량, 평균 구매 주기, 첫 주문까지 걸리는 기간

pca 분산 설명력 : 0.62, 실루엣 계수 : 0.52

3.

pca_n_component = 2 , k = 4

사용 컬럼: 첫 주문 월, 총 주문 수, 회원가입월, 제품 수, 평균 구매 수량, 평균 구매 주기

pca 분산 설명력 : 0.72, 실루엣 계수 : 0.50

 

4.

pca_n_component = 2 , k = 4

사용 컬럼: 첫 주문 월, 총 주문 수, 제품 수, 카테고리 수, 총 주문 금액, 첫 주문까지 걸리는 기간, 평균 구매 주기

pca 분산 설명력 : 0.74, 실루엣 계수 : 0.50

 

5.

pca_n_component = 2 , k = 4

사용 컬럼: 총 주문 건수, 첫 주문 월, 마지막 주문 월, 제품 갯수, 총 주문 금액, 반품 신청 건수, 카테고리 건수, 첫 주문까지 걸린 기간, 평균 구매 주기

pca 분산 설명력 : 0.65, 실루엣 계수 : 0.50

 

위와 같은 클러스터로 진행하기로 하였다.

 

1번: 상반기 유입, 1회성 구매로 끝난 유저

2번: 하반기 유입, 1회성 구매로 끝난 유저(하반기여서 구매주기 짧음)

0번: 라이트 유저

3번: 헤비유저

 

 


  • Next

ppt  완성

테무 확인

'TIL' 카테고리의 다른 글

2024-08-08  (0) 2024.08.08
2024-08-07  (0) 2024.08.07
2024-08-05  (0) 2024.08.06
2024-08-02  (0) 2024.08.02
2024-08-01  (0) 2024.08.01