- Today
1. 클러스터링
2. ppt 초안
- Today I Learned
프로젝트
로그 스케일링을 하지 않고, 클러스터 분석을 다시 진행해보기로 하였다.
1.
pca_n_component = 2 , k = 4
사용 컬럼: 첫 주문 월, 총 주문 수, 카테고리 수, 제품 수, 평균 구매 수량, 평균 구매 주기, 첫 주문까지 걸리는 기간
pca 분산 설명력 : 0.67, 실루엣 계수 : 0.50
2.
pca_n_component = 2 , k = 4
사용 컬럼: 첫 주문 월, 총 주문 수, 제품 수, 평균 구매 수량, 평균 구매 주기, 첫 주문까지 걸리는 기간
pca 분산 설명력 : 0.62, 실루엣 계수 : 0.52
3.
pca_n_component = 2 , k = 4
사용 컬럼: 첫 주문 월, 총 주문 수, 회원가입월, 제품 수, 평균 구매 수량, 평균 구매 주기
pca 분산 설명력 : 0.72, 실루엣 계수 : 0.50
4.
pca_n_component = 2 , k = 4
사용 컬럼: 첫 주문 월, 총 주문 수, 제품 수, 카테고리 수, 총 주문 금액, 첫 주문까지 걸리는 기간, 평균 구매 주기
pca 분산 설명력 : 0.74, 실루엣 계수 : 0.50
5.
pca_n_component = 2 , k = 4
사용 컬럼: 총 주문 건수, 첫 주문 월, 마지막 주문 월, 제품 갯수, 총 주문 금액, 반품 신청 건수, 카테고리 건수, 첫 주문까지 걸린 기간, 평균 구매 주기
pca 분산 설명력 : 0.65, 실루엣 계수 : 0.50
위와 같은 클러스터로 진행하기로 하였다.
1번: 상반기 유입, 1회성 구매로 끝난 유저
2번: 하반기 유입, 1회성 구매로 끝난 유저(하반기여서 구매주기 짧음)
0번: 라이트 유저
3번: 헤비유저
- Next
ppt 완성
테무 확인
'TIL' 카테고리의 다른 글
2024-08-08 (0) | 2024.08.08 |
---|---|
2024-08-07 (0) | 2024.08.07 |
2024-08-05 (0) | 2024.08.06 |
2024-08-02 (0) | 2024.08.02 |
2024-08-01 (0) | 2024.08.01 |