전체 글 230

KPT 회고 - 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시

Keep 이번 프로젝트도 팀원들과의 끊임없는 소통으로 잘 마무리 될 수 있었던 프로젝트이다.초반에 한번 뒤엎는 작업이 있었으나 무사히 발표회까지 마무리 하였다. 머신러닝의 이해를 위해 튜터님의 노션강의본을 찾아보고, 열심히 구글링을 통해 프로젝트를 진행했다. 코드부터 분석, ppt 제작, script 까지 모두 참여했는데 지난번 프로젝트에 비해 조금더 다양하게 그리고 많이 참여를 했던 것 같아 다행이라는 생각을 했다. 지난번 프로젝트때 피드백을 받았었던 목적설정을 확실하게 잡고 갔고, 마지막 마케팅 방안 제시까지 끝냈기때문에 조금더 완성도 있는 프로젝트가 나왔다고 생각한다. Problem  전처리 진행부터 머신러닝 코드를 짜는 것 까지 이번에는 gpt의 도움을 많이 받았던 것 같아 아쉬움이 크다. 조금씩..

Project/KPT 회고 2024.06.25

[Team Project] 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시

프로젝트명: 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시기간: 2024-06-17~24활용 데이터: https://www.kaggle.com/datasets/quangvinhhuynh/marketing-and-retail-analyst-e-comerce  Marketing and Retail Analyst E-comerce www.kaggle.com 마케팅 실무에 가장 가까운 내용이며, 실무에 투입하게 된다면 가장 기본적으로 분석해야하는 내용으로 확인되어 이 데이터를 선정 후 분석하게 되었다.이번 프로젝트에서는 전처리 후 군집분석을 하여 우리가 놓치고 있는 중요한 고객의 패턴을 확인하여 새로운 기준에 따라 유저를 그룹화를 한 후 그 기준을 통해 인사이트를 찾고, 마케팅 방안까지 생각해보았다. 프..

Project 2024.06.25

2024-06-18

Today 프로젝트Today I Learned 프로젝트 군집분류의 중요하게 봐야하는 것! 1. 점이 섞여있는지?>> 섞여있지 않을 수록 좋음!!!2. 점끼리 잘 뭉쳐있는지?-> 그래프가 비슷하게 나왔다-> 실루엣 계수(군집별로 얼마나 잘 뭉쳐있느냐/ 얼마나 잘 뭉쳐있는지 구분하는 것!) 결측치&이상치> 표준화> PCA > K 값 선정 > k-means clustering 시행 > scatter plot 으로 군집 분포 확인 위와 같은 과정을 반복하면서 제일 좋은 결과값을 도출해야한다!좋은 결과값이 나오도록 변수의 조합을 변경해보는 것 이제 노가다의 시작이라고 하더라 ..  Next 프로젝트

TIL 2024.06.18

2024-06-17

Today 프로젝트 진행 Today I Learned 프로젝트 주제 선정 과 분석방향 정리 raw data 확인이상치 처리(특정 기준을 세워 이상치를 정의하고 그 이유를 설명)컬럼별 raw data 분포 시각화컬럼 간 상관계수 히트맵 구현군집 분류Python 머신러닝 라이브러리를 활용하여 진행기존 컬럼과 파생변수 활용상관관계분석나뉜 군집과 다른 컬럼 간의 상관관계 분석연관이 있다면 그것이 군집의 특성이 될 것(인사이트 도출)군집별 차이를 수치화ex) A 그룹 평균 접속일수와 B 그룹 평균 접속일수추가적인 군집별 특성을 알아보기 위한 RFM 스코어화ex) 결제성향별( heavy, medium, row ) 로 나누었고, 각 그룹별 RFM score 는 몇 점이다.군집 특성에 맞는 마케팅 방안 제시마케팅 푸시..

TIL 2024.06.17

2024-06-15

Today1. JD 분석2. SQL 코드카타3. SQL Challenge 3회차 과제 풀이 Today I Learned SQL  There is a factory website that has several machines each running the same number of processes. Write a solution to find the average time each machine takes to complete a process.1개의 테이블의 같은 컬럼안에 다른 정보가 있을 때의 차이 구하기 SELECT a.machine_id , ROUND(AVG(b.timestamp-a.timestamp),3) processing_time FROM ( SELECT machine_..

TIL 2024.06.15

2024-06-14

Today1. SQL 코드카타2. 머신러닝 라이브세션 수강3. SQL Challenge 3회차 과제 풀이4. Python 으로 코드 짜보기+ 머신러닝 개인과제 4번  Today I Learned 머신러닝 개인과제  Logistic Regression  모델로 정확도 계산# 데이터 불러오기from sklearn.datasets import load_irisiris = load_iris()X, y = iris.data, iris.target# train_test_split 를 이용해서 test 데이터를 분리from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test..

TIL 2024.06.14

9주차[2024-06-10 ~ 06-14]

FACTS 이번주는 머신러닝 마지막 주차였다.개인과제가 주어졌고 머신러닝 모델을 사용하여 문제 풀이 후 과제 제출까지 마무리 했다!그리고 튜터님과의 오랜시간동안의 튜터링을 통해 앞으로의 공부방향에 대해서 다시한번 정리하고 일정을 짜보기도 했다.공부 방향을 잡은 후에는 SQL 과 파이썬을 조금더 신경써보기로 했다!대시보드도 드디어 완성되었다 FEELINGS 다음주 부터 시작될 프로젝트 때문에 고민과 걱정이 굉장히 많았는데 튜터님들과의 튜터링 후에 어느정도 갈피가 잡힌 듯 하다. 이제 막 공부를 시작하고 프로젝트를 접해본 나는 헤매고 막막한게 당연한 것이지만 자꾸 부족하다고 생각되었는데 검색을 통해 도메인 지식을 쌓을 수 있다는 정보를 알게되어 속이 조금 편해진 기분이다.어떤 식으로 공부를 해야하는지도 고민..

WIL 2024.06.14