분류 전체보기 233

[Team Project] 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시

프로젝트명: 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시기간: 2024-06-17~24활용 데이터: https://www.kaggle.com/datasets/quangvinhhuynh/marketing-and-retail-analyst-e-comerce  Marketing and Retail Analyst E-comerce www.kaggle.com 마케팅 실무에 가장 가까운 내용이며, 실무에 투입하게 된다면 가장 기본적으로 분석해야하는 내용으로 확인되어 이 데이터를 선정 후 분석하게 되었다.이번 프로젝트에서는 전처리 후 군집분석을 하여 우리가 놓치고 있는 중요한 고객의 패턴을 확인하여 새로운 기준에 따라 유저를 그룹화를 한 후 그 기준을 통해 인사이트를 찾고, 마케팅 방안까지 생각해보았다. 프..

Project 2024.06.25

2024-06-18

Today 프로젝트Today I Learned 프로젝트 군집분류의 중요하게 봐야하는 것! 1. 점이 섞여있는지?>> 섞여있지 않을 수록 좋음!!!2. 점끼리 잘 뭉쳐있는지?-> 그래프가 비슷하게 나왔다-> 실루엣 계수(군집별로 얼마나 잘 뭉쳐있느냐/ 얼마나 잘 뭉쳐있는지 구분하는 것!) 결측치&이상치> 표준화> PCA > K 값 선정 > k-means clustering 시행 > scatter plot 으로 군집 분포 확인 위와 같은 과정을 반복하면서 제일 좋은 결과값을 도출해야한다!좋은 결과값이 나오도록 변수의 조합을 변경해보는 것 이제 노가다의 시작이라고 하더라 ..  Next 프로젝트

TIL 2024.06.18

2024-06-17

Today 프로젝트 진행 Today I Learned 프로젝트 주제 선정 과 분석방향 정리 raw data 확인이상치 처리(특정 기준을 세워 이상치를 정의하고 그 이유를 설명)컬럼별 raw data 분포 시각화컬럼 간 상관계수 히트맵 구현군집 분류Python 머신러닝 라이브러리를 활용하여 진행기존 컬럼과 파생변수 활용상관관계분석나뉜 군집과 다른 컬럼 간의 상관관계 분석연관이 있다면 그것이 군집의 특성이 될 것(인사이트 도출)군집별 차이를 수치화ex) A 그룹 평균 접속일수와 B 그룹 평균 접속일수추가적인 군집별 특성을 알아보기 위한 RFM 스코어화ex) 결제성향별( heavy, medium, row ) 로 나누었고, 각 그룹별 RFM score 는 몇 점이다.군집 특성에 맞는 마케팅 방안 제시마케팅 푸시..

TIL 2024.06.17

2024-06-15

Today1. JD 분석2. SQL 코드카타3. SQL Challenge 3회차 과제 풀이 Today I Learned SQL  There is a factory website that has several machines each running the same number of processes. Write a solution to find the average time each machine takes to complete a process.1개의 테이블의 같은 컬럼안에 다른 정보가 있을 때의 차이 구하기 SELECT a.machine_id , ROUND(AVG(b.timestamp-a.timestamp),3) processing_time FROM ( SELECT machine_..

TIL 2024.06.15

2024-06-14

Today1. SQL 코드카타2. 머신러닝 라이브세션 수강3. SQL Challenge 3회차 과제 풀이4. Python 으로 코드 짜보기+ 머신러닝 개인과제 4번  Today I Learned 머신러닝 개인과제  Logistic Regression  모델로 정확도 계산# 데이터 불러오기from sklearn.datasets import load_irisiris = load_iris()X, y = iris.data, iris.target# train_test_split 를 이용해서 test 데이터를 분리from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test..

TIL 2024.06.14

9주차[2024-06-10 ~ 06-14]

FACTS 이번주는 머신러닝 마지막 주차였다.개인과제가 주어졌고 머신러닝 모델을 사용하여 문제 풀이 후 과제 제출까지 마무리 했다!그리고 튜터님과의 오랜시간동안의 튜터링을 통해 앞으로의 공부방향에 대해서 다시한번 정리하고 일정을 짜보기도 했다.공부 방향을 잡은 후에는 SQL 과 파이썬을 조금더 신경써보기로 했다!대시보드도 드디어 완성되었다 FEELINGS 다음주 부터 시작될 프로젝트 때문에 고민과 걱정이 굉장히 많았는데 튜터님들과의 튜터링 후에 어느정도 갈피가 잡힌 듯 하다. 이제 막 공부를 시작하고 프로젝트를 접해본 나는 헤매고 막막한게 당연한 것이지만 자꾸 부족하다고 생각되었는데 검색을 통해 도메인 지식을 쌓을 수 있다는 정보를 알게되어 속이 조금 편해진 기분이다.어떤 식으로 공부를 해야하는지도 고민..

WIL 2024.06.14

2024-06-13

Today1. SQL 코드카타2. 머신러닝 라이브세션 수강3. SQL Challenge 3회차 과제 풀이4. Python 으로 코드 짜보기 Today I Learned SQLWrite a solution to find the IDs of the users who visited without making any transactions and the number of times they made these types of visits.Visits 테이블에는 있지만 Transactions 테이블에는 없는 user 를 찾는 질문이다!방문을 했지만 업무를 하지 않는 customer_id 가 몇번 방문 했는가를 추출해야한다. 1. Visits 테이블에 있는 user 정보는 전부 불러와야 하기 때문에 LEFT JOI..

TIL 2024.06.13

2024-06-12

Today1. SQL 코드카타 2. 공부계획 세우기3. 머신러닝 분류분석 특강 수강 및 복습4. SQL 챌린지 3회차 수강 Today I Learned SQL Challenge 3회차 퍼널: 소비자의 행동을 기업 관점에서 재구성한 것: 고객이 유입되어 전환에 이르는 단계를 수치로 확인하고 분석하는 방법론> 화면, 진입, 클릭 등으로 지표를 세운다 마케팅 퍼널 AARRR 퍼널 퍼널 단계 세워보기더보기스파르타 코딩 클럽 데이터 분석 신청 퍼널 7단계 이내로 작성 1. 데이터 연관단어 검색 후 광고 클릭2. 스파르타 코딩 클럽 데이터 분석 페이지 조회3. 상담사 연결4. 회원가입 및 신청5. 사전캠프 진행6. 본캠프 수료7. 지인 추천 공유 이벤트 * 좋은 분석가란?> 어떤 지표가 좋은 지표일지 항상 고민하는..

TIL 2024.06.12

2024-06-11

Today1. SQL 코드카타2. 통계학 4회차 라이브 세션3. 머신러닝 기초 수강+ 머신러닝 개인과제 풀이 Today I Learned SQL # 첫번째 시도SELECT eu.unique_id , IF (es.id=eu.id, es.name, es.name) AS nameFROM Employees AS es LEFT JOIN EmployeeUNI AS eu ON es.id=eu.id testcase 는 통과했지만 뭔가 이상함을 느낌...es.name 이 왜 두번이나 들어가야 하는지...?left join 을 쓰면 왼쪽 테이블을 다 가지고 오니까 굳이 쓸 필요가 없지 않나!# 정답쿼리SELECT eu.unique_id , es.name AS nameFROM Employees AS es LE..

TIL 2024.06.11

2024-06-10

Today1. 통계학 3회차 수강 및 복습2. SQL 코드카타3. 대시보드 Today I Learned 통계학 세션  회귀분석  y = a+bx 우리가 가진 데이터셋에 해당 값이 없을 때, 이를 예측하기 위해 회귀분석의 개념이 도입됨추세선 = 우리가 이미 가지고 있는 데이터들을 가장 잘 설명해주는 선 정의: 독립변수로 종속변수를 예측하는 분석기법 프로세스:1. 독립변수, 종속변수 설정: 변수 및 가설 설정2. 데이터 경향성 확인: 독립변수와 종속변수 간 산점도 분석 및 상관3. 적합성 검증 & 결과 해석+회귀모델이 얼마나 설명력을 갖는지?결정계수를 확인(R_squared(R^2))설명력은 전체오류중 회귀를 함으로써 얼마나 개선되었는가를 의미1에 가까울 수록 모델의 성능이 좋다는 것을 의미 +회귀모델이 통..

TIL 2024.06.10