분류 전체보기 230

2024-07-03

Today1. ADsP2. Project 진행 Today I Learned ADsP 데이터웨어하우스: 정적인 데이터가 중요하며, 일정기간동안 안정적으로 정보를 저장하는 것을 목적으로 두고 있다. 유전 알고리즘: 문제에 대한 최적 해결책을 찾는 것ex. 시청률을 얻으려면 어떤 시간대에 방송해야하는가?ex. 최적의 택배 차량 배치 방법 무결성: 데이터베이스 내에서 데이터 변경이나 수정 시에 정확성,일관성,유효성,신뢰성을 보장하기 위해여러가지 제한을 두어 데이터의 정확성을 보증하는 것 분석체계 구현은 반복적 분석 선순환 구조 맵: 분석 내용을 선택과 결과로 모델링 분석 성숙도를 진단하는 영역 3가지1. 비즈니스2. IT3. 조직,역량 빅데이터 4V 특성volume(데이터양)variety(데이터 종류)veloc..

TIL 2024.07.03

2024-07-02

Today1. 태블로 라이브 세션 2회차2. ADsP 강의 수강 Today I Learned SQL  기본 스크롤은 페이지의 90% 를 넘었을 때 스크롤 이벤트가 찍힌다..SELECT COUNT(DISTINCT user_pseudo_id, ga_session_id) AS pvFROM gaWHERE page_title = '백문이불여일타 SQL 캠프 입문반'AND event_name = 'page_view'위와 같은 함수에서 COUNT 안에 2가지를 넣을 수 없는 프로그램(빅쿼리 등)의 경우SELECT COUNT(DISTINCT CONCAT(user_pseudo_id, ga_session_id)) AS pv이렇게 CONCAT 을 사용하여 COUNT 해주면 같은 결과를 낼 수 있다!   ADsP  비즈니스 ..

TIL 2024.07.02

2024-07-01

Today태블로 라이브세션 수강 및 복습 Today I Learned  태블로 관계: 각 테이블들이 독립적으로 작동함: 데이터의 결합이 워크시트의 뷰 레벨에서 결정됨: 표현하는 방식에 따라 데이터가 생략되거나 왜곡될 수 있음 조인: SQL 의 join 과 같음 블랜딩: 여러개의 데이터원본을 워크시트에 바로 연결해서 사용: 불안정하고 매칭하는 키 값이 자주 어긋나기 때문에 사용을 권장하지 않음 유니온: 데이터의 형식이 달라도 그냥 상하로 결합함: 컬럼이 달라도 모든 컬럼이 표시되며 일치하지 않으면 데이터를 NULL 로 표현* 와일드카드- 특정 단어 등이 포함되었을 때 전부 연결해줌   운영대시보드: 실시간 정보를 간략화 해서 사용자가 지표를 쉽게 모니터링 할 수 있도록 한다.분석대시보드: 데이터를 통해 인..

TIL 2024.07.01

2024-06-27

Today1. SQL 코드카타 2. Tableau 3주차 수강, 4주차 4-1 수강 Today I Learned SQL 평균 판매 가격을 구하기Write a solution to find the average selling price for each product. average_price should be rounded to 2 decimal places.SELECT p.product_id , CASE WHEN start_date    원하는 형식처럼 나오기는 했지만, 여기서 원하는 값이 나오지 않았다.. CASE WHEN 을 사용하는 것은 맞는 것 같은데 조건이 잘 못 들어 간듯하다.     join 후 테이블의 상태를 확인해보니 group by 를 하기 전에는 위와 같은 상태였고, group..

TIL 2024.06.27

2024-06-26

Today1. SQL 코드카타 1문2. project 정리3. 태블로 2주차 강의 수강 Today I Learned SQL  조건이 포함되지 않는 데이터 출력하기Write a solution to report the movies with an odd-numbered ID and a description that is not "boring".SELECT *FROM CinemaWHERE id % 2 != 0 AND description NOT LIKE "%boring%"ORDER BY rating DESC;같지 않다 라는 의미에서 != 또는 을 사용 하면 된다..NOT LIKE 를 사용하면 해당 단어가 포함되지 않는 것을 출력함 파이썬만 주구장창 보다보니 SQL을 점점 잊어가는 느낌이다ㅠㅠ이번 프로젝트에서..

TIL 2024.06.26

KPT 회고 - 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시

Keep 이번 프로젝트도 팀원들과의 끊임없는 소통으로 잘 마무리 될 수 있었던 프로젝트이다.초반에 한번 뒤엎는 작업이 있었으나 무사히 발표회까지 마무리 하였다. 머신러닝의 이해를 위해 튜터님의 노션강의본을 찾아보고, 열심히 구글링을 통해 프로젝트를 진행했다. 코드부터 분석, ppt 제작, script 까지 모두 참여했는데 지난번 프로젝트에 비해 조금더 다양하게 그리고 많이 참여를 했던 것 같아 다행이라는 생각을 했다. 지난번 프로젝트때 피드백을 받았었던 목적설정을 확실하게 잡고 갔고, 마지막 마케팅 방안 제시까지 끝냈기때문에 조금더 완성도 있는 프로젝트가 나왔다고 생각한다. Problem  전처리 진행부터 머신러닝 코드를 짜는 것 까지 이번에는 gpt의 도움을 많이 받았던 것 같아 아쉬움이 크다. 조금씩..

Project/KPT 회고 2024.06.25

[Team Project] 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시

프로젝트명: 구매 성향에 따른 분류와 그에 따른 마케팅 방안 제시기간: 2024-06-17~24활용 데이터: https://www.kaggle.com/datasets/quangvinhhuynh/marketing-and-retail-analyst-e-comerce  Marketing and Retail Analyst E-comerce www.kaggle.com 마케팅 실무에 가장 가까운 내용이며, 실무에 투입하게 된다면 가장 기본적으로 분석해야하는 내용으로 확인되어 이 데이터를 선정 후 분석하게 되었다.이번 프로젝트에서는 전처리 후 군집분석을 하여 우리가 놓치고 있는 중요한 고객의 패턴을 확인하여 새로운 기준에 따라 유저를 그룹화를 한 후 그 기준을 통해 인사이트를 찾고, 마케팅 방안까지 생각해보았다. 프..

Project 2024.06.25

2024-06-18

Today 프로젝트Today I Learned 프로젝트 군집분류의 중요하게 봐야하는 것! 1. 점이 섞여있는지?>> 섞여있지 않을 수록 좋음!!!2. 점끼리 잘 뭉쳐있는지?-> 그래프가 비슷하게 나왔다-> 실루엣 계수(군집별로 얼마나 잘 뭉쳐있느냐/ 얼마나 잘 뭉쳐있는지 구분하는 것!) 결측치&이상치> 표준화> PCA > K 값 선정 > k-means clustering 시행 > scatter plot 으로 군집 분포 확인 위와 같은 과정을 반복하면서 제일 좋은 결과값을 도출해야한다!좋은 결과값이 나오도록 변수의 조합을 변경해보는 것 이제 노가다의 시작이라고 하더라 ..  Next 프로젝트

TIL 2024.06.18

2024-06-17

Today 프로젝트 진행 Today I Learned 프로젝트 주제 선정 과 분석방향 정리 raw data 확인이상치 처리(특정 기준을 세워 이상치를 정의하고 그 이유를 설명)컬럼별 raw data 분포 시각화컬럼 간 상관계수 히트맵 구현군집 분류Python 머신러닝 라이브러리를 활용하여 진행기존 컬럼과 파생변수 활용상관관계분석나뉜 군집과 다른 컬럼 간의 상관관계 분석연관이 있다면 그것이 군집의 특성이 될 것(인사이트 도출)군집별 차이를 수치화ex) A 그룹 평균 접속일수와 B 그룹 평균 접속일수추가적인 군집별 특성을 알아보기 위한 RFM 스코어화ex) 결제성향별( heavy, medium, row ) 로 나누었고, 각 그룹별 RFM score 는 몇 점이다.군집 특성에 맞는 마케팅 방안 제시마케팅 푸시..

TIL 2024.06.17