2024/04/19 5

1주차[2024-04-15 ~ 19]

FACTS 본캠프가 시작되었다. 본캠프는 사전캠프와는 다르게 오전 9시부터 오후 9시까지, 총 12시간을 달려야 한다. 시작됨과 동시에 미니프로젝트가 시작되었기에 OT 후 새롭게 배정된 팀원분들과 만나 소통을 하고 팀명과 프로젝트 주제를 선정하였다. 팀운이 정말 좋았다. 함께 일주일을 보내게 된 팀원분들의 모두 대단하셨기 때문에 정말 많은 배움의 기회를 얻을 수 있었다. 심지어 두분은 데이터분석 관련한 업무를 하다 오신 경력자분들이었다! 프로젝트 주제를 선정하고, 그 뒤 코드를 짜고 어떤 방식으로 결론을 내릴지 오랜시간동안 회의를 진행하였고 정해진 기간안에 무사히 마무리하여 제출할 수 있었다. 4주간의 사전캠프 기간동안 배웠던 기술들로 내가 해볼 수 있었던 것은 분기별, 매출, 주문수량 등을 직접 코드를..

WIL 2024.04.19

2024-04-19

Today 1. 프로젝트 발표회 2. SQL, 알고리즘 코드카타 3. ADsP 강의(로지스틱회귀분석) Today I Learned SQL https://lyj-01.tistory.com/101 상품을 구매한 회원 비율 구하기 USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 lyj-01.tistory.com 팀원분의 조언을 참고해서 복잡한 쿼리를 먼저 작성해보고자 했는데 WHERE user_id IN ( SELECT user_id FROM user_info WHERE joined LIKE '2021-%' ) WHERE 절에서 서브쿼..

TIL 2024.04.19

분류분석모형 - 로지스틱회귀분석

* 분류분석 : 반응변수(종속변수)가 알려진 다변량 자료를 이용하여 모형을 구축, 새로운 자료에 대한 예측 및 분류를 수행 : 주어진 데이터를 미리 정의된 여러 클래스 중 하나로 분류하는 작업 : 반응변수가 범주형인 경우 > 새로운 자료에 대한 분류가 주목적 : 연속형인 경우 >그 값을 예측 하는 것이 주목적 로지스틱회귀분석 : 종속변수가 범주형 데이터인 경우에 사용 : 새로운 독립변수의 값이 주어질 때 종속변수 각 범주에 속할 확률이 얼마인지를 추정 * A,B,C 가 있고, A 75%, B 10%, C 15% 로 나오면 가장 확률이 높은 A 이다 라고 판단을 할 수 있도록 만드는 것 : 주로 이진 분류가 기본, 세개 이상의 집단을 분류하는 경우 다중 로지스틱 회귀분석이라고 한다 : 독립변수가 연속형, ..

ADsP 내용 정리 2024.04.19

[Mini Team Project] 상품 판매 데이터 분석에 따른 판매 상품 추천

프로젝트명: 상품 판매 데이터 분석에 따른 판매 상품 추천기간: 2024-04-15~19활용 데이터: https://www.kaggle.com/datasets/ammaraahmad/us-ecommerce-record-2020 United States E-Commerce records 202015+ columns on Order historywww.kaggle.com 주제를 정하기 전 해당 데이터가 가지고 있는 정보들을 조회해보고어떤 값을 빼내올 수 있는지를 분석해보았다.기본적으로 월별,주(state)별, 분기별, 카테고리별 등으로 구분하여매출액, 수익 등을 분석해보았는데그 중 가장 데이터를 많이 확보할 수 있는 'Technology'  카테고리를 선정하여 조금더 깊은 분석을 해보고자 하였다   1. 개요..

Project 2024.04.19

상품을 구매한 회원 비율 구하기

USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 회원 수)을 년, 월 별로 출력하는 SQL문을 작성해주세요. 상품을 구매한 회원의 비율은 소수점 두번째자리에서 반올림하고, 전체 결과는 년을 기준으로 오름차순 정렬해주시고 년이 같다면 월을 기준으로 오름차순 정렬해주세요. SELECT YEAR(sales_date) , MONTH(sales_date) , COUNT(DISTINCT user_id) PUCHASED_USERS , ROUND(COUNT(DISTINCT user_id)/ (SELECT COUNT(user_id) FROM us..

SQL 코드카타 2024.04.19