TIL 120

2024-06-14

Today1. SQL 코드카타2. 머신러닝 라이브세션 수강3. SQL Challenge 3회차 과제 풀이4. Python 으로 코드 짜보기+ 머신러닝 개인과제 4번  Today I Learned 머신러닝 개인과제  Logistic Regression  모델로 정확도 계산# 데이터 불러오기from sklearn.datasets import load_irisiris = load_iris()X, y = iris.data, iris.target# train_test_split 를 이용해서 test 데이터를 분리from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test..

TIL 2024.06.14

9주차[2024-06-10 ~ 06-14]

FACTS 이번주는 머신러닝 마지막 주차였다.개인과제가 주어졌고 머신러닝 모델을 사용하여 문제 풀이 후 과제 제출까지 마무리 했다!그리고 튜터님과의 오랜시간동안의 튜터링을 통해 앞으로의 공부방향에 대해서 다시한번 정리하고 일정을 짜보기도 했다.공부 방향을 잡은 후에는 SQL 과 파이썬을 조금더 신경써보기로 했다!대시보드도 드디어 완성되었다 FEELINGS 다음주 부터 시작될 프로젝트 때문에 고민과 걱정이 굉장히 많았는데 튜터님들과의 튜터링 후에 어느정도 갈피가 잡힌 듯 하다. 이제 막 공부를 시작하고 프로젝트를 접해본 나는 헤매고 막막한게 당연한 것이지만 자꾸 부족하다고 생각되었는데 검색을 통해 도메인 지식을 쌓을 수 있다는 정보를 알게되어 속이 조금 편해진 기분이다.어떤 식으로 공부를 해야하는지도 고민..

WIL 2024.06.14

2024-06-13

Today1. SQL 코드카타2. 머신러닝 라이브세션 수강3. SQL Challenge 3회차 과제 풀이4. Python 으로 코드 짜보기 Today I Learned SQLWrite a solution to find the IDs of the users who visited without making any transactions and the number of times they made these types of visits.Visits 테이블에는 있지만 Transactions 테이블에는 없는 user 를 찾는 질문이다!방문을 했지만 업무를 하지 않는 customer_id 가 몇번 방문 했는가를 추출해야한다. 1. Visits 테이블에 있는 user 정보는 전부 불러와야 하기 때문에 LEFT JOI..

TIL 2024.06.13

2024-06-12

Today1. SQL 코드카타 2. 공부계획 세우기3. 머신러닝 분류분석 특강 수강 및 복습4. SQL 챌린지 3회차 수강 Today I Learned SQL Challenge 3회차 퍼널: 소비자의 행동을 기업 관점에서 재구성한 것: 고객이 유입되어 전환에 이르는 단계를 수치로 확인하고 분석하는 방법론> 화면, 진입, 클릭 등으로 지표를 세운다 마케팅 퍼널 AARRR 퍼널 퍼널 단계 세워보기더보기스파르타 코딩 클럽 데이터 분석 신청 퍼널 7단계 이내로 작성 1. 데이터 연관단어 검색 후 광고 클릭2. 스파르타 코딩 클럽 데이터 분석 페이지 조회3. 상담사 연결4. 회원가입 및 신청5. 사전캠프 진행6. 본캠프 수료7. 지인 추천 공유 이벤트 * 좋은 분석가란?> 어떤 지표가 좋은 지표일지 항상 고민하는..

TIL 2024.06.12

2024-06-11

Today1. SQL 코드카타2. 통계학 4회차 라이브 세션3. 머신러닝 기초 수강+ 머신러닝 개인과제 풀이 Today I Learned SQL # 첫번째 시도SELECT eu.unique_id , IF (es.id=eu.id, es.name, es.name) AS nameFROM Employees AS es LEFT JOIN EmployeeUNI AS eu ON es.id=eu.id testcase 는 통과했지만 뭔가 이상함을 느낌...es.name 이 왜 두번이나 들어가야 하는지...?left join 을 쓰면 왼쪽 테이블을 다 가지고 오니까 굳이 쓸 필요가 없지 않나!# 정답쿼리SELECT eu.unique_id , es.name AS nameFROM Employees AS es LE..

TIL 2024.06.11

2024-06-10

Today1. 통계학 3회차 수강 및 복습2. SQL 코드카타3. 대시보드 Today I Learned 통계학 세션  회귀분석  y = a+bx 우리가 가진 데이터셋에 해당 값이 없을 때, 이를 예측하기 위해 회귀분석의 개념이 도입됨추세선 = 우리가 이미 가지고 있는 데이터들을 가장 잘 설명해주는 선 정의: 독립변수로 종속변수를 예측하는 분석기법 프로세스:1. 독립변수, 종속변수 설정: 변수 및 가설 설정2. 데이터 경향성 확인: 독립변수와 종속변수 간 산점도 분석 및 상관3. 적합성 검증 & 결과 해석+회귀모델이 얼마나 설명력을 갖는지?결정계수를 확인(R_squared(R^2))설명력은 전체오류중 회귀를 함으로써 얼마나 개선되었는가를 의미1에 가까울 수록 모델의 성능이 좋다는 것을 의미 +회귀모델이 통..

TIL 2024.06.10

2024-06-07

Today1. SQL 코드카타 1문제2. 머신러닝 심화 수강3. 대시보드 Today I Learned SQL # 내가 풀이했던 코드SELECT v1.author_id AS idFROM Views v1 JOIN Views v2 ON v1.author_id=v2.viewer_id WHERE v1.author_id=v2.viewer_idGROUP BY v1.author_idORDER BY v1.author_idTestcase 에서는 통과되었으나 제출했을 때에는 통과가 되지 않았다내가 썼던 코드를 풀어서 전체 출력해보면 이런 형태인데.. 문제가 원하는 대로 정렬까지 끝냈다고 생각했는데 이유를 찾지 못하였다.# 2번째 테스트SELECT author_id AS idFROM ViewsWHERE author_id IN..

TIL 2024.06.07

2024-06-05

Today1. SQL 코드카타 2문제2. 대시보드3. 통계학 2회차 라이브 세션 수강 및 복습4. 머신러닝 기초 완강  Today I Learned  통계학 2회차  A/B 테스트: 기존과 변형시켰을 때 어떤게 더 효과가 있었는지 테스트 하는 것목적: UI/UX 개선, 전환율 증가, 매출 증가주요지표: 가입율, 재방문율, CTR(노출 대비 클릭율), CVR(클릭 대비 전환율,구매전환율),ROAS(캠페인 비용 대비 캠페인 수익), eCPM(1,000회 광고 노출당 얻은 수익) 1. 현행 데이터 탐색: 주요 지표를 기준으로 현재 데이터 탐색 2. 가설 설정: 목표 달성을 위한 KPI 정의*KPI: 기업마다 다름 ( 매출, 방문율 등 )귀무가설: 처음부터 버릴 것을 예상하는 가설, 차이가 없을 것이다, 차이가..

TIL 2024.06.05

2024-06-04

Today1. SQL 코드카타 1문제 (SQL 50)2. 머신러닝 선형회귀 Today I Learned  머신러닝  선형관계란?x 값이 증가함에 따라 y 값이 비례하여 증가하는 기울기가 변화하지 않는 관계직선 비선형?선형 외의 것 오차 합 평균: 데이터가 많아질 수록 에러가 커지게 되기 때문에 갯수로 나눈 것: 오차합이 적을 수록 잘 만든 직선이다. 가중치?: 전체에서 가지는 중요성을 높이기 위해 특정 부분이나 요소에 일정한 수치를 더하는 것# 선형회귀 훈련(적합)# LinearRegression(): 선형회귀 모델from sklearn.linear_model import LinearRegressionmodel_lr = LinearRegression()# 데이터 훈련# X: 훈련시킬 값# y: 종속변수m..

TIL 2024.06.04

2024-06-03

Today1. 머신러닝 기초 1-7 까지 수강2. 통계학 1회차 수강 및 복습3. SQL Challenge 2회차 수강+ 대시보드 Today I Learned SQL  AARRR 정수 나누기 문제 해결정수 나누기를 하면 결과가 정수로 반환되는데정수 나누기 1.0을 곱하면 실수를 얻을 수 있다 ?> 이부분은 이해가 되지 않아 내일 여쭤봐야겠다! Python  주피터 노트북 단축키a: 위에b: 아래에m: 마크다운 머신러닝 지도학습: 문제와 정답을 모두 알려주고 공부시키는 방법(예측,분류)비지도 학습: 답을 가르쳐주지 않고 공부시키는 방법(연관규칙,군집)강화학습: 보상을 통해 상은 최대화, 벌은 최소화하는 방향으로 행위를 강화하는 학습(보상)   통계학 1회차  수치형: 연속형 - 일정 범위 안에서 어떤 값이..

TIL 2024.06.03