TIL 120

2024-07-04

*산술식Sales Amount (판매총액) = Sales Amount Based on List Price (정가총액) - Discount Amount (할인총액)Sales Margin Amount (마진총액) = Sales Amount (판매총액) - Sales Cost Amount (원가총액)Sales Price = Sales Amount / Sales QuantitySales Amount = Sales Price * Sales QuantitySales Amount Based on List Price = List Price * Sales QuantitySales Margin Amount = Sales Amount - Sales Cost Amount  *음수 컬럼 확인Discount Amount(할인금액..

TIL 2024.07.04

2024-07-03

Today1. ADsP2. Project 진행 Today I Learned ADsP 데이터웨어하우스: 정적인 데이터가 중요하며, 일정기간동안 안정적으로 정보를 저장하는 것을 목적으로 두고 있다. 유전 알고리즘: 문제에 대한 최적 해결책을 찾는 것ex. 시청률을 얻으려면 어떤 시간대에 방송해야하는가?ex. 최적의 택배 차량 배치 방법 무결성: 데이터베이스 내에서 데이터 변경이나 수정 시에 정확성,일관성,유효성,신뢰성을 보장하기 위해여러가지 제한을 두어 데이터의 정확성을 보증하는 것 분석체계 구현은 반복적 분석 선순환 구조 맵: 분석 내용을 선택과 결과로 모델링 분석 성숙도를 진단하는 영역 3가지1. 비즈니스2. IT3. 조직,역량 빅데이터 4V 특성volume(데이터양)variety(데이터 종류)veloc..

TIL 2024.07.03

2024-07-02

Today1. 태블로 라이브 세션 2회차2. ADsP 강의 수강 Today I Learned SQL  기본 스크롤은 페이지의 90% 를 넘었을 때 스크롤 이벤트가 찍힌다..SELECT COUNT(DISTINCT user_pseudo_id, ga_session_id) AS pvFROM gaWHERE page_title = '백문이불여일타 SQL 캠프 입문반'AND event_name = 'page_view'위와 같은 함수에서 COUNT 안에 2가지를 넣을 수 없는 프로그램(빅쿼리 등)의 경우SELECT COUNT(DISTINCT CONCAT(user_pseudo_id, ga_session_id)) AS pv이렇게 CONCAT 을 사용하여 COUNT 해주면 같은 결과를 낼 수 있다!   ADsP  비즈니스 ..

TIL 2024.07.02

2024-07-01

Today태블로 라이브세션 수강 및 복습 Today I Learned  태블로 관계: 각 테이블들이 독립적으로 작동함: 데이터의 결합이 워크시트의 뷰 레벨에서 결정됨: 표현하는 방식에 따라 데이터가 생략되거나 왜곡될 수 있음 조인: SQL 의 join 과 같음 블랜딩: 여러개의 데이터원본을 워크시트에 바로 연결해서 사용: 불안정하고 매칭하는 키 값이 자주 어긋나기 때문에 사용을 권장하지 않음 유니온: 데이터의 형식이 달라도 그냥 상하로 결합함: 컬럼이 달라도 모든 컬럼이 표시되며 일치하지 않으면 데이터를 NULL 로 표현* 와일드카드- 특정 단어 등이 포함되었을 때 전부 연결해줌   운영대시보드: 실시간 정보를 간략화 해서 사용자가 지표를 쉽게 모니터링 할 수 있도록 한다.분석대시보드: 데이터를 통해 인..

TIL 2024.07.01

2024-06-27

Today1. SQL 코드카타 2. Tableau 3주차 수강, 4주차 4-1 수강 Today I Learned SQL 평균 판매 가격을 구하기Write a solution to find the average selling price for each product. average_price should be rounded to 2 decimal places.SELECT p.product_id , CASE WHEN start_date    원하는 형식처럼 나오기는 했지만, 여기서 원하는 값이 나오지 않았다.. CASE WHEN 을 사용하는 것은 맞는 것 같은데 조건이 잘 못 들어 간듯하다.     join 후 테이블의 상태를 확인해보니 group by 를 하기 전에는 위와 같은 상태였고, group..

TIL 2024.06.27

2024-06-26

Today1. SQL 코드카타 1문2. project 정리3. 태블로 2주차 강의 수강 Today I Learned SQL  조건이 포함되지 않는 데이터 출력하기Write a solution to report the movies with an odd-numbered ID and a description that is not "boring".SELECT *FROM CinemaWHERE id % 2 != 0 AND description NOT LIKE "%boring%"ORDER BY rating DESC;같지 않다 라는 의미에서 != 또는 을 사용 하면 된다..NOT LIKE 를 사용하면 해당 단어가 포함되지 않는 것을 출력함 파이썬만 주구장창 보다보니 SQL을 점점 잊어가는 느낌이다ㅠㅠ이번 프로젝트에서..

TIL 2024.06.26

2024-06-18

Today 프로젝트Today I Learned 프로젝트 군집분류의 중요하게 봐야하는 것! 1. 점이 섞여있는지?>> 섞여있지 않을 수록 좋음!!!2. 점끼리 잘 뭉쳐있는지?-> 그래프가 비슷하게 나왔다-> 실루엣 계수(군집별로 얼마나 잘 뭉쳐있느냐/ 얼마나 잘 뭉쳐있는지 구분하는 것!) 결측치&이상치> 표준화> PCA > K 값 선정 > k-means clustering 시행 > scatter plot 으로 군집 분포 확인 위와 같은 과정을 반복하면서 제일 좋은 결과값을 도출해야한다!좋은 결과값이 나오도록 변수의 조합을 변경해보는 것 이제 노가다의 시작이라고 하더라 ..  Next 프로젝트

TIL 2024.06.18

2024-06-17

Today 프로젝트 진행 Today I Learned 프로젝트 주제 선정 과 분석방향 정리 raw data 확인이상치 처리(특정 기준을 세워 이상치를 정의하고 그 이유를 설명)컬럼별 raw data 분포 시각화컬럼 간 상관계수 히트맵 구현군집 분류Python 머신러닝 라이브러리를 활용하여 진행기존 컬럼과 파생변수 활용상관관계분석나뉜 군집과 다른 컬럼 간의 상관관계 분석연관이 있다면 그것이 군집의 특성이 될 것(인사이트 도출)군집별 차이를 수치화ex) A 그룹 평균 접속일수와 B 그룹 평균 접속일수추가적인 군집별 특성을 알아보기 위한 RFM 스코어화ex) 결제성향별( heavy, medium, row ) 로 나누었고, 각 그룹별 RFM score 는 몇 점이다.군집 특성에 맞는 마케팅 방안 제시마케팅 푸시..

TIL 2024.06.17

2024-06-15

Today1. JD 분석2. SQL 코드카타3. SQL Challenge 3회차 과제 풀이 Today I Learned SQL  There is a factory website that has several machines each running the same number of processes. Write a solution to find the average time each machine takes to complete a process.1개의 테이블의 같은 컬럼안에 다른 정보가 있을 때의 차이 구하기 SELECT a.machine_id , ROUND(AVG(b.timestamp-a.timestamp),3) processing_time FROM ( SELECT machine_..

TIL 2024.06.15