TIL 119

2024-05-30

Today1. Python Basic 4 회차 복습( 이중축 그래프, 피라미드, 대시보드)2. SQL 코드카타(97번)3. 알고리즘 코드카타(42번)4. SQL Basic 3회차 문제풀이5. SQL Basic 4회차 수강 Today I Learned SQL 인덱스로 나누기SUBSTRING_INDEX(문자열, 구분자, 구분자의 index)구분자 기준으로 순서에 맞춰서 가져온다.구분자의 index 가 2 로 바뀐다면 구분자 기준으로 두번째즉, 띄어쓰기 두번한 뒤의 인덱스를 가져옴!SELECT SUBSTRING_INDEX(name,' ',1) first_name, SUBSTRING_INDEX(name,' ',-1) last_nameFROM employees SQL 에서도 파이썬 처럼 인덱스로 나누는..

TIL 2024.05.30

2024-05-28

Today1. 기초통계수강2. 새로운 팀 인사3. SQL Basic 2회차Today I Learned 기초통계 통계적 가설 검정:주어진 자료가 특정 가설을 충분히 뒷받침하는지 여부를 결정하는 통계적 추론 방법 귀무가설: 기존의 통념, Default 에 가깝다대립가설: 새롭게 입증, 주장하고자 하는 것  p-value귀무 가설이 정확하다는 가정 하에서 실제 관찰된 결과만큼 극단적인 검정 결과를 얻을 확률 기초통계 강의는 전부 수강하였으나 아직 어떤 것인지 잘 모르겠다.. 이후 통계학 라이브세션 때 제대로 복습해야겠다!    SQL IN: 서브쿼리가 반환한 값 중 하나라도 일치하는 경우EXISTS: 서브쿼리가 하나 이상의 행을 반환하는 경우# 지난 6개월 내에 주문한 적이 있는 고객의 이름과 가입 날짜를 조..

TIL 2024.05.28

2024-05-27

Today1. Python Basic 3회차 수강2. 기초통계 수강 Today I Learned  Python Basic  결측치 처리1. 제거# 결측치 제거1 - 열 제거하기 df3 = df3.drop('Unnamed: 4', axis=1)# 결측치 제거2 -결측치가 있는 행들은 모두 제거 df3.dropna(inplace=True)drop 라는 함수가 결측치를 제거하는 것인가? 했는데다시보니 그냥 제거하는 것이었음! * df3 를 보았을 때 모든 행이 결측치였기 때문에 그 열을 삭제 한 것  dropna(inplace=True) 에서inplace 가 어떤 뜻인지?  * inplace 는 원본을 변경할지에 관한 여부이다.default 값은 False 로 True 를 사용하면 원본이 변경된다  2. 대체..

TIL 2024.05.27

2024-05-24

Today1. 프로젝트 발표 및 회고2. SQL Basic 1회차 특강 수강 Today I LearnedSQL 몇 주 내내 파이썬만 주구장창 했더니 SQL 이 낯설어지기 시작해서SQL 베이직 녹화수업을 수강해보았다.기초 복습을 할 것이라는 내 생각과는 다르게 window 함수를 사용하는 것을 보고 놀랐다.. 간단하게 정리를 해보자SELECT 그룹, SUM(값) FROM 테이블 GROUP BY 그룹# window 함수 기본 구조집계 함수(칼럼) OVER([PARTITION BY 컬럼] [ORDER BY 컬럼])SUM(값) OVER (PARTITION BY 그룹) group by  할 컬럼을 partition by 뒤에 적어주면 됨!순서를 정렬하고 싶다면SUM(salary) over(partition by ..

TIL 2024.05.24

2024-05-23

Today프로젝트 대본 작성 및 마무리 Today I Learned 프로젝트 시각화 자료까지는 추출해볼 수 있겠지만이 그래프를 보고 해석, 분석은 어려워 팀원분들과 script 를 함께 작성하며 궁금했던 부분들을 여쭤보았다.그래프에 대한 해석은 아래와 같다 시각화 자료 해석 직업별, 대출 종류별, 대출별 직업 비율 간의 차이가 크게 나타나지 않고 있음나이 분포에 따른 그래프를 보아 주 고객층이 20~40대 인 것으로 확인됨  Numeric 컬럼 간의 상관관계미지불 채무와 대출건수 컬럼 사이에서 가장 높은 0.6 정도의 양의 상관관계를 가지고 있음 미지불 채무액 기준 대출건수, 이자율, 대출 마감 지연일, 신용조회건수,는 양의 상관관계계좌유지기간은 음의 상관관계  양의 상관관계, 음의 상관관계란게 무엇일까..

TIL 2024.05.23

2024-05-22

Today1. 프로젝트 ppt 작성2. python basic 수강 Today I Learned Python Basic  Merge컬럼 기준으로 병합( join 과 유사 )pd.merge(df2,df3) 주요옵션(파라미터)on: 공통 컬럼, [] 리스트 형태로 만들어주면 여러개도 사용 가능how: 어떤 방식으로 조인(inner, outer,left,right)> 현업에서는 inner, left 사용left on / right on: 열의 공통컬럼이 이름이 다를 때 사용# 기준열 이름이 다를 때merge_df = pd.merge(df2,df3, how='inner', left_on = 'Customer ID', right_on = 'user id') join축(인덱스) 기준으로 병합df.join(df2) ..

TIL 2024.05.22

2024-05-21

Today1. SQL 코드카타(95번)2. 파이썬 코드카타(40번)3. 프로젝트 Today I Learned Python def solution(n): tmp = '' while n: tmp += str(n % 3) n = n // 3 answer = int(tmp, 3) return answer 3진법에 대해서 먼저 공부해야할 듯 하다!  프로젝트  전처리를 끝낸 데이터들을 통합하여 새로운 csv 파일로 생성한 후 가설설정과 간단한 시각화를 했다.내가 설정했던 가설은 이렇다.연간소득이 높을 수록 대출 건수가 적다(현금유동성이 높아서?)대출건수가 많을 수록 보유한 카드 갯수가 많다(현금유동성이 부족하기 때문에?)대출종류별 갯수를 확인하고, 특정 대출이 많으면..

TIL 2024.05.21