전체 글 233

2024-05-28

Today1. 기초통계수강2. 새로운 팀 인사3. SQL Basic 2회차Today I Learned 기초통계 통계적 가설 검정:주어진 자료가 특정 가설을 충분히 뒷받침하는지 여부를 결정하는 통계적 추론 방법 귀무가설: 기존의 통념, Default 에 가깝다대립가설: 새롭게 입증, 주장하고자 하는 것  p-value귀무 가설이 정확하다는 가정 하에서 실제 관찰된 결과만큼 극단적인 검정 결과를 얻을 확률 기초통계 강의는 전부 수강하였으나 아직 어떤 것인지 잘 모르겠다.. 이후 통계학 라이브세션 때 제대로 복습해야겠다!    SQL IN: 서브쿼리가 반환한 값 중 하나라도 일치하는 경우EXISTS: 서브쿼리가 하나 이상의 행을 반환하는 경우# 지난 6개월 내에 주문한 적이 있는 고객의 이름과 가입 날짜를 조..

TIL 2024.05.28

2024-05-27

Today1. Python Basic 3회차 수강2. 기초통계 수강 Today I Learned  Python Basic  결측치 처리1. 제거# 결측치 제거1 - 열 제거하기 df3 = df3.drop('Unnamed: 4', axis=1)# 결측치 제거2 -결측치가 있는 행들은 모두 제거 df3.dropna(inplace=True)drop 라는 함수가 결측치를 제거하는 것인가? 했는데다시보니 그냥 제거하는 것이었음! * df3 를 보았을 때 모든 행이 결측치였기 때문에 그 열을 삭제 한 것  dropna(inplace=True) 에서inplace 가 어떤 뜻인지?  * inplace 는 원본을 변경할지에 관한 여부이다.default 값은 False 로 True 를 사용하면 원본이 변경된다  2. 대체..

TIL 2024.05.27

2024-05-24

Today1. 프로젝트 발표 및 회고2. SQL Basic 1회차 특강 수강 Today I LearnedSQL 몇 주 내내 파이썬만 주구장창 했더니 SQL 이 낯설어지기 시작해서SQL 베이직 녹화수업을 수강해보았다.기초 복습을 할 것이라는 내 생각과는 다르게 window 함수를 사용하는 것을 보고 놀랐다.. 간단하게 정리를 해보자SELECT 그룹, SUM(값) FROM 테이블 GROUP BY 그룹# window 함수 기본 구조집계 함수(칼럼) OVER([PARTITION BY 컬럼] [ORDER BY 컬럼])SUM(값) OVER (PARTITION BY 그룹) group by  할 컬럼을 partition by 뒤에 적어주면 됨!순서를 정렬하고 싶다면SUM(salary) over(partition by ..

TIL 2024.05.24

KPT 회고 - 은행 고객데이터를 이용한 서비스 분석

Keep 팀원분들과의 지속적인 소통으로 수월하게 마무리될 수 있었던 프로젝트이다.마감기한을 지켜 제출하기 위해 매일마다 해야할 목표를 정했고 정한 목표를 전부 채워 진행하였다.(17일 주제 선정 및 전처리, 20일 전처리 완료 후 데이터 통합 , 21일 가설설정, 분석, 시각화, 22일 ppt 제작, 23일 script 작성) 각자 맡은 컬럼을 전처리하면서 데이터에 대한 이해도를 높이고, ppt를 제작하며 이번 프로젝트 주제에서 조금은 빈약했던 시각화 자료를 추가분석하였다. script 를 작성하며 잘 이해되지 않았던, 그리고 분석에 실수가 있었던 부분도 짚어 전체적으로 완성도 있는 프로젝트가 나왔다. 데이터를 꼼꼼히 분석해보기 위해 다양한 시각화 자료를 사용했다는 점이 인상깊다. 시각화자료에 대한 중요..

Project/KPT 회고 2024.05.24

KPT 회고 - 상품 판매 데이터 분석에 따른 판매 상품 추천

Keep 팀원분들의 많은 도움들로 무사히 잘 마무리 되었던 팀프로젝트였다.나를 포함한 모든 팀원분들이 EDA 및 프로젝트 결론까지 달려가기 위해 팀프로젝트에 열심히 참여하여 순조롭게 프로젝트가 마무리 되었다.다양한 분야의 경험이 있는 팀원들을 만날 수 있게 되어 많은 것을 배울 수 있었다. Problem 현재 가지고 있는 기술적인 능력으로는 팀 프로젝트에 크게 기여를 했다고 하기에는 어렵다. 앞으로 있을 학습 기간동안 성실히 준비해서 다음 팀 프로젝트 진행 시에는 조금더 의견을 내어야한다고 생각했다.팀원분들에 비해 기술적인 부분, 도메인지식 등의 분야에서 다소 부족함이 느껴졌다. Try 분석을 하기 위한 도메인 지식과 통계학에 대한 지식, 분석 방법에 대한 지식을 향상시키기 위해 데이터분석에 대한 아티클..

Project/KPT 회고 2024.05.24

6주차[2024-05-20 ~ 05-24]

FACTS 이번주차는 프로젝트 기간이었다.월요일부터 시작된 파이썬 베이직 특강 2회차를 듣고, 프로젝트 발표가 마무리되었다.습관처럼 풀었던 SQL 과 알고리즘 코드카타도 1문제씩 진행해보려고 하였으나 프로젝트 마감기간이 가까워졌을 때에는 풀이를 하지 못했다. 파이썬 베이직 특강은 지금까지 배웠던 파이썬을 정리하고 복습하고, 조금은 새로운 정보를 알아가는 시간이었다. 파이썬은 배우면 배울수록 새로운 함수들이 많이 나와 현업에서 유용하게 사용할 수 있는 함수들을 한번이라도 더 배워볼 수 있어 굉장히 좋은 시간이었다. 프로젝트 진행과정에서 직접 활용은 못하였지만 팀원들의 코드를 이해하기에는 큰 도움이 되었다.  지난주 금요일 선정한 주제로 이번주 월요일에는 전처리를 완료하고 화요일에는 완료한 데이터를 통합하여..

WIL 2024.05.24

2024-05-23

Today프로젝트 대본 작성 및 마무리 Today I Learned 프로젝트 시각화 자료까지는 추출해볼 수 있겠지만이 그래프를 보고 해석, 분석은 어려워 팀원분들과 script 를 함께 작성하며 궁금했던 부분들을 여쭤보았다.그래프에 대한 해석은 아래와 같다 시각화 자료 해석 직업별, 대출 종류별, 대출별 직업 비율 간의 차이가 크게 나타나지 않고 있음나이 분포에 따른 그래프를 보아 주 고객층이 20~40대 인 것으로 확인됨  Numeric 컬럼 간의 상관관계미지불 채무와 대출건수 컬럼 사이에서 가장 높은 0.6 정도의 양의 상관관계를 가지고 있음 미지불 채무액 기준 대출건수, 이자율, 대출 마감 지연일, 신용조회건수,는 양의 상관관계계좌유지기간은 음의 상관관계  양의 상관관계, 음의 상관관계란게 무엇일까..

TIL 2024.05.23