전체 글 230

KPT 회고 - 은행 고객데이터를 이용한 서비스 분석

Keep 팀원분들과의 지속적인 소통으로 수월하게 마무리될 수 있었던 프로젝트이다.마감기한을 지켜 제출하기 위해 매일마다 해야할 목표를 정했고 정한 목표를 전부 채워 진행하였다.(17일 주제 선정 및 전처리, 20일 전처리 완료 후 데이터 통합 , 21일 가설설정, 분석, 시각화, 22일 ppt 제작, 23일 script 작성) 각자 맡은 컬럼을 전처리하면서 데이터에 대한 이해도를 높이고, ppt를 제작하며 이번 프로젝트 주제에서 조금은 빈약했던 시각화 자료를 추가분석하였다. script 를 작성하며 잘 이해되지 않았던, 그리고 분석에 실수가 있었던 부분도 짚어 전체적으로 완성도 있는 프로젝트가 나왔다. 데이터를 꼼꼼히 분석해보기 위해 다양한 시각화 자료를 사용했다는 점이 인상깊다. 시각화자료에 대한 중요..

Project/KPT 회고 2024.05.24

KPT 회고 - 상품 판매 데이터 분석에 따른 판매 상품 추천

Keep 팀원분들의 많은 도움들로 무사히 잘 마무리 되었던 팀프로젝트였다.나를 포함한 모든 팀원분들이 EDA 및 프로젝트 결론까지 달려가기 위해 팀프로젝트에 열심히 참여하여 순조롭게 프로젝트가 마무리 되었다.다양한 분야의 경험이 있는 팀원들을 만날 수 있게 되어 많은 것을 배울 수 있었다. Problem 현재 가지고 있는 기술적인 능력으로는 팀 프로젝트에 크게 기여를 했다고 하기에는 어렵다. 앞으로 있을 학습 기간동안 성실히 준비해서 다음 팀 프로젝트 진행 시에는 조금더 의견을 내어야한다고 생각했다.팀원분들에 비해 기술적인 부분, 도메인지식 등의 분야에서 다소 부족함이 느껴졌다. Try 분석을 하기 위한 도메인 지식과 통계학에 대한 지식, 분석 방법에 대한 지식을 향상시키기 위해 데이터분석에 대한 아티클..

Project/KPT 회고 2024.05.24

6주차[2024-05-20 ~ 05-24]

FACTS 이번주차는 프로젝트 기간이었다.월요일부터 시작된 파이썬 베이직 특강 2회차를 듣고, 프로젝트 발표가 마무리되었다.습관처럼 풀었던 SQL 과 알고리즘 코드카타도 1문제씩 진행해보려고 하였으나 프로젝트 마감기간이 가까워졌을 때에는 풀이를 하지 못했다. 파이썬 베이직 특강은 지금까지 배웠던 파이썬을 정리하고 복습하고, 조금은 새로운 정보를 알아가는 시간이었다. 파이썬은 배우면 배울수록 새로운 함수들이 많이 나와 현업에서 유용하게 사용할 수 있는 함수들을 한번이라도 더 배워볼 수 있어 굉장히 좋은 시간이었다. 프로젝트 진행과정에서 직접 활용은 못하였지만 팀원들의 코드를 이해하기에는 큰 도움이 되었다.  지난주 금요일 선정한 주제로 이번주 월요일에는 전처리를 완료하고 화요일에는 완료한 데이터를 통합하여..

WIL 2024.05.24

2024-05-23

Today프로젝트 대본 작성 및 마무리 Today I Learned 프로젝트 시각화 자료까지는 추출해볼 수 있겠지만이 그래프를 보고 해석, 분석은 어려워 팀원분들과 script 를 함께 작성하며 궁금했던 부분들을 여쭤보았다.그래프에 대한 해석은 아래와 같다 시각화 자료 해석 직업별, 대출 종류별, 대출별 직업 비율 간의 차이가 크게 나타나지 않고 있음나이 분포에 따른 그래프를 보아 주 고객층이 20~40대 인 것으로 확인됨  Numeric 컬럼 간의 상관관계미지불 채무와 대출건수 컬럼 사이에서 가장 높은 0.6 정도의 양의 상관관계를 가지고 있음 미지불 채무액 기준 대출건수, 이자율, 대출 마감 지연일, 신용조회건수,는 양의 상관관계계좌유지기간은 음의 상관관계  양의 상관관계, 음의 상관관계란게 무엇일까..

TIL 2024.05.23

[Team Project] 은행 고객데이터를 이용한 서비스 분석

프로젝트명: 은행 고객데이터를 이용한 서비스 분석기간: 2024-05-17~24활용 데이터: https://www.kaggle.com/datasets/khanmdsaifullahanjar/bank-user-dataset  Bank User DatasetThis dataset contains user behaviors contributing to their credit scorewww.kaggle.com  다량의 데이터가 있고, EDA 를 진행한 결과가 많이 나올 것으로 예상되는 은행 고객데이터를 선정하여 분석해보았다.이번 프로젝트는 이상치 및 결측치를 제거하는 것과 다양한 시각화를 사용하여 보다 효과적으로 해당 데이터를 이해하기 편하도록 준비했다.  1. 개요 프로젝트 진행목표: 은행 대출 팀을 위한 고..

Project 2024.05.23

2024-05-22

Today1. 프로젝트 ppt 작성2. python basic 수강 Today I Learned Python Basic  Merge컬럼 기준으로 병합( join 과 유사 )pd.merge(df2,df3) 주요옵션(파라미터)on: 공통 컬럼, [] 리스트 형태로 만들어주면 여러개도 사용 가능how: 어떤 방식으로 조인(inner, outer,left,right)> 현업에서는 inner, left 사용left on / right on: 열의 공통컬럼이 이름이 다를 때 사용# 기준열 이름이 다를 때merge_df = pd.merge(df2,df3, how='inner', left_on = 'Customer ID', right_on = 'user id') join축(인덱스) 기준으로 병합df.join(df2) ..

TIL 2024.05.22

2024-05-21

Today1. SQL 코드카타(95번)2. 파이썬 코드카타(40번)3. 프로젝트 Today I Learned Python def solution(n): tmp = '' while n: tmp += str(n % 3) n = n // 3 answer = int(tmp, 3) return answer 3진법에 대해서 먼저 공부해야할 듯 하다!  프로젝트  전처리를 끝낸 데이터들을 통합하여 새로운 csv 파일로 생성한 후 가설설정과 간단한 시각화를 했다.내가 설정했던 가설은 이렇다.연간소득이 높을 수록 대출 건수가 적다(현금유동성이 높아서?)대출건수가 많을 수록 보유한 카드 갯수가 많다(현금유동성이 부족하기 때문에?)대출종류별 갯수를 확인하고, 특정 대출이 많으면..

TIL 2024.05.21