TIL

2024-05-23

여연찌 2024. 5. 23. 17:35
  • Today

프로젝트 대본 작성 및 마무리

 


  • Today I Learned

 

프로젝트

 

시각화 자료까지는 추출해볼 수 있겠지만

이 그래프를 보고 해석, 분석은 어려워 팀원분들과 script 를 함께 작성하며 궁금했던 부분들을 여쭤보았다.

그래프에 대한 해석은 아래와 같다

 

시각화 자료 해석

 

직업별, 대출 종류별, 대출별 직업 비율 간의 차이가 크게 나타나지 않고 있음

나이 분포에 따른 그래프를 보아 주 고객층이 20~40대 인 것으로 확인됨

 

 

Numeric 컬럼 간의 상관관계

미지불 채무와 대출건수 컬럼 사이에서 가장 높은 0.6 정도의 양의 상관관계를 가지고 있음

 

미지불 채무액 기준 대출건수, 이자율, 대출 마감 지연일, 신용조회건수,는 양의 상관관계

계좌유지기간은 음의 상관관계

 

 

양의 상관관계, 음의 상관관계란게 무엇일까?

 

# 양의 상관관계:

한 변수가 증가할 때 다른 변수도 같이 증가

# 음의 상관관계:

한 변수가 증가할 때 다른 변수는 감소

 

 

Age 컬럼에 대한 시각화

* 연령대가 높아짐에 따라 이자율이 낮아지는 경향이 있다

> 저연령대의 고객층을 조금 더 신경써야 될 것

 

* 연령대가 높아짐에 따라 대출지연건수가 낮아지는 경향이 있다.

 

 

Credit Mix 신용도에 대한 시각화

 

보유계좌갯수, 이자율, 대출마감지연일, 보유카드갯수, 대출건수, 대출마감지연건수가 높아질 수록 신용도가 낮다

계좌 유지 시간이 길수록 신용도가 높다

> 신용도를 산정하는 기준으로 대출 마감 지연 일 수 및 지연 횟수, 보유 카드 갯수 등을 사용하는 것으로 보인다

 

미지불채무에 관한 시각화

 

1. 이자율과 대출 건수가 많을 수록 미지불 채무 금액이 높다.

2. 계좌유지기간이 높을 수록 미지불 채무 금액이 낮다.

 

 

신용도가 낮을수록 큰 금액의 채무를 갖고 있다.

> 미국 은행 시스템 상 본인이 사용할 수 있는 한도 내에서 적절하게 사용할 경우 신용도가 상승함

사용자들이 잘 사용하고 있는 것으로 파악된다.

 

회귀분석

> 회귀분석을 진행하였으나, 모델의 적합도가 높지 않아 유의미하지 않을 수 있다.

> 오차범위 5%내외로 해당 하는 칼럼: 

Credit_Mix_Num, Credit_History_Age_Num, Num_of_Loan, Num_of_Delayed_Payment

 

* 회귀분석이란 무엇일까?

팀원분들이 여러차례 설명을 해주었고, 구글링도 해보았지만 뚜렷하게 정리가 되는 느낌은 아니다..

다음주부터 진행될 통계학습기간에서 배우게 될 것으로 예상된다

상관분석도 제대로 정리될 수 있을 것 같다!

 

* 회귀분석이란?

원인과 결과가 서로 연속되는 개념으로 이해하는 것이다.

독립변수로 종속변수(목표변수)를 예측하는 것.

 

 

 

지금까지의 데이터 전처리 과정과 분석결과 나온

결론:

1. 직업군별의 부채 금액 차가 크지 않다.

데이터 분포가 대부분 비슷한 것으로 보여 데이터가 올바른지에 대한 의심도 필요하다.

 

2. 모든 종류의 대출이 골고루 판매되고 있다.

신용도에 따라 특화된 대출상품을 구상하면 좋을 것 같다.

 

3. 신용도 산정기준으로 채무, 대출 지연 건수등을 잘 이용하고 있다.

연령대가 낮을 수록 채무와 대출 지연 건수가 많으며 신용도가 낮다.

 

4. 저연령 고객층에 대한 리스크 관리가 필요하다.

 

 

 


  • Next

프로젝트 발표 및 회고

TIL 복습

 

'TIL' 카테고리의 다른 글

2024-05-27  (0) 2024.05.27
2024-05-24  (0) 2024.05.24
2024-05-22  (0) 2024.05.22
2024-05-21  (0) 2024.05.21
2024-05-20  (0) 2024.05.20