2024/05 40

2024-05-17

Today프로젝트 시작Today I Learned 프로젝트 선택한 주제 : 은행 고객데이터를 이용한 서비스 분석 해당 데이터의 결측값과 이상치가 많아 오늘은 전처리 위주로 진행해보기로 결정 bank.isna().sum() # 결측치 확인  이상치 확인 해당 컬럼의 1 고객 당 4개의 정보가 확실히 들어있는지 확인bank.groupby('Customer_ID')['Month'].nunique() # 얘가 다 4인지 확인해야함  >> 이상치 가 있었던 Age 와 Annual_Income 컬럼의 언더바(_) 를 제거# Annual_Income 언더바 제거result= []for i in bank['Annual_Income']: if "_" in i: i = i.replace("_","") re..

TIL 2024.05.17

2024-05-16

Today1. SQL 코드카타 1문제(94번)2. 알고리즘 코드카타 1문제 (38번)3. 전처리&시각화 라이브세션 수강4. 전처리&시각화 챌린지 풀이 Today I Learned Python 직사각형 별찍기https://lyj-01.tistory.com/147 직사각형 별찍기이 문제에는 표준 입력으로 두 개의 정수 n과 m이 주어집니다.별(*) 문자를 이용해 가로의 길이가 n, 세로의 길이가 m인 직사각형 형태를 출력해보세요.n, m = map(int, input().strip().split(' '))for i in range(lyj-01.tistory.comn, m = map(int, input().strip().split(' '))for i in range(m): print('*'*n) stri..

TIL 2024.05.16

직사각형 별찍기

이 문제에는 표준 입력으로 두 개의 정수 n과 m이 주어집니다.별(*) 문자를 이용해 가로의 길이가 n, 세로의 길이가 m인 직사각형 형태를 출력해보세요.n, m = map(int, input().strip().split(' '))for i in range(m): print('*'*n)     ①n, m = map(int, input().strip().split(' ')) # input() 에 5 3 이 들어가게 되면# stirp() 로 좌우의 공백을 제거하여 5 3 으로 추출# split(' ') 로 5와 3을 각각 문자열로 나누어준다.# map() 함수에 int 형을 사용하여 문자열을 정수형으로 바꾸어 준다.  > n = 5> m = 3 ② for i in range(m): print('*..

Python 데이터전처리 & 시각화

기초 통계량 확인하기iris.describe()    결측값 대체 iris_with_nan.info() # 결측값 포함iris_with_nan2=iris_with_nan.fillna(value=0) # fillna 사용iris_with_nan3 = iris_with_nan.replace(np.nan,0) # replace 사용iris_with_nan2.info() # 결측값 제거      특정 값을 반환하여 새로운 컬럼 추가iris["Sepal Size"] = np.where(iris["Sepal Length"].values >= 5.0 , "Large", "Small")# np.where()# 만족하면 "Large", 그렇지 않으면 "Small"iris["S..

개인공부 2024.05.15

2024-05-14

Today1. SQL 코드카타 1문제(92번)2. 판다스 300제(141~180)3. 전처리&시각화 라이브세션 수강4. 전처리&시각화 베이직 풀이 Today I LearnedPython pandas.quary() ① 비교 연산자( ==, >, >=, ② in 연산자( in, ==, not in, != )③ 논리 연산자(and, or, not)④ 외부 변수(또는 함수) 참조 연산⑤ 인덱스 검색⑥ 문자열 부분검색( str.contains, str.startswith, str.endswith )df.query("close > open")  df 문자열 검색하기df.query("nm.str.startswith('A')")df.query("nm.str.contains('홀딩스')")str.startswith()특..

TIL 2024.05.14

2024-05-13

Today1. SQL 코드카타 1문제(91번)2. 판다스 300제(91~140)3. 전처리&시각화 라이브세션  Today I Learned SQLSELECT *FROM cinemaWHERE id % 2 != 0 AND description != "boring"ORDER BY rating DESCid 를 2 로 나누었을 때 0과 같지않고description 의 값이 boring 이 아닐 때  파이썬만 주구장창 보다보니 SQL 에서의 연산자를 잊어버린 듯 기초부터 다시 천천히!   Python가장 마지막 행 추출df.iloc[-1]# (series 형태)df.tail(1) # (df 형태) iloc # 행번호loc# 행이름 df.iat[0, 2] # iloc 처럼 행, 열df.at["037730",..

TIL 2024.05.13

2024-05-10

Today1. SQL 코드카타 1문제(90번)2. 파이썬 300제(261~270)3. 판다스 300제4. 데이터 전처리 & 시각화 강의 수강 완강Today I Learned SQL https://leetcode.com/problems/confirmation-rate/SELECT s.user_id , ROUND(AVG(if(c.action = "confirmed",1,0)),2) AS confirmation_rateFROM signups AS sLEFT JOIN confirmations AS cON s.user_id = c.user_idGROUP BY user_id # 확인이 되었다면 1 그렇지 않다면 0으로 두고 평균을 내준다 구글 번역기를 돌려도 문제가 이해되지 않아 solutions 를 살펴보..

TIL 2024.05.10

4주차[2024-05-07 ~ 05-10]

FACTS 지난주에 이어 파이썬을 집중 공부하는 한주였다.수요일에는 정욱튜터님의 파이썬 총 정리 세션을 수강하였다. 주로 for 반복문과 list 에 관한 내용들이었고 지난주부터 풀이를 했던 파이썬 300제를 바탕으로 강의해주셔서 많은 도움이 되었다. 목요일에 지급된 데이터 전처리&시각화 강의는 약 3시간 정도되는 분량으로 다음주에 있을 라이브 세션을 위해 금요일까지 완강하였다. 지난주 파이썬 개인과제시간 때 잠깐 접해볼 수 있었던 판다스 함수와 미니프로젝트 주차때 다른 팀의 발표에서 볼 수 있었던 수많은 그래프 시각화에 관하여 학습했다. 파이썬 300제를 마무리 하였고, 팀원분이 공유해주시는 판다스 300제를 살펴보았다.판다스 300제는 numpy 부터 시작하기에 튜터님께 여쭤보았는데 사실상 numpy..

WIL 2024.05.10

[Python] 시각화 그래프

matplotlib.pyplot 2차원 데이터 시각화import matplotlib.pyplot as pltx = [1,2,3,4,5]y = [2,4,6,8,10]plt.plot(x,y)plt.xlabel('X-axis')plt.ylabel('Y-axis')plt.title('Example')plt.show() 판다스 데이터프레임으로 시각화import pandas as pddf = pd.DataFrame({ 'A':[1,2,3,4,5], 'B':[5,4,3,2,1]})dfdf.plot(x='A', y='B')plt.show() 스타일, 라벨 지정df.plot(x='A', y='B', color='green', linestyle='--',marker='o') # 스타일 추가plt.sh..

개인공부 2024.05.10

2024-05-09

Today1. SQL 코드카타 1문제(89번)2. 파이썬 300제(251~260)3. 데이터 전처리 & 시각화 강의 수강(~3주차) Today I Learned데이터 전처리 & 시각화 강의https://lyj-01.tistory.com/137 [Python] Pandas 함수 정리Pandas 불러오기import pandas as pd  데이터를 파일(csv)로 저장to_csv("저장위치/파일명.파일형식") 인덱스에 대해 설정을 해주지 않으면 기본값은 inedx= True 로인덱스가 컬럼의 형태로 저장이 될 수 있lyj-01.tistory.comPandas 함수를 세세하게 다루어 볼 수 있었다. 결측치 확인df.isna() # null 값이면 Truedf['B'].isna() # B..

TIL 2024.05.09