개인공부 11

Python 데이터전처리 & 시각화

기초 통계량 확인하기iris.describe()    결측값 대체 iris_with_nan.info() # 결측값 포함iris_with_nan2=iris_with_nan.fillna(value=0) # fillna 사용iris_with_nan3 = iris_with_nan.replace(np.nan,0) # replace 사용iris_with_nan2.info() # 결측값 제거      특정 값을 반환하여 새로운 컬럼 추가iris["Sepal Size"] = np.where(iris["Sepal Length"].values >= 5.0 , "Large", "Small")# np.where()# 만족하면 "Large", 그렇지 않으면 "Small"iris["S..

개인공부 2024.05.15

[Python] 시각화 그래프

matplotlib.pyplot 2차원 데이터 시각화import matplotlib.pyplot as pltx = [1,2,3,4,5]y = [2,4,6,8,10]plt.plot(x,y)plt.xlabel('X-axis')plt.ylabel('Y-axis')plt.title('Example')plt.show() 판다스 데이터프레임으로 시각화import pandas as pddf = pd.DataFrame({ 'A':[1,2,3,4,5], 'B':[5,4,3,2,1]})dfdf.plot(x='A', y='B')plt.show() 스타일, 라벨 지정df.plot(x='A', y='B', color='green', linestyle='--',marker='o') # 스타일 추가plt.sh..

개인공부 2024.05.10

[Python] Pandas 함수 정리

Pandas 불러오기import pandas as pd  데이터를 파일(csv)로 저장to_csv("저장위치/파일명.파일형식") 인덱스에 대해 설정을 해주지 않으면 기본값은 inedx= True 로인덱스가 컬럼의 형태로 저장이 될 수 있다.ex) unnamed 컬럼 생성data.to_csv("tips_data.csv", index=True) index 의 값을 False 로 설정해주면 인덱스 컬럼형태는 나오지 않음data.to_csv("tips_data.csv", index=False) * 저장할 때 인덱스 값을 설정하지 않았어도 불러올 때 인덱스컬럼을 제외하는 방법도 있다.df = pd.read_csv("tips_data.csv",index_col=0)df  데이터프레임 생성pd.DataFrame()d..

개인공부 2024.05.09

파이썬 개인 과제

문제 1: 데이터 불러오기 타이타닉 데이터를 불러온 다음 df라는 변수에 담고 데이터의 내용을 확인하세요.from google.colab import drivedrive.mount('/content/drive')root = "/content/drive/MyDrive/스파르타파이썬"file_address = root + "/train.csv"import pandas as pddf = pd.read_csv(file_address)display(df)  문제 2: 생존자 수 계산 타이타닉 전체 생존자 수와 사망자 수를 계산하고 출력하세요.생존자=[]사망자=[]total=df['Survived']for i in df['Survived']: if i == 1: 생존자.appen..

개인공부 2024.05.02

[python] return 과 print 의 차이?

* return 과 print 의 차이는? # return 은 밖으로 끄집어내서 무언가에 담을 수 있다.# print 는 그냥 출력만 해주고 끝난다. 보여주기만 함, 담을 수가 없다! data = [2, 4, 6, 8, 10]class DataPreprocessor: def __init__(self, data): self.data = data def calculation(self): print(f"평균:{sum(data)/len(data)}") # print 는 그냥 보여주고 끝난다dab = DataPreprocessor(data)result = dab.calculation()# dab.calculation() 이 있어서 나옴> 평균: 6.0dab.cal..

개인공부 2024.04.26

SQL 코드카타

번호이름풀이날짜44가격대 별 상품 개수 구하기4/12453월에 태어난 여성 회원 목록4/546대여 기록이 존재하는 자동차 리스트 구하기4/548즐겨찾기가 가장 많은 식당 정보 출력하기4/1255조건에 맞는 사용자 정보 조회하기4/559자동차 대여 기록에서 대여중 / 대여4/2261서울에 위치한 식당 목록 출력하기4/562자동차 대여 기록에서 장기/단기 대여 구분하기4/563자동차 평균 대여 기간 구하기4/564헤비 유저가 소유한 장소4/865우유와 요거트가 담긴 장바구니4/1266조회수가 가장 많은 중고거래 게시판의 첨부파일 조회하기4/1267주문량이 많은 아이스크림들 조회하기4/..

개인공부 2024.03.31

파이썬 알고리즘 코드카타

번호 이름 풀이날짜 15 나머지가 1이 되는 수 찾기 4/5 16 x만큼 간격이 있는 n개의 숫자 4/5 19 정수 제곱근 판별 4/2 20 정수 내림차순으로 배치하기 4/2 21 하샤드 수 4/2 22 두 정수 사이의 합 4/2 23 콜라츠 추측 4/12 24 서울에서 김서방 찾기 4/5 25 나누어 떨어지는 숫자 배열 4/5 26 음양 더하기 4/12 27 핸드폰 번호 가리기 4/12 28 없는 숫자 더하기 4/12 29 제일 작은 수 제거하기 4/12 30 가운데 글자 가져오기 4/12 31 수박수박수박수박수 4/12 32 내적 4/12 33 약수의 개수와 덧셈 4/16 35 부족한 금액 계산하기 4/22 36 문자열 다루기 기본 4/23

개인공부 2024.03.30

[python] map() 함수와 join() 함수 사용법

https://school.programmers.co.kr/learn/courses/30/lessons/12933 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr def solution(n): answer=list(map(int,str(n))) answer.sort(reverse=True) return ''.join(answer) return int(''.join(answer)) return (''.join(answer))map 함수를 알게 된 김에 써보려고 했는데얘는 왜 안될까 .. ?모두 다 ..

개인공부 2024.03.30

[SQL] LEFT JOIN 과 INNER JOIN 차이 2

지난번 답하지 못했던 질문을 이어서 작성 https://lyj-01.tistory.com/6 LEFT JOIN 과 INNER JOIN 차이식당별 평균 음식 주문 금액과 주문자의 평균 연령을 기반으로 Segmentation 하기 - 평균 음식 주문 금액 기준 : 5,000 / 10,000 / 30,000 / 30,000 초과 - 평균 연령 : ~ 20대 / 30대 / 40대 / 50대 이상 -- 내가 작성lyj-01.tistory.com  Q. 이 데이터 중에 왜 'wichcraft' 행만 출력이 되었는지?Q. GROUP BY 를 하지 않았을 경우 1개의 행만 추출을 하는데 왜일까?       Q. LEFT JOIN 한 값과, INNER JOIN 한 값은 어떤..

개인공부 2024.03.22