- Today
1. SQL 코드카타 1문제(92번)
2. 판다스 300제(141~180)
3. 전처리&시각화 라이브세션 수강
4. 전처리&시각화 베이직 풀이
- Today I Learned
Python
pandas.quary()
① 비교 연산자( ==, >, >=, <, <=, != )
② in 연산자( in, ==, not in, != )
③ 논리 연산자(and, or, not)
④ 외부 변수(또는 함수) 참조 연산
⑤ 인덱스 검색
⑥ 문자열 부분검색( str.contains, str.startswith, str.endswith )
df.query("close > open")
df 문자열 검색하기
df.query("nm.str.startswith('A')")
df.query("nm.str.contains('홀딩스')")
str.startswith()
특정 문자열로 시작하는 인덱스 찾기
str.contains()
특정 문자열을포함하는 인덱스 찾기
df.filter()
items=
# 이름으로 행, 열을 선택
regex=
# 정규표현식으로 행, 열을 선택
like=
# 특정문자를 포함하는 행, 열을 선택
데이터 프레임 연결
pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None,
levels=None, names=None, verify_integrity=False, sort=False, copy=True)
pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None,
levels=None, names=None, verify_integrity=False, sort=False, copy=True)
objs
# 이어붙일 시리즈/데이터프레임들을 입력
axis
# 0: index/ 1: columns 메서드를 적용할 레이블
# default 0
join
# 연결할 기준축이 아닌 다른 축의 인덱스를 처리하는 방법
# default outer
ignore_index
# 연결할 때 기존의 인덱스를 사용할지 여부
# default False
# True: 새로 부여한 인덱스로 다시 세팅
다수의 함수 한번에 집계 하기
dataframe.groupby('column').column.agg(['mean', 'min', 'max', 'sum'])
df.groupby("테마").agg({"PER": max,"PBR": min})
df.groupby('테마')[['PER', 'PBR']].agg([np.mean, np.std])
df.sort_index()
ascending = False
# 내림차순
데이터 전처리&시각화 라이브세션
df.dropna()
를 사용하여 누락된 행을 삭제
how="any" 로 설정하면 하나라도 any가 들어있으면 행 또는 열을 삭제
# all이 들어가면 모든 값들이 결측값이어야지 삭제
axis = 0: 행, axis = 1: 컬럼
fillna
# 결측값을 채워넣기
isna()
# 결측값을 확인
# 결측값 True
# True=1 , False=0
Daily Scrum
iris.groupby("Species")["Sepal Length"].mean()
# 시리즈 형태
iris.groupby("Species",as_index=False)["Sepal Length"].mean()
# df 형태
as_index=False
를 사용하면 df 형태로 출력된다.
- Next
1. SQL 코드카타 1문제(94번)
2. 알고리즘 코드카타 1문제 (38번)
3. 전처리&시각화 라이브세션 수강
4. 전처리&시각화 챌린지 풀이
'TIL' 카테고리의 다른 글
2024-05-17 (0) | 2024.05.17 |
---|---|
2024-05-16 (0) | 2024.05.16 |
2024-05-13 (0) | 2024.05.13 |
2024-05-10 (0) | 2024.05.10 |
2024-05-09 (0) | 2024.05.09 |