TIL

2024-05-14

여연찌 2024. 5. 14. 20:54
  • Today

1. SQL 코드카타 1문제(92번)

2. 판다스 300제(141~180)

3. 전처리&시각화 라이브세션 수강

4. 전처리&시각화 베이직 풀이

 


  • Today I Learned

Python

 

pandas.quary()

 

① 비교 연산자( ==, >, >=, <, <=, != )

② in 연산자( in, ==, not in, != )

③ 논리 연산자(and, or, not)

④ 외부 변수(또는 함수) 참조 연산

⑤ 인덱스 검색

⑥ 문자열 부분검색( str.contains, str.startswith, str.endswith )

df.query("close > open")

 

 

df 문자열 검색하기

df.query("nm.str.startswith('A')")
df.query("nm.str.contains('홀딩스')")


str.startswith()

특정 문자열로 시작하는 인덱스 찾기

str.contains()

특정 문자열을포함하는 인덱스 찾기

 

 

df.filter()

items=

# 이름으로 행, 열을 선택

regex=

# 정규표현식으로 행, 열을 선택

like=

# 특정문자를 포함하는 행, 열을 선택

 

 

데이터 프레임 연결

pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None, 
levels=None, names=None, verify_integrity=False, sort=False, copy=True)

pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None, 
levels=None, names=None, verify_integrity=False, sort=False, copy=True)

objs
# 이어붙일 시리즈/데이터프레임들을 입력
axis
# 0: index/ 1: columns 메서드를 적용할 레이블
# default 0
join
# 연결할 기준축이 아닌 다른 축의 인덱스를 처리하는 방법
# default outer
ignore_index
# 연결할 때 기존의 인덱스를 사용할지 여부
# default False
# True: 새로 부여한 인덱스로 다시 세팅

 

 

다수의 함수 한번에 집계 하기

dataframe.groupby('column').column.agg(['mean', 'min', 'max', 'sum'])

df.groupby("테마").agg({"PER": max,"PBR": min})
df.groupby('테마')[['PER', 'PBR']].agg([np.mean, np.std])

 

 

df.sort_index()

ascending = False

# 내림차순

 

 


 

데이터 전처리&시각화 라이브세션

 

 

df.dropna()

를 사용하여 누락된 행을 삭제

how="any" 로 설정하면  하나라도 any가  들어있으면 행 또는 열을 삭제

# all이 들어가면 모든 값들이 결측값이어야지 삭제

axis = 0: 행, axis = 1: 컬럼

 

fillna

# 결측값을 채워넣기

 

isna()

# 결측값을 확인

# 결측값 True

# True=1 , False=0

 

 


Daily Scrum

 

 

iris.groupby("Species")["Sepal Length"].mean()
# 시리즈 형태

iris.groupby("Species",as_index=False)["Sepal Length"].mean()
# df 형태

as_index=False

를 사용하면 df 형태로 출력된다.

 

 


  • Next

1. SQL 코드카타 1문제(94번)

2. 알고리즘 코드카타 1문제 (38번)

3. 전처리&시각화 라이브세션 수강

4. 전처리&시각화 챌린지 풀이

 

'TIL' 카테고리의 다른 글

2024-05-17  (0) 2024.05.17
2024-05-16  (0) 2024.05.16
2024-05-13  (0) 2024.05.13
2024-05-10  (0) 2024.05.10
2024-05-09  (0) 2024.05.09