분류 전체보기 230

2024-04-25

Today1. ADsP 강의 정리(인공신경망 분석)2. SQL 코드카타3. 파이썬 강의 듣기Today I Learned SQL같은 테이블에서 값 뽑아주기WITH ta AS (SELECT DISTINCT a.author_id, b.viewer_idFROM views AS aJOIN views AS bON a.author_id=b.viewer_id)SELECT author_id AS idFROM taORDER BY 1 ASC# Output 만 보고 어거지로 뽑아낸 값.. # 어제 SQL 세션에서 배웠던 distinct 컬럼1,컬럼2 를 활용해봤는데 틀렸음 ㅠㅜ!# self join 을 해야하는 것은 알겠는데, 방법을 다시 찾아봐야겠다 SELECT DISTINCT a.author_id AS 'id'FROM v..

TIL 2024.04.25

분류분석 - 인공신경망 분석

인공신경망: 인공신경망은 인간의 뇌를 기반으로한 학습 및 추론 모형: 뇌의 구조를 수학적으로 단순화하여 모델링 한 것: 입력 > 시냅스에 해당, 개별신호의 강도에 따라 가중: 활섬함수 > 인공신경망의 출력을 계산: 많은 데이터에 대해 학습을 거쳐, 원하는 결과가 나오도록(오차가 작아지도록) 가중치가 조정 인공신경망 분석의 장단점장점- 스스로 가중치를 학습하므로 다양하고 많은 데이터에 효과적- 잡음에 민감하게 반응하지 않음- 여러개의 은닉층을 갖고 있는 구조로 비선형적인 문제 분석에 유용- 패턴인식, 분류, 예측 등의 문제에 효과적단점- 초기 가중치에 따라 전역해가 아닌 지역해로 수렴할 수 있다.- 결과해석이 쉽지 않다.- 모형이 복잡할 경우 학습에 오랜 시간이 소요됨- 추정한 가중치의 신뢰도 낮음- 은닉..

ADsP 내용 정리 2024.04.25

2024-04-24

Today1. SQL, 파이썬 코드카타 2. ADsP 강의 3. SQL 라이브 세션 및 과제 4. 데이터 리터러시 강의 듣기(2시간) Today I Learned 파이썬 행렬의 덧셈 https://lyj-01.tistory.com/112 행렬의 덧셈행렬의 덧셈은 행과 열의 크기가 같은 두 행렬의 같은 행, 같은 열의 값을 서로 더한 결과가 됩니다. 2개의 행렬 arr1과 arr2를 입력받아, 행렬 덧셈의 결과를 반환하는 함수, solution을 완성해주세요lyj-01.tistory.com 리스트를 더해주면 되겠다 해서 이전에 사용했던 [x+y for x,y in zip(arr1,arr2)] 를 사용해보았다def solution(arr1, arr2): answer = [x+y for x,y in zip(a..

TIL 2024.04.24

행렬의 덧셈 #list(map(lambda 매개변수:표현식),반복)

행렬의 덧셈은 행과 열의 크기가 같은 두 행렬의 같은 행, 같은 열의 값을 서로 더한 결과가 됩니다. 2개의 행렬 arr1과 arr2를 입력받아, 행렬 덧셈의 결과를 반환하는 함수, solution을 완성해주세요.def solution(arr1, arr2): answer = [] for i in range(len(arr1)): answer.append(list(map((lambda x,y : x+y), arr1[i],arr2[i]))) return answerarr1 = [[1,2],[2,3]]arr2 = [[3,4],[5,6]] ① answer = []# 빈 리스트 생성 ② for i in range(len(arr1)):# arr1 의 길..

2024-04-23

Today 1. SQL, 파이썬 코드카타 1문제씩 2. SQL 코드카타 복습 3. SQL 라이브 세션 및 과제 4. ADsP 강의(앙상블분석) Today I Learned SQL SQL 코드카타 복습 https://lyj-01.tistory.com/51 SQL 코드카타 번호 이름 풀이날짜 44 가격대 별 상품 개수 구하기 4/12 45 3월에 태어난 여성 회원 목록 4/5 46 대여 기록이 존재하는 자동차 리스트 구하기 4/5 48 즐겨찾기가 가장 많은 식당 정보 출력하기 4/12 55 lyj-01.tistory.com 69번 SELECT MONTH(start_date) , car_id , COUNT(car_id) RECORDS FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY WHE..

TIL 2024.04.23

분류분석 - 앙상블분석

앙상블기법 : 기법들을 한 곳에 뭉쳐서 하나의 모델을 만든다. : 여러 개별 모델을 결합하여 하나의 강력한 모델을 만드는 기법 : 단일 모델보다 높은 정확성과 일반화 능력을 제공할 수 있음 : 배깅, 부스팅, 랜덤포레스트 : 수치형 데이터 > 값의 평균, 범주형 데이터 > 다수결 방식 배깅(Bagging, bootstrap aggregating) : 원 데이터 집합으로부터 크기가 같은 표본을 여러 번 단순 임의 복원추출하여 각 표본에 대해 분류기(aka 모델)를 생성한 후 그 결과를 앙상블 하는 방법 : 방복추출 방법을 사용 : 같은 데이터가 한 표본에 여러 번 추출될 수도 있고, 그렇지 않을 수도 있다. : 보팅(Voting) 은 여러 개의 모형으로부터 산출된 결과를 다수결에 의해 최종 결과 선정 : ..

ADsP 내용 정리 2024.04.23

문자열 다루기 기본 # isdigit()

문자열 s의 길이가 4 혹은 6이고, 숫자로만 구성돼있는지 확인해주는 함수, solution을 완성하세요. 예를 들어 s가 "a234"이면 False를 리턴하고 "1234"라면 True를 리턴하면 됩니다. def solution(s): if (len(s)==4 or len(s)==6) and s.isdigit(): # 조건1 길이가 4 or 6 return True # 조건2 숫자로만 구성 else: return False ① if len(s)==4 or len(s)==6 and s.isdigit(): # s 의 길이가 4 or 6 이고, 숫자로만 구성 되면 True s.isdigit() # 문자열(s)이 숫자의 형태면 True 를 반환 2가지 조건을 모두 만족해야 True 반환 * 숫자를 판별하는 함수..

2024-04-22

Today 1. 새로운 주차 할 일 정리 2. SQL, 파이썬 코드카타 3. SQL 보충 세션 개인과제 4. ADsP (의사결정나무) Today I Learned SQL SQL 코드카타 복습 https://lyj-01.tistory.com/51 SQL 코드카타 번호 이름 풀이날짜 44 가격대 별 상품 개수 구하기 4/12 45 3월에 태어난 여성 회원 목록 4/5 46 대여 기록이 존재하는 자동차 리스트 구하기 4/5 48 즐겨찾기가 가장 많은 식당 정보 출력하기 4/12 55 lyj-01.tistory.com 59번 SELECT car_id, IF (car_id IN ( SELECT car_id FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY WHERE start_date = '2..

TIL 2024.04.22

분류분석모형 - 의사결정나무

의사결정나무 - 질문을 계속 던지는 것 - 데이터에 들어있는 패턴을 변수의 조합으로 나타내는 것 - 예측 또는 분류의 모델을 나무 형태(tree 구조)로 만든다 : 전체 자료를 몇개의 소집단으로 분류하거나 예측을 수행하는 방법 : 상위노드로부터 하위노드로 나무 구조를 형성하는 매 단계마다 분류변수와 분류기준값의 선택이 중요하다. : 종속변수가 연속형인 회귀나무와 종속변수가 이산형인 분류나무로 구분된다. 의사결정나무의 활용 ① 세분화 ② 분류 ③ 예측 ④ 차원 축소 및 변수 선택 : 여러 독립변수들 중에서 종속변수에 큰 영향을 미치는 변수를 골라내는 경우 사용 ⑤ 교호작용 : 의사결정나무는 교호작용이 없는 것이 장점 : 여러 개의 독립변수들을 결합하여 종속변수에 작용하는 규칙을 파악 의사결정나무의 특징 장..

ADsP 내용 정리 2024.04.22

1주차[2024-04-15 ~ 19]

FACTS 본캠프가 시작되었다. 본캠프는 사전캠프와는 다르게 오전 9시부터 오후 9시까지, 총 12시간을 달려야 한다. 시작됨과 동시에 미니프로젝트가 시작되었기에 OT 후 새롭게 배정된 팀원분들과 만나 소통을 하고 팀명과 프로젝트 주제를 선정하였다. 팀운이 정말 좋았다. 함께 일주일을 보내게 된 팀원분들의 모두 대단하셨기 때문에 정말 많은 배움의 기회를 얻을 수 있었다. 심지어 두분은 데이터분석 관련한 업무를 하다 오신 경력자분들이었다! 프로젝트 주제를 선정하고, 그 뒤 코드를 짜고 어떤 방식으로 결론을 내릴지 오랜시간동안 회의를 진행하였고 정해진 기간안에 무사히 마무리하여 제출할 수 있었다. 4주간의 사전캠프 기간동안 배웠던 기술들로 내가 해볼 수 있었던 것은 분기별, 매출, 주문수량 등을 직접 코드를..

WIL 2024.04.19