전체 글 233

분류분석 - 나이브베이지,k-NN 알고리즘, 서포트벡터머신, 분류모형성과

나이브 베이즈 분류: 베이즈 정리를 기반으로 한 머신러닝 기법 - 빈도 확률: 사건이 발생한 횟수의 장기적인 비율을 의미, 객관적으로 확률을 해석- 베이지안 확률: 주관적으로 확률을 해석- 베이즈 정리에서 확률은 주장 혹은 믿음의 신뢰도로 나타난다.   k-NN (k-Nearest Neighborhood, 최근접 이웃법): 데이터 포인트의 근접 이웃을 활용하여 분류 또는 회귀 문제를 해결하는 데 사용: k 는 이웃의 개수를 나타낸다: 최적의 k 값을 찾기 위해 총 데이터들의 제곱근 값을 사용한다.: 작은 k는 모델이 데이터의 노이즈에 민감하게 반응하게 하고, 큰 k는 모델의 결정 경계를 더 부드럽게 만든다. 서포트벡터머신 ( Support Vector Machine, SVM ): 지도 학습 모델로 사용되..

ADsP 내용 정리 2024.04.28

2주차[2024-04-22 ~ 26]

FACTS 본캠프 2주차첫날 발제가 끝나고, 새로운 팀원분들과 팀명과 전체적인 규칙을 정했다.이번 팀은 4월22일부터 5월24일 까지 꽤나 긴 시간을 함께 하게 된다.매일 아침10시와 오후 8시에 daily scrum 을 하는데  오전에는 그날 어떤 학습을 할 것인지 그리고 특이사항 등을 공유하고 오후에는 각자 개인이 그날 새롭게 알게된, 다시한번 알게된 내용을 공유하기로 했다.내가 알았던 부분은 복습하는 의미, 내가 알게된 부분은 팀원들에게 공유하며 나도 정리하는 의미,내가 몰랐던 부분은 예습하는 의미로 알찬 시간을 보냈다. 월~수요일 에는 SQL 라이브 세션이 있어서 다시한번 복습을 하고 내가 부족했던 부분은 다시한번 짚어보는 시간이 되었다. 매일마다 과제가 있어 동기들,튜터님과 코드를 공유하며 헤맸..

WIL 2024.04.26

2024-04-26

Today1. SQL 코드카타2. 파이선 종합반 강의 완강3. SQL 코드카타 복습 Today I Learned파이썬 while 문: 조건이 있고, 그 조건이 참 일 때만 반복을 한다.: 조건 은 불리언 값(True 또는 False) 을 반환하는 표현식: 무한 반복을 조심해야한다. continue# 반복문으로 돌아가는 것pass# 그냥 지나가는 것 인수: 함수에 입력하는 값  전역변수: 프로그램 전체에서 접근가능한 일반적인 변수지역변수: 특정한 범위 (함수내부) 에서만 접근 가능한 변수: 함수내에서만 사용가능   매개변수(parameter): 함수를 정의할 때 적어주는 값인수=인자(argument): 함수를 호출할 때 전달되는 값  가변인수: 변수가 몇개 들어갈지 그때그때 다를 경우args: 위치 인수*..

TIL 2024.04.26

[python] return 과 print 의 차이?

* return 과 print 의 차이는? # return 은 밖으로 끄집어내서 무언가에 담을 수 있다.# print 는 그냥 출력만 해주고 끝난다. 보여주기만 함, 담을 수가 없다! data = [2, 4, 6, 8, 10]class DataPreprocessor: def __init__(self, data): self.data = data def calculation(self): print(f"평균:{sum(data)/len(data)}") # print 는 그냥 보여주고 끝난다dab = DataPreprocessor(data)result = dab.calculation()# dab.calculation() 이 있어서 나옴> 평균: 6.0dab.cal..

개인공부 2024.04.26

2024-04-25

Today1. ADsP 강의 정리(인공신경망 분석)2. SQL 코드카타3. 파이썬 강의 듣기Today I Learned SQL같은 테이블에서 값 뽑아주기WITH ta AS (SELECT DISTINCT a.author_id, b.viewer_idFROM views AS aJOIN views AS bON a.author_id=b.viewer_id)SELECT author_id AS idFROM taORDER BY 1 ASC# Output 만 보고 어거지로 뽑아낸 값.. # 어제 SQL 세션에서 배웠던 distinct 컬럼1,컬럼2 를 활용해봤는데 틀렸음 ㅠㅜ!# self join 을 해야하는 것은 알겠는데, 방법을 다시 찾아봐야겠다 SELECT DISTINCT a.author_id AS 'id'FROM v..

TIL 2024.04.25

분류분석 - 인공신경망 분석

인공신경망: 인공신경망은 인간의 뇌를 기반으로한 학습 및 추론 모형: 뇌의 구조를 수학적으로 단순화하여 모델링 한 것: 입력 > 시냅스에 해당, 개별신호의 강도에 따라 가중: 활섬함수 > 인공신경망의 출력을 계산: 많은 데이터에 대해 학습을 거쳐, 원하는 결과가 나오도록(오차가 작아지도록) 가중치가 조정 인공신경망 분석의 장단점장점- 스스로 가중치를 학습하므로 다양하고 많은 데이터에 효과적- 잡음에 민감하게 반응하지 않음- 여러개의 은닉층을 갖고 있는 구조로 비선형적인 문제 분석에 유용- 패턴인식, 분류, 예측 등의 문제에 효과적단점- 초기 가중치에 따라 전역해가 아닌 지역해로 수렴할 수 있다.- 결과해석이 쉽지 않다.- 모형이 복잡할 경우 학습에 오랜 시간이 소요됨- 추정한 가중치의 신뢰도 낮음- 은닉..

ADsP 내용 정리 2024.04.25

2024-04-24

Today1. SQL, 파이썬 코드카타 2. ADsP 강의 3. SQL 라이브 세션 및 과제 4. 데이터 리터러시 강의 듣기(2시간) Today I Learned 파이썬 행렬의 덧셈 https://lyj-01.tistory.com/112 행렬의 덧셈행렬의 덧셈은 행과 열의 크기가 같은 두 행렬의 같은 행, 같은 열의 값을 서로 더한 결과가 됩니다. 2개의 행렬 arr1과 arr2를 입력받아, 행렬 덧셈의 결과를 반환하는 함수, solution을 완성해주세요lyj-01.tistory.com 리스트를 더해주면 되겠다 해서 이전에 사용했던 [x+y for x,y in zip(arr1,arr2)] 를 사용해보았다def solution(arr1, arr2): answer = [x+y for x,y in zip(a..

TIL 2024.04.24