분류 전체보기 230

대여 횟수가 많은 자동차들의 월별 대여 횟수 구하기

CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블에서 대여 시작일을 기준으로 2022년 8월부터 2022년 10월까지 총 대여 횟수가 5회 이상인 자동차들에 대해서 해당 기간 동안의 월별 자동차 ID 별 총 대여 횟수(컬럼명: RECORDS) 리스트를 출력하는 SQL문을 작성해주세요. 결과는 월을 기준으로 오름차순 정렬하고, 월이 같다면 자동차 ID를 기준으로 내림차순 정렬해주세요. 특정 월의 총 대여 횟수가 0인 경우에는 결과에서 제외해주세요. SELECT MONTH(start_date) MONTH , car_id , COUNT(*) RECORDS FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY WHERE (START_DATE between '2022-08-01'..

SQL 코드카타 2024.04.09

통계분석 - 시계열분석

시계열 분석 : 일정 시간 간격으로 기록된 자료들에 대하여 특성 파악하고 미래를 예측 * 시계열 자료 : 시간의 흐름에 따라서 관측된 자료 시계열 자료의 자기 상관성 : 인접한 자료들과 상호 연관성을 가진다 시계열 분석의 자료 : 정상성, 비정상성 * 정상성 : 평균이 일정할 것, 분산이 시점에 의존하지 않을 것 * 비정상성 : 자료의 대부분은 비정상 시계열 자료의 정상성 조건 ① 일정한 평균 ② 일정한 분산 ③ 시차에만 의존하는 공분산 정상 시계열의 특징 : 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 갖는다 : 항상 그 평균값으로 회귀하려는 경향이 있으며, 평균값 주변에서의 변동은 대체로 일정한 폭을 갖는다 : 정상 시계열이 아닌 경우 특정 기간의..

ADsP 내용 정리 2024.04.09

통계분석 - 다변량 분석

다차원척도법(MDS) : 개체간의 근접성을 시각화 해놓은 그림 : 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 방법 다차원 척도법 방법 : stress 값을 통해 적합여부를 판단 : 0에 가까울수록 좋은 것 * 뭉쳐져 있을 수록 유사하고 거리가 멀수록 성분이 다르다 다차원 척도법 종류 : 계량적 MDS - 구간척도,비율척도, 양적척도, 유클리드 거리행렬, cmdscale : 비계량적 MDS - 순서척도, 서열척도, isoMDS 주성분분석 : 여러 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수를 만들어 기존 변수를 요약 및 축소하는 방법 : 통계적 분석을 하는 사전 기초 분석 : 새로운 변수로 생..

ADsP 내용 정리 2024.04.09

통계분석 - 회귀분석

회귀분석 : 한 변수와 다른 변수간의 관계를 모델링 : 하나 이상의 독립변수(원인변수)들이 종속변수(결과변수)에 미치는 영향을 예측 : 종속변수가 범주형이면 로지스틱 회귀분석을 사용한다 : 변수들이 일정한 경향성을 띤다는 것은 그 변수들이 일정한 인과관계를 갖고 있다고 추측할 수 있다. : 산점도를 봤을 때 일정한 추세선이 나타난다면 경향성을 가지거나 변수들 간에 인과관계가 존재한다고 생각할 수 있다. 회귀분석의 종류 회귀분석의 가정 4가지 ① 선형성 : 입력변수와 출력변수의 관계가 선형 : 다항회귀분석의 경우 선형성을 갖지 않아도 된다. ② 독립성 : 잔차와 독립변수의 값이 서로 독립적 : 다중회귀분석의 경우 독립변수들 간에 상관성이 없이 독립이어야 한다. : 상관성이 존재하는 경우 다중공선성이라고 하..

ADsP 내용 정리 2024.04.09

2024-04-08

Today 1. ADsP 통계분석 - 기초통계 2. SQL 코드카타 3. 알고리즘 코드카타 Today I Learned 꼭 필요한 몇가지만 작성(복습 목적) 어떤 문제가 발생했고, 어떤 것들을 시도했고, 어떻게 해결해서, 무엇을 새롭게 알게되었는지 SQL 구분자로 구분 한 뒤 문자열 이어주기 CONCAT_WS('구분자',문자열1,문자열2,...) FROM 절 서브쿼리를 WITH 문으로 SELECT flavor FROM ( SELECT * FROM first_half UNION SELECT * FROM july ) a GROUP BY flavor ORDER BY SUM(total_order) DESC LIMIT 3 이렇게 프롬절에 넣을 서브쿼리를 with 문으로 빼주면 됨! WITH total AS ( S..

TIL 2024.04.08

음양 더하기

어떤 정수들이 있습니다. 이 정수들의 절댓값을 차례대로 담은 정수 배열 absolutes와 이 정수들의 부호를 차례대로 담은 불리언 배열 signs가 매개변수로 주어집니다. 실제 정수들의 합을 구하여 return 하도록 solution 함수를 완성해주세요. signs[i] 가 참이면 absolutes[i] 의 실제 정수가 양수임을, 그렇제 않으면 음수임을 의미합니다. def solution(absolutes, signs): answer = 0 for i in range(len(absolutes)): if signs[i]: answer += absolutes[i] else: answer -= absolutes[i] return answer ① for i in range(len(absolutes)): # a..

통계분석 - 기초통계

기술통계 : 자료의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약 하는 것 ① 히스토그램 : 데이터를 구간으로 나누고 각 구간에 속하는 데이터의 빈도를 막대로 표현한 그래프 : 데이터의 분포를 살펴보거나, 데이터의 모양이나 특성을 파악 : 연속형으로 표시된 데이터를 표현할 경우 임의로 순서변경을 할 수 없고 막대 사이의 간격이 없다. : ex. 키, 몸무게, 성적 등 ② 막대그래프 : 범주형으로 구분된 데이터를 표현할 경우 범주의 순서를 의도에 따라 바꿀 수 있다. : ex. 직업,종교 등 ③ 줄기-잎 그림 : 데이터를 줄기와 잎의 모양으로 그린 그림 ④ 상자그림(상자수염그림, box plot) : 다섯 숫자 요약을 통해 그림으로 표현한 것 (사분위수) 인과관계의 이해 종속변..

ADsP 내용 정리 2024.04.08

3주차 [2024-04-01 ~ 05]

FACTS 이번주에는 주로 코드카타 문제풀이에 집중하였다. 기존에 풀이하였던 코드카타들을 복습하거나 새로운 문제를 풀이하는 시간을 가졌는데 첫번째 복습할때에는 기억이 나지 않았지만 두번째 복습할때부터는 기억이 나기 시작해서 기존 코드를 보지 않고도 풀어볼 수 있었다. 자주 보다보니 외워버리게 된 코드도 있었고 내가 직접 생각하여 다른 방식으로 코드를 쓴 문제들도 있었다. 술술 풀리던 SQL 코드카타가 뒤로 갈수록 점점 어려워지고 내가 어려워 했던 부분들이 나오기 시작했다. 막혔던 부분들은 그냥 넘어가지 않고 이해하며 넘어갈 수 있도록 공을 들였다 조금더 체계적으로 회고를 할 수 있도록 TIL 과 WIL 서식을 만들고 지난 TIL 을 복습하는 시간도 가졌다. FEELINGS 이렇게 공부를 하는게 맞나 하는..

WIL 2024.04.05

2024-04-05

오늘 진행한 일 1. SQL 코드카타 복습 2. 알고리즘 코드카타 복습 기억할 내용 SQL 만원 단위 가격대 별로 나누어주기 TRUNCATE(컬럼,-4) 만원 단위이기 때문에 정수자리 뒤에서 4번째를 떼어준다 *TRUNCATE 는 정해주는 자릿수만큼 버려준다 - 를 붙일 경우 정수뒷자리에서부터 버려준다 TRUNCATE(1234.567,1) >> 1234.5 TRUNCATE(1234.567,2) >> 1234.56 TRUNCATE(1234.567,-1) >> 1230 TRUNCATE(1234.567,-2) >> 1200 음식종류별로 즐겨찾기수가 가장 많은 식당 찾기 음식종류별로 그룹화를 했는데 즐겨찾기 수가 가장 많은 곳의 음식점을 출력해야했다 SELECT food_type, rest_id,rest_nam..

TIL 2024.04.05

2024-04-04

오늘 진행한 일 1. SQL 코드카타(61~65) 2. 알고리즘 코드카타(24~25) 기억할 내용 SQL 특정 위치 음식점의 평균 점수를 구하는 문제에서 음식점 이름과 음식타입에 랜덤한 값이 들어가는 것인가 해서 서브쿼리에~ 그룹바이 추가에 온 갖 쿼리를 짰는데 그냥 음식점별로 평균만 내주면 되는 문제였다.. 아직 GROUP BY 에 대한 개념이 제대로 잡히지 않았는지 다시 살펴봐야겠다 자동차 평균 대여 기간 구하기 https://lyj-01.tistory.com/73 자동차 평균 대여 기간 구하기 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블에서 평균 대여 기간이 7일 이상인 자동차들의 자동차 ID와 평균 대여 기간(컬럼명: AVERAGE_DURATION) 리스트를 출력하는 SQL..

TIL 2024.04.04