TIL

2024-09-26

여연찌 2024. 9. 26. 16:54
  • Today

 

 


  • Today I Learned

 

SQL

 

PATIENT 테이블에서 12세 이하인 여자환자의 환자이름, 환자번호, 성별코드, 나이, 전화번호를 조회하는 SQL문을 작성해주세요. 이때 전화번호가 없는 경우, 'NONE'으로 출력시켜 주시고 결과는 나이를 기준으로 내림차순 정렬하고, 나이 같다면 환자이름을 기준으로 오름차순 정렬해주세요.

 

# 내가 작성한 쿼리

SELECT pt_name
     , pt_no
     , gend_cd
     , age
     , case when tlno is null then 'NONE' else tlno end TLNO
from patient 
where age <= 12 and gend_cd = 'W'
order by age desc, pt_name

# 다른 풀이
if(tlno is null, 'NONE', tlno) TLNO
IFNULL(tlno , 'NONE') tlno 
coalesce(tlno , 'NONE') tlno

 

IFNULL(컬럼명, 'null 일 경우 대체 값')

COALESCE(A,B,...)

A~ 중 null 이 아닌 첫 번째 값 출력

 


용어 정리

 

 

신뢰 구간

 

표본 데이터를 사용하여 모집단의 평균을 추정할 때, 그 평균이 포함될 가능성이 있는 범위

일반적으로 95% 신뢰구간이 사용되며, 이는 100번 같은 조사를 했을 때 95번은 모집단의 평균이 이 구간 안에 들어간다는 뜻이다.

 

 

EDA 의 단계 구성

 

1. 분석을 하고자 하는 목적을 확인하고, 보여지는 데이터가 어떻게 출력되었는지 확인

2. 데이터에는 문제가 없는지 이상치, 결측치 등을 확인하고 분석 목적에 맞추어 처리

3. 데이터들의 상관관계는 있는지 확인

 

 

귀무가설

 

검증하고자 하는 가설이 틀렸음을 나타내는 기본 가설으

변화가 없다, 효과가 없다

 

 

대립가설

 

대립가설은 변화가 있다, 효과가 있다

 

* p-value 를 통해 귀무가설의 기각 여부를 결정

 

 

히스토그램

 

데이터의 분포를 시각적으로 볼 수 있고, 특정 값들이 많이 등장하는지 분포의 모양 확인

 

 

박스 플롯

 

데이터의 중앙값과 사분위수

이상치 확인

 

 

가설 검정 절차

 

1. 귀무가설과 대립가설을 설정한 후,

2. 오류를 허용하는 기준인 유의수준을 설정

3. 데이터에 기반하여 검정 통계량을 계산

4. p-value 를 계산하고, 유의수준과 비교하여 가설을 평가

 

 

 

확률 밀도 함수(PDF)

 

연속 확률 변수의 특정 값에서의 확률 밀도

특정 구간에 대한 확률을 나타낼 때 사용

 

 

누적 분포 함수(CDF)

 

특정 값 이하의 확률

누적된 확률

 

 

 

 

 

'TIL' 카테고리의 다른 글

비즈니스 용어 정리 및 기술 질문 정리  (0) 2024.10.02
2024-09-30  (1) 2024.09.30
2024-09-25  (0) 2024.09.25
2024-09-24  (1) 2024.09.24
2024-09-23  (0) 2024.09.23