TIL

2024-09-24

여연찌 2024. 9. 24. 17:13
  • Today

SQL 코드카타

비즈니스 용어 정리

 


  • Today I Learned

 

SQL

 

USED_GOODS_BOARD와 USED_GOODS_REPLY 테이블에서 2022년 10월에 작성된 게시글 제목, 게시글 ID, 댓글 ID, 댓글 작성자 ID, 댓글 내용, 댓글 작성일을 조회하는 SQL문을 작성해주세요. 결과는 댓글 작성일을 기준으로 오름차순 정렬해주시고, 댓글 작성일이 같다면 게시글 제목을 기준으로 오름차순 정렬해주세요.

 

# 내가 작성한 쿼리

SELECT b.title
     , b.board_id
     , r.reply_id
     , r.writer_id
     , r.contents
     , right(r.created_date,10) created_date
from USED_GOODS_BOARD as b
join USED_GOODS_REPLY as r
on b.board_id=r.board_id
where b.created_date like '2022-10%'
order by r.created_date, b.title

# 다른 쿼리

SELECT A.TITLE, A.BOARD_ID, B.REPLY_ID, B.WRITER_ID, B.CONTENTS, DATE_FORMAT(B.CREATED_DATE,'%Y-%m-%d') AS CREATED_DATE
FROM USED_GOODS_BOARD A
JOIN USED_GOODS_REPLY B
ON A.BOARD_ID = B.BOARD_ID
WHERE YEAR(A.CREATED_DATE) = 2022 AND MONTH(A.CREATED_DATE) = 10
ORDER BY B.CREATED_DATE, A.TITLE

 

date_format 을 사용하면 조금더 깔끔하고, 간편하다!

year(date 컬럼) 이나 month 도 사용해볼 수 있었는데 

익숙한 용어를 사용하다보니 like 가 튀어나왔다.

 

다음에는 사용해봐야겠다.

 


비즈니스 용어 정리

 

 

AARRR

 

출처: 데이터리안

Acquisition(획득)

마케팅 활동을 통해 새로운 사용자를 서비스로 데리고 오는 단계

 

Activation(활성화)

회원 가입을 시키거나, 튜토리얼을 수행하게 하는 등 서비스를 이용할 준비를 하는 단계

 

Retention(유지)

사용자들이 서비스를 계속해서 사용하는지를 보는 단계

 

Revenue(매출)

돈을 내고 서비스를 사용하는 단계

 

Referral(추천)

사용자들이 마음에 드는 서비스를 주변에 추천하는 단계

 

https://datarian.io/blog/ga4-life-cycle-collection-aarrr

 

GA4 보고서의 기초 (3) 수명 주기 컬렉션과 AARRR

수명 주기 컬렉션은 단순한 보고서 모음이 아니라 구글이 생각하는 성장의 큰 그림

datarian.io

 

LTV(고객생애가치)

 

고객에게 얻을 수 있는 미래 순이익의 현재 가치

 

LTV 계산법

고객 당 매출(월별) = 평균 주문 금액에 주문 수를 곱한 값

고객 당 기여 마진(월별) = 고객 매출에서 고객과 관련된 변동 비용을 뺀 값

고객 수명(개월) = 1/월별 이탈률

LTV = 고객 기여 마진에 고객 평균 수명을 곱한 값

 

주의할 점은 매출의 현재 가치가 아닌 고객의 순 이익으로 계산해야한다.

 

 

GMV(총 상품 가치)

 

특정 기간 동안 마켓플레이스를 통해 거래된 상품의 총 판매액

마켓플레이스의 소비자 측에서 실제로 지출하는 금액

 

+ 매출

마켓 플레이스가 가져가는 GMV 의 일부

일반적으로 마켓플레이스에서 성공적으로 거래된 GMV 에 따른 거래 수수료가 가장 많지만

광고 수익, 스폰서십 등도 포함될 수 있다.

 

 

CAC(고객 확보 비용)

 

사용자당 기준으로 명시된 사용자 확보에 소요되는 전체 비용

 

혼합 CAC[총 획득 비용 / 모든 채널에서 획득한 총 신규 고객]

* 유료 마케팅을 통해 획득한 사용자를 분리하지 않고 '혼합' 비용 (Organic 으로 획득한 사용자를 포함) 으로 CAC 계산

 

 


p-value

 

어떤 사건이 우연히 발생할 확률

p-value 가 0.05 보다 크다면 귀무가설을 기각할 수 없고, 작으면 기각하여 대립가설을 기각

보통 p-value 값이 0.05 가 넘으면 우연히 일어날 확률이 높다는 의미로 해석되며,

통계적 유의성을 갖지 않는다고 판단할 수 있다.

 

 

중앙값

 

데이터를 정렬한 후 중앙에 위치한 값

데이터의 개수가 홀수라면 중간에 있는 수, 짝수라면 중간의 두 수의 평균

 

 

정규화(Normalization)

 

데이터를 특정 범위로 변환하여 범위를 일치시키는 작업

 

 

표준화(Standardization)

 

평균을 0으로, 표준편차를 1로 변환하여 데이터를 조정하는 작업

+ 데이터의 분포가 중요하다면 표준화 사용

 

 

A/B 테스트

 

웹 사이트 방문자를 임의로 두 집단으로 나누고,

한 집단에게는 기존 사이트를 보여주고 다른 집단에게는 새로운 사이트를 보여준 다음,

두 집단 중 어떤 집단이 더 높은 성과를 보이는지 측정하여 정량적으로 평가하는 방식

 

 

Matplotlib

 

기본적인 플롯을 그리기에 적합하고 눈금선, 레이블 등을 세밀하게 조정할 수 있음

 

 

seaborn

 

통계적 그래프를 쉽게 , 조금더 매력적인 플롯을 그릴 수 있음

 

 

클러스터링 기법을 사용하여 고객 군집화를 수행한 경험?

더보기

고객 별 결제 성향을 분류하고, 기존의 개념에 따른 결과가 아닌 다른 결과를 보여준 군집을 찾아

그 군집 맞춤 마케팅 전략을 제안하는 프로젝트를 진행해보았습니다.

저희가 찾은 군집은 할부 개월 수가 군집 중에 가장 높았기 때문에 유보적인 소비성향을 갖은 유저로 추측하였으나,

실 데이터 분석시 오히려 비싸더라도 원하는 제품에 대하여 과감히 소비하는 성향을 보여주었습니다.

오히려 필수품 구매시 할부 개월이 더 높은편이었고,

리드타임이 비교적 짧았기 때문에 본인의 관심사에 대한 과감한 소비와 즉각적인 만족을 추구하는 특성이라고 파악하였습니다.

해당 군집에게는 리미티드 에디션 상품, 배송관련 구독서비스 등의 마케팅 방안을 제안해보았습니다.

 

 

결측치(missing data)가 많은 데이터셋에서 문제를 해결하는 방법

더보기

결측치는 여러 가지 방법으로 처리할 수 있습니다.

데이터의 특성과 분석 목표를 고려하여 선택할 수 있는데요.

 

예를 들어, 수치형이라면 숫자 0으로 대체하거나, 중위값, 평균값, 중위값 등으로 변경하는 방법이 있습니다.

특히, 매출과 관련된 지표에서는 결제가 이루어지지 않은 상태를 나타낼 수 있으므로,

임의로 변형하지 않고 그대로 사용하는 것이 오히려 의미 있는 분석을 도울 수 있습니다.

 

 

상관 분석(correlation analysis)을 통한 두 변수 간의 관계 해석

더보기

-1 에서 1 사이의 값을 가진 상관 계수를 통해 변수들이 서로 어떻게 관련되어 있는지를 평가할 수 있습니다.

양의 상관 관계일수록 한 변수가 증가하면 다른 변수도 증가하고

음의 상관 관계일수록 한 변수가 증가하면 다른 변수는 감소합니다.

0에 가까울 수록 거의 상관 관계가 없다고 볼 수 있습니다.

 

상관 관계가 있다는 것은 연관성을 의미할 뿐,

한 변수가 다른 변수의 원인이라는 인과관계를 의미하는 것은 아닙니다.

 

 

익명화(Anonymization)

 

데이터를 완전히 비식별화하여 개인을 절대 식별할 수 없음

연구, 통계 데이터 제공 시 개인 정보를 완전히 제거하여 공유할 때 사용

 

 

가명화(Pseudonymization)

 

부분적으로 비식별화하여, 특정 정보를 사용하면 다시 개인을 식별할 수 있음

병원에서 환자의 의료 데이터를 분석하기 위해 환자의 이름을 코드로 바꾸고

필요 시 원본 데이터를 복원할 수 있도록 유지하는 경우 사용

'TIL' 카테고리의 다른 글

2024-09-26  (1) 2024.09.26
2024-09-25  (0) 2024.09.25
2024-09-23  (0) 2024.09.23
2024-09-05  (1) 2024.09.05
2024-09-03  (0) 2024.09.03