TIL

비즈니스 용어 정리 및 기술 질문 정리

여연찌 2024. 10. 2. 17:02
  • Today I Learned

비즈니스 용어 정리

 

 

데이터 파이프라인

 

필요한 데이터를 원할때마다 꺼내올 수 있도록 데이터를 쌓아두는 파이프

 

데이터를 가져오는 과정에서 정제나 전처리가 쉽도록, 데이터 형태를 고쳐주고

필요없는 데이터는 제거하고, 함께 보는게 좋은 데이터들은 합쳐서 저장해주는 등의 목적을 가진다.

 

데이터 추출

데이터 변경

데이터 결합

데이터 검증

데이터 적재

 

 

KPI(핵심 성과 지표)

 

기업이 목표를 달성하기 위해 관리해야 하는 요소들에 대한 성과지표 중 핵심적인 지표

기업,직무,팀 마다 달성해야하는 KPI 는 다를 수 있다.

 

* 이커머스 기업의 KPI란 무엇이 있을지?

LTV(고객생애가치), CAC(고객획득비용), 가입자 수, 활성유저 수, 고객 이탈률 등

 

매출&판매 관련한다면

연간목표매출, 매출 총이익, 평균 객단가 등

 

고객 관리 관련

신규 구매 고객& 재 구매 고객 비중

재구매 횟수 증가율 등

 

 

 


기술 질문 정리

 

Python 

 

 

함수: 특정 기능을 수행하는 것, 매개변수 로 자료를 전달한다.

메서드: 특정 자료형 에서 특정 기능을 수행하는 것. 자료명 뒤에 마침표를 찍어서 사용한다.

라이브러리: Matplotlib 과 같이 패키지의 집합

패키지: Numpy, Pandas 와 같은 특정 기능과 관련되어 있는 여러가지 모듈의 집합

모듈: 함수, 변수, 클래스를 모아둔 것

클래스: 객체(object)를 표현하기 위한 문법

메서드 체이닝: 연속으로 메서드를 호출하는 것

코드를 더 간결하고 가독성 있게 만들 수 있다.

 

인터프리터와 컴파일러 

 

인터프리터: 파이썬 과 같이 한 문장씩 해석하고 실행하는 것. 컴파일러에 비해 동작시간이 소요될 수 있지만 한문장씩 수행하기 때문에 문제가 있을 시 수정하기 간편하다.

컴파일러: java, C 언어와 같이 처음부터 끝까지 듣고 나서 한꺼번에 바꿔주는 것. 실행되기까지는 시간이 소요되지만 인터프리터에 비해 모든 실행에까지 걸리는 시간은 짧은 편이다. 

 

SQL

 

실행 순서

FROM > WHERE > GROUP BY > HAVING > SELECT > ORDER BY

 

"select count(*) ... group by" 구문과 "select distinct" 구문 간의 차이

GROUP BY 의 경우 특정 컬럼을 기준으로 데이터를 그룹화 한 후 각 그룹의 개수를 반환

DISTINCT 의 경우 중복된 값을 제거하고 고유한 값만 반환

 

윈도우 함수란?

데이터를 집계할 때 사용되는 함수이다.

그룹화 없이도 계산된 결과를 각 행에 붙여주는 기능을 제공한다.

 

ROW_NUMBER()

각 행에 고유한 번호를 매긴다.

RANK()

중복된 값이 있는 경우 같은 순위를 부여하고 다음 순위는 건너뛴다.(1,2,2,4,5)

DENSE_RANK()

중복된 값이 있는 경우 같은 순위를 부여하고, 다음 순위는 건너뛰지 않는다.(1,2,2,3,4)

SUM()

누적합계

AVG()

특정 그룹 내에서 평균 

 

K-MEANS 클러스터링

장점

다양한 유형의 데이터와 군집 형태에 적용할 수 있고, 간단하여 해석이 쉽다.

단점

최적화를 위해 여러번 실행해야하고, 초기 군집의 수 k를 사전에 결정해야한다

 

 

 

 

RFM 분석

Recency : 최근 구매, 얼마나 최근에 구매했는가

Frequency : 구매 빈도, 얼마나 자주 구매했는가

Monetary : 구매 금액, 얼마나 많은 금액을 지출했는가

 

 

Tableau 의 시각화 구현 방식의 원리

 

측정값: 확인하고 싶은 값

매출, 수량, 주문건수 등

차원: 측정값을 분류하여 볼 수 있는 관점

시간대, 지역, 업종 등

연속형: 연결성이 존재하는 데이터

판매 금액, 카운트 등

불연속형: 각 데이터마다 의미가 있는 값

카테고리, 문자열 등

 

원하는 데이터의 특징에 따라 드래그앤드롭을 하며 그래프를 생성할 수 있다.

데이터 원본에 없는 필드를 직접 생성할 수 있으며, 대시보드 제작까지 가능하다.

 

 

 

 

'TIL' 카테고리의 다른 글

프로젝트 흐름 정리  (0) 2024.10.07
2024-09-30  (1) 2024.09.30
2024-09-26  (1) 2024.09.26
2024-09-25  (0) 2024.09.25
2024-09-24  (1) 2024.09.24