- Today
1. 태블로 라이브 세션 2회차
2. ADsP 강의 수강
- Today I Learned
SQL
기본 스크롤은 페이지의 90% 를 넘었을 때 스크롤 이벤트가 찍힌다..
SELECT COUNT(DISTINCT user_pseudo_id, ga_session_id) AS pv
FROM ga
WHERE page_title = '백문이불여일타 SQL 캠프 입문반'
AND event_name = 'page_view'
위와 같은 함수에서 COUNT 안에 2가지를 넣을 수 없는 프로그램(빅쿼리 등)의 경우
SELECT COUNT(DISTINCT CONCAT(user_pseudo_id, ga_session_id)) AS pv
이렇게 CONCAT 을 사용하여 COUNT 해주면 같은 결과를 낼 수 있다!
ADsP
비즈니스 프로세스에 분석을 내재화하는 것을 구현하기 전에 고려해야할 요소
1. 어떤 분석요소를 내재화할 것인가
2. 어떤 알고리즘을 설계할 것인가
3. 어떤 시각적인 요소를 쓸 것인가
별도의 독립된 분석 전담인력을 현업 부서로 배치하는 것
: 분산형 조직구조
비즈니스 모델 정의를 위한 핵심구동력을 파악하기 위해 비즈니스 컨텍스트 분석을 수행
비즈니스 컨텍스트 구성요소
: 시장,산업,트렌드,거시경제
벡터는 1차원!
4분위수, 최소값, 최대값, 중앙값,평균 등 통계요약정보를 뽑아내는 함수
summay 함수
비표본오차
: 조사를 하며 실수(질문을 잘못 하는 등)로 인해 발생한 값
모분산의 추론
1. 모집단의 변동성 또는 퍼짐의 정도에 관심이 있는 경우 모분산이 추론의 대상이 된다.
2. 모집단이 정규분포를 따르지 않더라도 중심극한정리를 통해 모분산에 대한 추론을 유사하게 시행할 수 있다.
3. 두 표본의 분산 차이를 검정하는 분산비 검정의 검정통계량은 F분포를 따른다.
4. 정규모집단으로부터 n개를 단순임의 추출한 표본의 분산은 자유도가 n-1인 카이제곱분포를 따른다.
스피어만 상관계수
서열척도, 비모수적 상관관계, 비선형
순서형범주의 순위관계를 확인
피어슨 상관계수
연속형범주, 선형관계
시계열 데이터의 정상성
평균, 분산, 공분산이 일정하다
변수가 범주형인 경우 예측모형의 주된 목적?
분류
앙상블기법
배깅, 부스팅, 랜던포레스트
유클리드거리
두 점 사이의 직선 거리를 측정
맨하튼 거리
각 축을 따라 이동한 거리의 합으로 계산
표준화 거리
변수의 표준편차를 고려하여 계산
'TIL' 카테고리의 다른 글
2024-07-04 (0) | 2024.07.04 |
---|---|
2024-07-03 (0) | 2024.07.03 |
2024-07-01 (0) | 2024.07.01 |
2024-06-28 (0) | 2024.06.28 |
2024-06-27 (0) | 2024.06.27 |