TIL

2024-07-19

여연찌 2024. 7. 19. 21:00
  • Today

1. 자연어 특강

2. 프로젝트

 


  • Today I Learned

 

자연어 특강

 

 

임베딩: 자연어부터 벡터까지의 수치화하는 과정

인코더: 위와 같은 역할을 하는 모듈

디코더: 임베딩된 벡터를 가지고 분석을 하고 예측을 하는 모델을 만드는 과정

 

 


프로젝트

 

 

뉴스레터 주말랭이에 데이터셋을 요청했고

긍정적으로 검토가 된줄 알았지만 ... 제공가능하다고 했던 첫번째 답과는 다르게 

몇차례 회신을 요청했지만 답이 오지 않았다.... 

 

결국 캐글의 커머스 관련한 데이터셋을 찾아보았고,

로그데이터를 제외한 상품,고객분석은 가능할 것으로 확인되어 진행하기로 하였다.

 

어떤 기획을 하면 좋을지?

> 코호트분석

어떤 분석을 할 것 인지?

> 고객 분류를 하여 특징을 찾고 매출향상을 해보기로 하였다.

어떤 문제점을 있는지?

- 찾지 못하였음 ..  데이터를 살펴봐야할듯

 

 

* 고객의 구매 패턴, 선호도, 행동을 파악하여 개인화된 서비스와 마케팅을 제안

+ 장바구니 분석(연관성 분석)

 

 

 


프로젝트

 

다차원 척도법

: 데이터 간의 거리를 표현하여 저차원 공간에 표현하는 것이 목적인 시각화 기법

: STRESS 값이 0인 경우 적합이 가장 잘된 것

: 연속형 변수 또는 서열척도

 

시계열 분석의 정상성

: 모든 시점에 대하여 일정한 평균, 분산을 갖는다

: 평균이 일정하지 못한 경우 차분을 통해 정상 시계열로 만들 수 있다.

: 공분산은 특정 시점이 아닌 시차에 의존한다.

 

자기회귀모형

: 현재의 시계열 자료는 n 개의 이전 시점의 자료들로 설명이 가능하다는 전제로

적절한 n 값을 찾기 위해 PACF 그래프를 활용

 

분해 시계열의 요인

1. 추세요인

2. 순환요인

3. 계절요인

4. 불규칙요인

 

 

'TIL' 카테고리의 다른 글

2024-07-23  (2) 2024.07.23
2024-07-22  (3) 2024.07.22
2024-07-18  (0) 2024.07.18
2024-07-17  (0) 2024.07.17
2024-07-16  (0) 2024.07.16