ADsP 내용 정리

통계분석 - 다변량 분석

여연찌 2024. 4. 9. 13:16

다차원척도법(MDS)

: 개체간의 근접성을 시각화 해놓은 그림

: 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여

개체들을 2차원 공간상에 점으로 표현하는 방법

 

다차원 척도법 방법

: stress 값을 통해 적합여부를 판단

: 0에 가까울수록 좋은 것

 

* 뭉쳐져 있을 수록 유사하고 거리가 멀수록 성분이 다르다

 

다차원 척도법 종류

: 계량적 MDS - 구간척도,비율척도, 양적척도, 유클리드 거리행렬, cmdscale

: 비계량적 MDS - 순서척도, 서열척도, isoMDS

 

 

주성분분석

: 여러 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수를 만들어 기존 변수를 요약 및 축소하는 방법

: 통계적 분석을 하는 사전 기초 분석

: 새로운 변수로 생성을 위해서는 자료의 분산이 가장 큰 축을 탐색한다.

 

주성분분석 목적

: 다중공선성이 존재하는 경우 상관성이 없는 주성분으로 변수들을 축소

: 상관 관계가 높은 다중공선성이 존재할 경우 문제가 생긴다

: 연관성이 높은 변수를 축소한 후에 군집분석을 수행하면 군집화 결과와 연산속도를 개선할 수 있다.

 

 

주성분분석 시각화

scree plot 스크리플롯

: 몇개의 주성분분석을 할지 찾을 수 있음

: 수평을 이루기 전 단계를 주성분의 수로 선택할 수 있다.

 

biplot

: 주성분분석의 결과로 데이터가 어떻게 퍼져 있는지 시각화

: 관측치들을 첫 번째와 두번째 주성분의 좌표에 그린 그림

 


다차원 척도법

: 자료들의 상대적 관계를 이해하는 시각화 방법의 근간으로 주로 사용

: 시각화 기법으로 데이터 간의 거리를 표현하여 저차원 공간에 표현하는 것

: 데이터를 축소하는 목적으로 사용

 

주성분의 개수를 결정하는데 영향을 미치는 요소

: 각 주성분이 데이터의 분산을 얼마나 설명하는지에 따라 결정

: 각 주성분의 설명력에 따라 결정

'ADsP 내용 정리' 카테고리의 다른 글

정형 데이터 마이닝  (0) 2024.04.11
통계분석 - 시계열분석  (0) 2024.04.09
통계분석 - 회귀분석  (1) 2024.04.09
통계분석 - 기초통계  (0) 2024.04.08
통계분석 - 통계개요  (1) 2024.04.01