다차원척도법(MDS)
: 개체간의 근접성을 시각화 해놓은 그림
: 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여
개체들을 2차원 공간상에 점으로 표현하는 방법
다차원 척도법 방법
: stress 값을 통해 적합여부를 판단
: 0에 가까울수록 좋은 것
* 뭉쳐져 있을 수록 유사하고 거리가 멀수록 성분이 다르다
다차원 척도법 종류
: 계량적 MDS - 구간척도,비율척도, 양적척도, 유클리드 거리행렬, cmdscale
: 비계량적 MDS - 순서척도, 서열척도, isoMDS
주성분분석
: 여러 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수를 만들어 기존 변수를 요약 및 축소하는 방법
: 통계적 분석을 하는 사전 기초 분석
: 새로운 변수로 생성을 위해서는 자료의 분산이 가장 큰 축을 탐색한다.
주성분분석 목적
: 다중공선성이 존재하는 경우 상관성이 없는 주성분으로 변수들을 축소
: 상관 관계가 높은 다중공선성이 존재할 경우 문제가 생긴다
: 연관성이 높은 변수를 축소한 후에 군집분석을 수행하면 군집화 결과와 연산속도를 개선할 수 있다.
주성분분석 시각화
scree plot 스크리플롯
: 몇개의 주성분분석을 할지 찾을 수 있음
: 수평을 이루기 전 단계를 주성분의 수로 선택할 수 있다.
biplot
: 주성분분석의 결과로 데이터가 어떻게 퍼져 있는지 시각화
: 관측치들을 첫 번째와 두번째 주성분의 좌표에 그린 그림
다차원 척도법
: 자료들의 상대적 관계를 이해하는 시각화 방법의 근간으로 주로 사용
: 시각화 기법으로 데이터 간의 거리를 표현하여 저차원 공간에 표현하는 것
: 데이터를 축소하는 목적으로 사용
주성분의 개수를 결정하는데 영향을 미치는 요소
: 각 주성분이 데이터의 분산을 얼마나 설명하는지에 따라 결정
: 각 주성분의 설명력에 따라 결정
'ADsP 내용 정리' 카테고리의 다른 글
정형 데이터 마이닝 (0) | 2024.04.11 |
---|---|
통계분석 - 시계열분석 (0) | 2024.04.09 |
통계분석 - 회귀분석 (1) | 2024.04.09 |
통계분석 - 기초통계 (0) | 2024.04.08 |
통계분석 - 통계개요 (1) | 2024.04.01 |