시계열 분석
: 일정 시간 간격으로 기록된 자료들에 대하여 특성 파악하고 미래를 예측
* 시계열 자료
: 시간의 흐름에 따라서 관측된 자료
시계열 자료의 자기 상관성
: 인접한 자료들과 상호 연관성을 가진다
시계열 분석의 자료
: 정상성, 비정상성
* 정상성
: 평균이 일정할 것, 분산이 시점에 의존하지 않을 것
* 비정상성
: 자료의 대부분은 비정상
시계열 자료의 정상성 조건
① 일정한 평균
② 일정한 분산
③ 시차에만 의존하는 공분산
정상 시계열의 특징
: 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 갖는다
: 항상 그 평균값으로 회귀하려는 경향이 있으며, 평균값 주변에서의 변동은 대체로 일정한 폭을 갖는다
: 정상 시계열이 아닌 경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화할 수 없다.
시계열 분석 기법
이동평균법
: 시간이 지남에 따라 평균 계산에 포함되는 자료가 바뀌기 때문에 이동평균법이라고 한다.
: 변동이 많은 시계열 데이터의 평균을 구함으로써 여러 요인으로 인한 변동을 없앨 수 있다.
: 계절변동과 불규칙 변동을 제거하여 추세변동과 순환 변동만 가진 시계열로 변환하는 방법으로도 사용된다.
: 장기적인 추세를 파악하는데 효율적이나 최근의 자료가 더 많은 정보를 간직한다고 볼 수 없다
: 불규칙변동이 심하지 않은 경우에는 짧은 기간의 평균, 변동이 심한 경우 긴 기간의 평균
: 자료의 수가 많고 안정된 패턴을 보이는 경우 예측의 품질이 높다
지수평활법
: 모든 시계열 자료를 사용하여 최근 시계열에 더 많은 가중치를 부여
: 불규칙변동의 영향을 제거할 수 있으므로 중장기 예측에 주로 사용
시계열 모형
자기회귀모형(AR)
: 현재 값이 자기 자신에게 회귀되는 형태
: 과거 시점의 관측 자료들의 선형 결합으로 표현한 모형
: t 라는 시점에서의 값 y_t는 이전 시점들 n개에 의해 설명될 수 있음을 의미
자기상관계수(ACF)
: 시간의 흐름에 따른 자기상관관계
: 시계열 자료가 시간에 의존하지 않고 무작위성을 띠는지 확인하는데 사용
부분자기상관계수(PACF)
: 두 시계열 확률변수 간에 다른 시점의 확률변수 영향력은 통제하고 상관관계만 보여준다
: 확률변수의 상관관계를 알아보려고 할 때 오로지 둘 사이의 상관관계만을 고려할 때 이용
이동평균모형(MA)
: 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현
자기회귀누적이동평균모형(ARIMA)
: 비정상 시계열 모형이기 때문에 차분이나 변환을 통해 AR모형,MA모형,ARMA 모형으로 정상화
: d는 ARIMA 에서 ARMA로 정상화 할때 몇 번 차분을 했는지를 의미
*
차분: 원 시계열 자료와 앞 차시의 시계열 자료를 뺀것
비정상성을 정상성으로 바꾸는 것
분해시계열
: 시계열에 영향을 주는 요인을 시계열에서 분리해 분석하는 방법
시계열의 구성요소
① 추세요인
: 인구의 증가, 기술의 변화 같은 요인에 의해 장기간 일정한 방향으로 오르내리는 추세, 이차식이나 지수적형태
② 계절요인
: 요일마다 반복되는 주기, 월별, 분기별, 사계절 등 고정적인 주기에 따라 자료의변동이 반복되는 경우, 순환 요인보다 주기가 짧은 것이 특징
③ 순환요인
: 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료
④ 불규칙요인
: 위 3가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인
시계열 분석의 정상성
: 분산이 일정하지 않을 경우 변환을 통해 정상화
: 모든 시점에 대해 일정한 평균
: 공분산은 시차에 의존
* 시계열 자료들은 인접한 자료들과 상호 연관성을 가진다
자기회귀모형(AR)
자기상관계수(ACF)
부분자기상관계수(PACF)
이동평균모형(MA)
자기회귀누적이동평균모형(ARIMA)
'ADsP 내용 정리' 카테고리의 다른 글
분류분석모형 - 로지스틱회귀분석 (1) | 2024.04.19 |
---|---|
정형 데이터 마이닝 (0) | 2024.04.11 |
통계분석 - 다변량 분석 (0) | 2024.04.09 |
통계분석 - 회귀분석 (1) | 2024.04.09 |
통계분석 - 기초통계 (0) | 2024.04.08 |