ADsP 내용 정리

통계분석 - 시계열분석

여연찌 2024. 4. 9. 14:08

시계열 분석

: 일정 시간 간격으로 기록된 자료들에 대하여 특성 파악하고 미래를 예측

* 시계열 자료

: 시간의 흐름에 따라서 관측된 자료

 

시계열 자료의 자기 상관성

: 인접한 자료들과 상호 연관성을 가진다

 

시계열 분석의 자료

: 정상성, 비정상성

* 정상성

: 평균이 일정할 것, 분산이 시점에 의존하지 않을 것

* 비정상성

: 자료의 대부분은 비정상

 

 

시계열 자료의 정상성 조건

① 일정한 평균

② 일정한 분산

③ 시차에만 의존하는 공분산

 

정상 시계열의 특징

: 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 갖는다

: 항상 그 평균값으로 회귀하려는 경향이 있으며, 평균값 주변에서의 변동은 대체로 일정한 폭을 갖는다

: 정상 시계열이 아닌 경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화할 수 없다.

 

 

시계열 분석 기법

이동평균법

: 시간이 지남에 따라 평균 계산에 포함되는 자료가 바뀌기 때문에 이동평균법이라고 한다.

: 변동이 많은 시계열 데이터의 평균을 구함으로써 여러 요인으로 인한 변동을 없앨 수 있다.

: 계절변동과 불규칙 변동을 제거하여 추세변동과 순환 변동만 가진 시계열로 변환하는 방법으로도 사용된다.

: 장기적인 추세를 파악하는데 효율적이나 최근의 자료가 더 많은 정보를 간직한다고 볼 수 없다

: 불규칙변동이 심하지 않은 경우에는 짧은 기간의 평균, 변동이 심한 경우 긴 기간의 평균

: 자료의 수가 많고 안정된 패턴을 보이는 경우 예측의 품질이 높다

 

지수평활법

: 모든 시계열 자료를 사용하여 최근 시계열에 더 많은 가중치를 부여

: 불규칙변동의 영향을 제거할 수 있으므로 중장기 예측에 주로 사용

 

 

시계열 모형

 

자기회귀모형(AR)

: 현재 값이 자기 자신에게 회귀되는 형태

: 과거 시점의 관측 자료들의 선형 결합으로 표현한 모형

: t 라는 시점에서의 값 y_t​는 이전 시점들 n개에 의해 설명될 수 있음을 의미

 

자기상관계수(ACF)

: 시간의 흐름에 따른 자기상관관계

: 시계열 자료가 시간에 의존하지 않고 무작위성을 띠는지 확인하는데 사용

부분자기상관계수(PACF)

: 두 시계열 확률변수 간에 다른 시점의 확률변수 영향력은 통제하고 상관관계만 보여준다

: 확률변수의 상관관계를 알아보려고 할 때 오로지 둘 사이의 상관관계만을 고려할 때 이용

 

이동평균모형(MA)

: 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현

 

자기회귀누적이동평균모형(ARIMA)

: 비정상 시계열 모형이기 때문에 차분이나 변환을 통해 AR모형,MA모형,ARMA 모형으로 정상화

: d는 ARIMA 에서 ARMA로 정상화 할때 몇 번 차분을 했는지를 의미

 

*

차분: 원 시계열 자료와 앞 차시의 시계열 자료를 뺀것

비정상성을 정상성으로 바꾸는 것

 

분해시계열

: 시계열에 영향을 주는 요인을 시계열에서 분리해 분석하는 방법

 

시계열의 구성요소

① 추세요인

: 인구의 증가, 기술의 변화 같은 요인에 의해 장기간 일정한 방향으로 오르내리는 추세, 이차식이나 지수적형태

② 계절요인

: 요일마다 반복되는 주기, 월별, 분기별, 사계절 등 고정적인 주기에 따라 자료의변동이 반복되는 경우, 순환 요인보다 주기가 짧은 것이 특징

③ 순환요인

: 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료

④ 불규칙요인

: 위 3가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인

 

 

 


시계열 분석의 정상성

: 분산이 일정하지 않을 경우 변환을 통해 정상화

: 모든 시점에 대해 일정한 평균

: 공분산은 시차에 의존

 

* 시계열 자료들은 인접한 자료들과 상호 연관성을 가진다

 

자기회귀모형(AR)

자기상관계수(ACF)

부분자기상관계수(PACF)

이동평균모형(MA)

자기회귀누적이동평균모형(ARIMA)

'ADsP 내용 정리' 카테고리의 다른 글

분류분석모형 - 로지스틱회귀분석  (1) 2024.04.19
정형 데이터 마이닝  (0) 2024.04.11
통계분석 - 다변량 분석  (0) 2024.04.09
통계분석 - 회귀분석  (1) 2024.04.09
통계분석 - 기초통계  (0) 2024.04.08