-
PART3. 데이터 분석_4 시계열 분석카테고리 없음 2023. 5. 16. 15:53
3-4.시계열분석
1.시계열 자료란?
시간의 흐름에 따라 관찰된 값들을 시계열 자료라 한다.
미래의 값을 예측하고, 경향, 주기, 계절성 등을 파악할 때 활용한다.
1-1. 시계열 자료의 종류
1)비정상성 시계열 자료
대부분의 시계열 자료에 해당되며 분석하기 어려움
2)정상성 시계열 자료
비정상 시계열을 다루기 쉽게 하기 위해 시계열 자료로 변환한 것
2.정상성
더보기문제1)
시계열의 수준과 분산에 체계적인 변화가 없고 엄밀하게 주기적 변동이 없다는 것으로 미래는 확률적으로 과거와 동일하다는 것을 의미하는 시계열 용어는?
->정상성
문제2)
시계열 분석에서 정상성 기준에 대한 설명 중 적절하지 않은 것은?
->시계열 자료 간에 독립성 조건을 충족한다.
2-1. 평균이 일정한 경우
모든 시점에 대해 일정한 평균을 가진다.
평균이 일정하지 않은 시계열은 차분(Difference)를 통해 정상화 할 수 있다.
*차분 : 현시점 자료에서 전 시점 자료를 빼는 것을 의미
더보기문제3)
자료가 추세를 보이는 경우에는 현 시점의 자료값에서 전 시점의 자료를 빼는 방법을 통해 비정상시계열을 정상 시계열로 바꾸어 준다. 이 방법은 무엇인가?
->차분
2-2.분산이 일정한 경우
분산이 시점에 의존하지 않고 일정해야 한다.
분산이 일정하지 않을 경우 변환(Transformaiton)을 통해 정상화 할 수 있다.
공분산도는 단지 시차에만 의존, 실제 특정 시점 t,s에 의존하지 않는다.
* 정상 시계열 특징
-일정한 평균, 일정한 분산, 공분산은 t가 아닌 s에 의존(시점이 아닌 시차에만 의존)
-정상 시계열은 자기공분산을 측정하더라도 동일한 값을 갖는다.
-정상 시계열은 평균으로 회귀하려는 경향이 있으며, 평균값 주변에서의 변동은 대체로 일정한 폭을 가진다.
-정상 시계열이 아닌 경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화할 수 있음
3. 시계열 모형
1)자기회귀 모형(AR모형, Autoregressive Model)
p시점의 자료가 현재 자료에 영향을 주는 모형이다.AR모형(1): 직전 시점 데이터로만 분석
AR모형(2):연속된 2시점 정도의 데이터로 분석
더보기문제4)
시계열 모형의 여러 종류 중 아래에서 설명하는 것은 무엇인가?가) 시계열 모델 중 자기 자신의 과거 값을 사용하여 설명하는 모형임
나)백색 잡은의 현재값과 자기 자신의 과거값의 선형 가중합으로 이루어진 정상 확률 모형
다)모형에 사용하는 시계열 자료의 시점에 따라 1차,2차,...p차 등을 사용하나 정상시계열 모형에서는 주로 1,2차를 사용함
->자기회귀모형(AR모형)2)이동평균 모형(MA모형, Moving Average Model)
유일한 개수의 백색잡음의 결합이므로 언제나 정상성을 만족
AR모델과 반대로 ACF 절단점을 가지고 있고, PACF가 빠르게 감소
관측값이 아닌 오차를 사용
*백색잡음: 현재 시점이 이전 시점과 상관관계가 존재하지 않으며, 서로 독립적인 시계열 자료
더보기문제5)
시계열 데이터를 조정하여 예측하는 평활법(Smoothing method)에 대한 설명으로 적절하지 않은 것은?
->이동평균법은 시계열자료에서 계절변동과 추세변동을 제거하여
추세변동만 가진 시계열 자료로 변환하는 방법이다.추세변동(x) -> 불규칙변동(o)
3)자기회귀누적이동평균모형(ARIMA(p,d,q)모형)
비정상시계열 모형으로, 차분이나 변환을 통해 AR모형이나 MA모형, 이 둘을 합친 ARMA모형으로 정상화할 수 있다.
p는 AR모형, q는 MA모형과 관련있는 차수이다.
4)분해 시계열
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법을 말하며 회귀분석적인 방법을 주로 사용한다.
더보기문제6)
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법은 무엇인가?
-> 분해 시계열3-1. ARIMA 모델
ARIMA 모델은 정상성 시계열에 한해 사용한다.
비정상 시계열 자료는 차분해 정상성으로 만족하는 조건의 시계열로 바꿔준다.
1)자기상관계수 ACF(Autocorrelation Function)
-시간의 흐름에 따른 자기상관관계(시차에 의존함)
-시차에 따른 관측값간의 연관 정도
*자기상관함수란?
특정 시점 t에서의 값과 t에서 I만큼 시차를 갖는 t+I 시점에서의 값의 상관계수(자기상관계수)를 나타내는 함수
시차 I가 0인 경우 자신과의 상관계수이므로 항상0임
시차가 커질수록 ACF는 0에 가까워짐
일반적으로 시차와 ACF는 반비례 관계를 가짐
2)부분상관계수 PACF(Patial Autocorrelation Function)
-다른 시점의 확률변수 영향력은 통제하고, '상관관계'만 확인 가능
ex) '편의점이 많은 지역은 범죄 발생률이 높다.' 편의점이 많다는 것은 인구분포가 많은 지역이라는 것을 의미
하지만 PACF는 영향을 주는 인구 요소를 제외하고 편의점과 범죄발생률만 가지고 상관계수를 분석하는 것
4.ARIMA 예측 모델