시계열이란 각 숫자가 기록된 시간에 관한 정보가 있는 숫자들의 목록으로 생각할 수 있습니다. R에서는 이러한 정보를 여러분이 과거 몇 년 동안의 연간 관측값을 가지고 있는 상황을 생각해봅시다:
1년에 한 관측값이 있는 연간 데이터를 가지고 있다고 가정했으니, 시작 연도만(또는 마지막 연도만) 있으면 됩니다. 1년에 한 번 이상으로 자주 관측된 값의 경우에는, 단순하게
이 책에서 사용하는 거의 모든 데이터는 이미 시계열의 빈도“빈도(frequency)”는 계절성 패턴이 반복되기 전까지의 관측값의 수입니다.1 R에서
실제로 1년은 \(52\)주가 아니라, 4년마다의 윤년을 고려하여 평균적으로 \(365.25/7 = 52.18\) 입니다. 하지만 관측값의 빈도가 1주일에 한 번보다 클 때는, 빈도(frequency)를 다루는 한 가지 이상의 방법이 있습니다. 예를 들면, 일별 관측값으로 구성된 데이터에는 주별 계절성(빈도=7)이나 연간 계절성(빈도=365.25)이 있을 것입니다. 비슷하게, 1분마다 관측된 데이터에는 시간별 계절성(빈도=60), 일별 계절성(빈도=24x60=1440), 주별 계절성(빈도=24x60x7=10080), 연간 계절성(24x60x365.25=525960) 등이 있을 것입니다. 11 장에서는 이러한 빈도 목록에서 하나를 고르지 않고 다중 계절성(multiple seasonality)을 다루는 방법을 살펴볼 것입니다. 보통 시간 데이터에는 seasonality가 존재하는데 seasonality는 불안정한 데이터를 만드는 중요한 원인이 된다. |