Chapter 2에서는
* Time Series Forecasting의 정의, 분석 및 예측
* Time Series Forecasting Data에서 고려해야할 중요한 구성요소(Components)
* Time Series Forecasting이 활용될 수 있는 범위들에 대한 예제에 대해 배운다.
Time Series
* Time Series는 일정 시간 간격으로 배치된 data들의 수열을 뜻한다.
* 위의 그림과 같이 한 축을 t(시간)에 대해 표현을 할 수 있으면 Time Series이다. 즉, 시간과 관계된 data들을 모아놓은 것을 Time Series라고 한다.
* 실제 결과가 미래의 시간에 대한 결과까지 알려져있지 않을 때, 미래의 시간에 대한 결과를 예측하기 위해 사용한다.
Time Series Nomenclature
* 현재 시간=t, 이전 시간=t-1, 다음 시간=t+1로 표기하며 이에 대한 관측치(결과값)은 obs(t), obs(t-1), obs(t+1)
* 이전 시간에 대해 lag라는 표기법도 사용하며, ex) lag=10은 t-10을 뜻한다. (지연 시간이라고도 부름)
* 통들어서, t-n은 n시간만큼 지연, t는 현재 시간(기준점), t+n은 미래 시간또는 예측 시간이라고 한다.
Describing vs Predicting (설명 vs 예측)
* 목표는 dataset을 이해하는 데 관심이 있는가, 예측을 하는 데 관심이 있는가에 따라 달라진다.
* Time Series Analysis를 통해 dataset을 이해하면 더 나은 예측을 하는 데 도움이 되지만 필수는 아니다.
* Time Series Analysis에서 Time Series는 Seasonal patterns, Trend, Relation to external factors 등의 관점에서 성분을 결정하기 위해 모델링한다.
* Time Series Forecasting은 Time Series의 정보를 사용하여 해당 Time Series의 미래 값을 예측한다.
Time Series Analysis
* Time Series Analysis의 주요 목표는 표본 data를 잘 표현하는 (타당한 설명을 제공하는) 수학적 모델을 개발하는 것이다.
* 통계를 사용할 때 Time Series Analysis가 주관심사가 된다.
Time Series Forecasting
* Time Series Forecasting의 주요 목표는 표본 data를 활용하여 미래 값을 예측하는 것이다.
* Time Series Data를 통해 통계 처리에서 미래에 대한 예측을 외삽 (extrapolation) 이라고 부른다.
* 외삽이란 ? 보간의 두 값을 알고 있는 상태에서 두 점을 포함하는 범위의 바깥에 있는 값을 구하기 위하여 구간 밖에서 함수를 추정하는 일
* Forecating에서 중요한 점은 이미 발생한 상황으로만(확실한 값으로만) 미래를 추정해야한다는 것이다.
Components of Time Series
* Level : 만약 직선일 때, Series의 기준값
* Trend : 시간이 흐름에 따라 series의 변동성 (일반적으로 선형 증가or감소)
* Seasonality : 반복 패턴 또는 시간 흐름에 따른 동작 주기
* Noise : 모델로 설명할 수 없는 관측치의 선택적인 변동성
* 모든 Time Series는 Level이 존재, 대부분은 Noise 존재, Trend와 Seasonality는 선택사항
Examples of Time Series Forecasting
* 매년 주별 옥수수 수확량을 톤 단위로 예측합니다.
* 초 단위의 EEG 추적이 환자가 발작을하고 있는지 여부를 나타내는 지 예측합니다.
* 매일 주식의 종가를 예측합니다.
* 매년 한 도시의 모든 병원에서 출생률을 예측합니다.
* 상점에서 매일 판매되는 단위로 제품 판매를 예측합니다.
* 매일 기차역을 통해 승객 수를 예측합니다.
* 분기마다주의 실업률을 예측합니다.
* 매시간 서버의 활용 수요를 예측합니다.
* 각 번식기의 주에서 토끼 개체수를 예측합니다.
* 매일 도시에서 휘발유의 평균 가격을 예측합니다.
* 즉, data와 시간이 연관이 되어있으면 Time Series Forecasting 가능하다.
'Study > time series forecasting with python' 카테고리의 다른 글
Chapter 6. Data Visualization (0) | 2021.05.27 |
---|---|
Chapter 5. Basic Feature Engineering (0) | 2021.05.20 |
Chapter 4. Load and Explore Time Series Data (0) | 2021.05.19 |
Chapter 3. Time Series as Supervised Learning (0) | 2021.05.13 |
Chapter 1. Python Environment (0) | 2021.05.13 |