Chapter 17. Forecasting Performance Measures
·
Study/time series forecasting with python
Chapter 17에서는 * residual forecast error와 forecast bias를 포함한 forecast performace의 기본 측정 * MAE(mean absolute error)와 같은 방법을 통한 forecast error calculations * MAE 및 RMSE와 같은 널리 사용되는 오차 계산 방법 Forecast Error (or Residual Forecast Error) * forecast error = expected value − predicted value * 0인 값은 error가 없는 것이다. * 따라서, 0에서 멀어지는 값일 수록 좋지 않은 값이다. # calculate forecast error expected = [0.0, 0.5, 0.0, 0.5, ..
Chapter 16. Backtest Forecast Model
·
Study/time series forecasting with python
Chapter 16에서는 * machine learning model을 평가하는 방법의 한계와 sample data에서 model을 평가해야하는 이유 * model 평가를 위해 time series data의 train-test split 및 multiple train-test split을 만드는 방법 * walk-forward 유효성 검사가 time series에 대한 machine learning model의 평가를 제공하는 방법에 대해 배운다. Model Evaluation * time series forecasting을 위해 model을 평가할 때, model training을 하는 데 사용하지 않은 data에 대한 model 성능에 관심이 있다. * 이것을 sample data라고 부른다. * ..
Chapter 15. Stationarity in Time Series Data
·
Study/time series forecasting with python
Chapter 15에서는 * line-plot을 사용하여 stationary 및 non-stationary time series를 식별하는 방법 * 시간에 따른 변화에 대한 평균 및 분산과 같은 요약 통계를 확인하는 방법 * time series가 stationary한 지 확인하기 위해 통계적으로 유의한 테스트를 사용하는 방법에 대해 배운다. Stationary Time Series * stationary하다는 말은 time series가 시간에 의존하지 않는다는 말이다. * time series가 trend, seasonal effect가 없는 경우 stationary하다. * 아래의 예제는 일별 여성 출생수에 대한 dataset이다. # load time series data from pandas i..
Chapter 14. Use and Remove Seasonality
·
Study/time series forecasting with python
Chapter 14에서는 * Time Series의 seasonality 정의 및 machine learning method을 통한 예측에 제공되는 방법 * difference method를 사용하여 season별로 조정된 일일 온도 데이터의 time series 만드는 방법 * seasonal component를 직접 modeling하고 관측치에서 빼는 방법 Seasonality in Time Series * Time Series에는 seasonal variation이 포함될 수 있다. * seasonal variation or seasonality는 시간이 지남에 따라 반복되는 주기이다. Benefits to Machine Learning * Time Series의 seasonal component를..
Chapter 13. Use and Remove Trends
·
Study/time series forecasting with python
Chapter 13에서는 * Time Series에 존재할 수 있는 trend의 중요성과 유형 및 식별 방법 * simple differencing method를 사용하여 trend를 제거하는 방법 * 선형 trend를 modeling하고 판매 Time Series dataset에서 제거하는 방법 Trends in Time Series * trend는 일반적으로 주기적이지 않은 시계열의 체계적인 변화를 말한다. * trend를 파악하고 이해하면 모델 성능 향상에 도움이 된다. * 1. Faster Modeling : 모델 선택 및 평가를 보다 효율적으로 만들 수 있다. * 2. Simpler Problem : 모델링을 단순화하고 모델 성능을 향상시키기 위해 trend를 수정하거나 제거할 수 있다. * 3..
Chapter 12. Decompose Time Series Data
·
Study/time series forecasting with python
Chapter 12에서는 * Time Series decomposition method of analysis(시계열 분해 분석 방법) 및 forecasting에 도움이 될만한 방법 * Python에서 Time Series data를 자동으로 decompose(분해)하는 방법 * addtive and multiplicative time series problem을 decompose하고 결과를 plotting하는 방법에 대해 배운다. Time Series Components * forecasting method를 선택하는 데 Time Series가 Systematic(체계적), Non-Systematic(비체계적)인 구성 요소로 나누는 것은 유용하다. * Systematic : 일관성 또는 반복이 있고 설명..
Chapter 11. A Gentle Introduction to the Random Walk
·
Study/time series forecasting with python
* Chapter 11에서는 * Random Walk가 무엇이며 Python에서 만드는 방법 * Random Walk의 속성을 분석하고 time series가 random walk인지 아닌 지 아는 방법 * Random Walk를 예측하는 방법 Random Series * python에서 기본적으로 randrange()함수를 제공한다. * randrange(n) 함수는 기본적으로 0에서 n사이의 임의의 정수를 생성하는 함수이다. * plot을 통해 보면 이는 time series와 거리가 멀게 느껴지며 random walk는 아니고 단순한 난수들이다. # create and plot a random series from random import seed from random import randrange..
Chapter 10. A Gentle Introduction to White Noise
·
Study/time series forecasting with python
* Chapter 10에서는 * white noise time series의 정의와 그것의 중요한 이유 * time series가 white noise인지 확인하는 방법 * python에서 white noise를 식별하기위한 통계 및 진단 plot에 대해 배운다. What is a White Noise? * Time series는 변수가 독립적이고 평균이 0으로 동일하게 분포된 경우 white noise이다. * 모든 변수는 동일한 분산을 가지며 각 값은 다른 모든 값과 0의 상관관계를 가지면 white noise * 변수가 가우스 분포에서 추출된 경우는 gaussian white noise라고 한다. Why Does it Matter? * 1. 예측 가능성 : time series가 white nois..
황공진
'Study/time series forecasting with python' 카테고리의 글 목록