Chapter 10. A Gentle Introduction to White Noise
·
Study/time series forecasting with python
* Chapter 10에서는 * white noise time series의 정의와 그것의 중요한 이유 * time series가 white noise인지 확인하는 방법 * python에서 white noise를 식별하기위한 통계 및 진단 plot에 대해 배운다. What is a White Noise? * Time series는 변수가 독립적이고 평균이 0으로 동일하게 분포된 경우 white noise이다. * 모든 변수는 동일한 분산을 가지며 각 값은 다른 모든 값과 0의 상관관계를 가지면 white noise * 변수가 가우스 분포에서 추출된 경우는 gaussian white noise라고 한다. Why Does it Matter? * 1. 예측 가능성 : time series가 white nois..
Chapter 9. Moving Average Smoothing
·
Study/time series forecasting with python
Chapter 9에서는 * Moving Average Smoothing의 원리와 data에 대한 기대치 * data 작성 및 feature enginerring을 위한 Moving Average Smoothing 사용방법 * Moving Average Smoothing을 이용하여 예측하는 방법에 대해 배운다. Monving Average Smoothing * Moving Average을 계산하려면 값이 원래 시계열의 원시 관측 값 평균으로 구성된 새 시리즈를 생성해야합니다. * Moving Average을 사용하려면 창 너비라는 창 크기를 지정해야합니다. * Moving Average의 목표는 노이즈를 제거하고 근본적인 인과 과정의 신호를 더 잘 노출 시키는 것이다. * 이 기법을 적절하게 적용하면 근본..
Chapter 8. Power Transforms
·
Study/time series forecasting with python
Chapter 8에서는 * 제곱근 변환의 사용 시기 및 탐색 방법을 식별하는 방법 * 로그 변환의 사용 시기 및 탐색 방법 및 원시 데이터에 대한 기대 사항 * Box-Cox 변환을 사용하여 제곱근, 로그 작업을 수행하고 dataset에 가장 적합한 변환을 자동으로 찾는 방법 * 에 대해 배운다. Airline Passengers Dataset * Airline Passengers dataset은 시간 경과에 따른 총 항공사 승객 수에 대한 Time Series이다. # load and plot a time series from pandas import read_csv from matplotlib import pyplot series = read_csv('airline-passengers.csv', he..
Chapter 7. 추가 내용
·
Study/time series forecasting with python
우선 Upsampling 예제코드를 보면, # upsample to daily intervals with spline interpolation from pandas import read_csv from pandas import datetime from matplotlib import pyplot def parser(x): return datetime.strptime('190'+x, '%Y-%m') series = read_csv('shampoo-sales.csv', header=0, index_col=0, parse_dates=True, squeeze=True, date_parser=parser) upsampled = series.resample('D').mean() interpolated = upsam..
Chapter 7. Resampling and Interpolation
·
Study/time series forecasting with python
Chapter 7에서는 * Time Series Resampling, 두 가지 유형의 Resampling과 이를 사용하는 주요 이유 * Pandas를 사용하여 Time Series Data를 더 높은 빈도로 Up Sampling하고 새로운 관측치를 Interpolation하는 방법 * Pandas를 사용하여 Time Series Data를 더 낮은 빈도로 Down Sampling하고 더 높은 빈도의 관측치를 요약하는 방법에 대해 배운다. Resampling * Two Types of resampling 1. Upsampling : 샘플의 빈도를 증가시키는 것 ex)빈도를 분 -> 초 2. Downsampling : 샘플의 빈도를 줄이는 것 ex)빈도를 일 -> 월 * Time Series Data를 re..
Chapter 6. Data Visualization
·
Study/time series forecasting with python
Chapter 6에서는 * python을 사용하여 Time Series Data를 시각화 하는 데 사용할 수 있는 6가지 유형의 Plots * line plots, lag plots, autocorrelation plots를 사용하여 structure of Time series를 탐색하는 방법 * box-whisker plots, heat map plots를 이용하여 구간에 따른 분포의 변화를 파악하는 방법에 대해 배운다. Time Series Visualization * Visualization은 Time Series analysis and forecasting에 중요한 역할을 한다. * Plots of raw sample data는 model 선택에 영향을 미칠 수 있는 trend, cycles, s..
Chapter 5. Basic Feature Engineering
·
Study/time series forecasting with python
Chapter 5에서는 * feature engineering time series data의 이론적 근거와 목표 * basic date-time 기반으로 input feature을 개발하는 방법 * 더 정교한 지연(lag) 및 sliding window 요약 통계 기능을 개발하는 방법에 대해 배운다. Feature Engineering for Time Series * Time Series dataset은 supervised learning problem으로 변환되어야한다. time 1 value 1 time 2 value 2 time 3 value 3 input 1 output 1 input 2 output 2 input 3 output 3 * 처음 표와 같이 표기된 Time Series는 두번 째 표..
Chapter 4. Load and Explore Time Series Data
·
Study/time series forecasting with python
Chapter 4에서는 * Pandas library를 사용하여 CSV 파일에서 Time Series dataset을 로드하는 방법 * date-times를 사용하여 로드된 data를 보고 요약 통계를 계산하는 방법 * 요약 통계 계산과 리뷰 방법에 대해서 배운다 * 여기서 pandas의 역할은 로드된 data를 보고 dataset을 탐색하고 더 잘 이해하기 위해 사용된다. Daily Female Births Dataset * 여기서는 Daily Female Births Dataset을 사용한다. * https://raw.githubusercontent.com/jbrownlee/Datasets/master/daily-total-female-births.csv * 이 dataset은 위 sample과 같이..
황공진
'Study' 카테고리의 글 목록 (3 Page)