Chapter 7. Resampling and Interpolation
·
Study/time series forecasting with python
Chapter 7에서는 * Time Series Resampling, 두 가지 유형의 Resampling과 이를 사용하는 주요 이유 * Pandas를 사용하여 Time Series Data를 더 높은 빈도로 Up Sampling하고 새로운 관측치를 Interpolation하는 방법 * Pandas를 사용하여 Time Series Data를 더 낮은 빈도로 Down Sampling하고 더 높은 빈도의 관측치를 요약하는 방법에 대해 배운다. Resampling * Two Types of resampling 1. Upsampling : 샘플의 빈도를 증가시키는 것 ex)빈도를 분 -> 초 2. Downsampling : 샘플의 빈도를 줄이는 것 ex)빈도를 일 -> 월 * Time Series Data를 re..
Chapter 6. Data Visualization
·
Study/time series forecasting with python
Chapter 6에서는 * python을 사용하여 Time Series Data를 시각화 하는 데 사용할 수 있는 6가지 유형의 Plots * line plots, lag plots, autocorrelation plots를 사용하여 structure of Time series를 탐색하는 방법 * box-whisker plots, heat map plots를 이용하여 구간에 따른 분포의 변화를 파악하는 방법에 대해 배운다. Time Series Visualization * Visualization은 Time Series analysis and forecasting에 중요한 역할을 한다. * Plots of raw sample data는 model 선택에 영향을 미칠 수 있는 trend, cycles, s..
Chapter 5. Basic Feature Engineering
·
Study/time series forecasting with python
Chapter 5에서는 * feature engineering time series data의 이론적 근거와 목표 * basic date-time 기반으로 input feature을 개발하는 방법 * 더 정교한 지연(lag) 및 sliding window 요약 통계 기능을 개발하는 방법에 대해 배운다. Feature Engineering for Time Series * Time Series dataset은 supervised learning problem으로 변환되어야한다. time 1 value 1 time 2 value 2 time 3 value 3 input 1 output 1 input 2 output 2 input 3 output 3 * 처음 표와 같이 표기된 Time Series는 두번 째 표..
Chapter 4. Load and Explore Time Series Data
·
Study/time series forecasting with python
Chapter 4에서는 * Pandas library를 사용하여 CSV 파일에서 Time Series dataset을 로드하는 방법 * date-times를 사용하여 로드된 data를 보고 요약 통계를 계산하는 방법 * 요약 통계 계산과 리뷰 방법에 대해서 배운다 * 여기서 pandas의 역할은 로드된 data를 보고 dataset을 탐색하고 더 잘 이해하기 위해 사용된다. Daily Female Births Dataset * 여기서는 Daily Female Births Dataset을 사용한다. * https://raw.githubusercontent.com/jbrownlee/Datasets/master/daily-total-female-births.csv * 이 dataset은 위 sample과 같이..
노트북에서 rpi ssh connect ( lan )
·
잡동사니
rpi와 노트북을 랜선으로 연결, 노트북이 잡고 있는 wifi와 공유하는 방식 ( 이더넷 ip 고정 ) 1. 제어판\네트워크 및 인터넷\네트워크 연결 Wifi속성 > 공유 > 다른 네트워크 사용자가 이 컴퓨터의~~ 허용에 체크 아래것도 체크 2. 제어판\네트워크 및 인터넷\네트워크 연결 이더넷 속성 > 인터넷 프로토콜 버전 4(TCP/IPv4)속성 > ip주소를 192.168.137.2로 설정(노트북 내부 ip주소) 서브넷마스크 255.255.255.0 3. sd카드 노트북에 삽입, boot폴더에 cmdline.txt 마지막에 ip=192.168.137.3으로 설정 (할당되지 않은 다른 ip adress사용 가능), 이때 설정된 ip는 pi의 내부 ip adress
Chapter 3. Time Series as Supervised Learning
·
Study/time series forecasting with python
Chapter 3에서는 * Supervised Learning이 무엇이며 어떻게 Machine Learning Algorithms Modeling을 하는지 * Time Series Data를 프레임화하는 Sliding Window 방법과 사용 방법 * Multivariates Data, Multiple Steps forecasting Sliding Window를 사용하는 방법에 대해 배운다. Supervised Machine Learning(지도,지휘 머신러닝) * Supervised Learning : train data로부터 하나의 함수를 유추해내기 위한 Machine Learning Algorithm 입력 변수 x, 출력 변수 y가 존재하고, Algorithm을 통해 입력에서 출력으로의 mappin..
Chapter 2. What is Time Series Forecasting?
·
Study/time series forecasting with python
Chapter 2에서는 * Time Series Forecasting의 정의, 분석 및 예측 * Time Series Forecasting Data에서 고려해야할 중요한 구성요소(Components) * Time Series Forecasting이 활용될 수 있는 범위들에 대한 예제에 대해 배운다. Time Series * Time Series는 일정 시간 간격으로 배치된 data들의 수열을 뜻한다. * 위의 그림과 같이 한 축을 t(시간)에 대해 표현을 할 수 있으면 Time Series이다. 즉, 시간과 관계된 data들을 모아놓은 것을 Time Series라고 한다. * 실제 결과가 미래의 시간에 대한 결과까지 알려져있지 않을 때, 미래의 시간에 대한 결과를 예측하기 위해 사용한다. Time Ser..
Chapter 1. Python Environment
·
Study/time series forecasting with python
Chapter 1에서는 파이썬을 사용하는 이유와 3가지 라이브러리에 대해 배운다. 파이썬을 사용하는 이유 * 파이썬은 가독성을 중점으로 만들어졌으므로 사용하기 쉽다. * 파이썬은 우수한 라이브러리 지원으로 인해 머신러닝, 데이터 과학에서 널리 사용된다. 라이브러리 (Time Series Forecasting과 관련된 주요 기능) * pandas : data 처리 및 관리를 위한 도구를 제공해준다. series를 통해 일변량을 나타낼 수 있다. 또한, dataframe으로 날짜, 시간과 같은 것들을 인덱스로 처리, 관리할 수 있다. * statsmodels : 통계 모델링을 위한 도구를 제공해준다. 이는, 데이터를 시각화할 수 있게 해준다. * scikit-learn : 파이썬에서 머신러닝을 개발하고 연습..
황공진
공진's Repository