1. 程式人生 > >Python時間序列LSTM預測系列學習筆記(7)-多變數

Python時間序列LSTM預測系列學習筆記(7)-多變數

本文是對:

https://machinelearningmastery.com/multivariate-time-series-forecasting-lstms-keras/

https://blog.csdn.net/iyangdi/article/details/77877410

兩篇博文的學習筆記,兩個博主筆風都很浪,有些細節一筆帶過,本人以謙遜的態度進行了學習和整理,筆記內容都在程式碼的註釋中。有不清楚的可以去原博主文中檢視。

資料集下載:https://raw.githubusercontent.com/jbrownlee/Datasets/master/pollution.csv

後期我會補上我的github

從這節開始,開始學習多變數的LSTM預測

把資料先下載下來,預處理一下, 用影象把資料顯示出來

1、下載下載的資料刪掉沒有用的列,把每一列都重新命名

# coding=utf-8

from pandas import read_csv
from pandas import datetime


def parser(x):
    return datetime.strptime(x, '%Y %m %d %H')

#載入資料
dataset = read_csv('data_set/air_pollution.csv', parse_dates=[['year', 'month', 'day', 'hour']], index_col=0,
                   date_parser=parser)
# axis=1,表示刪除列;inplace=True,直接在原DataFrame上執行刪除
dataset.drop('No', axis=1, inplace=True)

# 手動設定每一列的label
dataset.columns = ['pollution', 'dew', 'temp', 'press', 'wnd_dir', 'wnd_spd', 'snow', 'rain']
dataset.index.name = 'date'
# 將NA替換為0
dataset['pollution'].fillna(0, inplace=True)
# 刪除最開始的24條資料
dataset = dataset[24:]
print (dataset.head())

# 儲存處理後資料
dataset.to_csv('data_set/air_pollution_new.csv')

 

2、把處理後的資料用matplotlib畫出來觀賞觀賞

# coding=utf-8
# 輸出資料曲線
# ------------
from pandas import read_csv
from matplotlib import pyplot

dataset = read_csv('data_set/air_pollution_new.csv', header=0, index_col=0)
values = dataset.values

# 需要輸出的列,建立一個數組,[0,1,2,3,4,5,6,7]
groups = [i for i in range(8)]
groups.remove(4)  # 刪除陣列中的值4,因為第四列是字串,刪除後的陣列是[0,1,2,3,5,6,7]

i = 1
# 輸出列曲線圖
pyplot.figure()
#迴圈畫出values的每一列資料
for group in groups:
    pyplot.subplot(len(groups), 1, i)  # 建立len(gourps)行,1列的子圖,表示在第i個子圖畫圖
    pyplot.plot(values[:, group])#畫出values中第group列的資料
    pyplot.title(dataset.columns[group], y=0.5, loc='right')
    i += 1
pyplot.show()