基於pytorch的lstm引數使用詳解

阿新 • • 發佈：2020-01-15

lstm(*input,**kwargs)

將多層長短時記憶(LSTM)神經網路應用於輸入序列。

引數：

input_size:輸入'x'中預期特性的數量

hidden_size:隱藏狀態'h'中的特性數量

num_layers:迴圈層的數量。例如，設定' ' num_layers=2 ' '意味著將兩個LSTM堆疊在一起，形成一個'堆疊的LSTM '，第二個LSTM接收第一個LSTM的輸出並計算最終結果。預設值:1

bias:如果' False'，則該層不使用偏置權重' b_ih '和' b_hh '。預設值:'True'

batch_first:如果' 'True ' ',則輸入和輸出張量作為(batch,seq,feature)提供。預設值: 'False'

dropout:如果非零，則在除最後一層外的每個LSTM層的輸出上引入一個“dropout”層，相當於:attr:'dropout'。預設值:0

bidirectional:如果‘True'，則成為雙向LSTM。預設值:'False'

輸入:input，(h_0,c_0)

**input**of shape (seq_len,batch,input_size):包含輸入序列特徵的張量。輸入也可以是一個壓縮的可變長度序列。

see:func:'torch.nn.utils.rnn.pack_padded_sequence' 或:func:'torch.nn.utils.rnn.pack_sequence' 的細節。

**h_0** of shape (num_layers * num_directions,hidden_size):張量包含批處理中每個元素的初始隱藏狀態。

如果RNN是雙向的，num_directions應該是2，否則應該是1。

**c_0** of shape (num_layers * num_directions,hidden_size):張量包含批處理中每個元素的初始單元格狀態。

如果沒有提供' (h_0,c_0) '，則**h_0**和**c_0**都預設為零。

輸出:output，(h_n,c_n)

**output**of shape (seq_len,num_directions * hidden_size) :包含LSTM最後一層輸出特徵' (h_t) '張量，

對於每個t. If a:class: 'torch.nn.utils.rnn.PackedSequence' 已經給出，輸出也將是一個打包序列。

對於未打包的情況，可以使用'output.view(seq_len,num_directions,hidden_size)'，正向和反向分別為方向' 0 '和' 1 '。

同樣，在包裝的情況下，方向可以分開。

**h_n** of shape (num_layers * num_directions,hidden_size):包含' t = seq_len '隱藏狀態的張量。

與*output*類似， the layers可以使用以下命令分隔

h_n.view(num_layers,hidden_size) 對於'c_n'相似

**c_n** (num_layers * num_directions,hidden_size):張量包含' t = seq_len '的單元狀態

所有的權重和偏差都初始化自: where:

include:: cudnn_persistent_rnn.rst

import torch
import torch.nn as nn
 
# 雙向rnn例子
# rnn = nn.RNN(10,20,2)
# input = torch.randn(5,3,10)
# h0 = torch.randn(2,20)
# output,hn = rnn(input,h0)
# print(output.shape,hn.shape)
# torch.Size([5,20]) torch.Size([2,20])
 
# 雙向lstm例子
rnn = nn.LSTM(10,2)   #(input_size,hidden_size,num_layers)
input = torch.randn(5,10)  #(seq_len,input_size)
h0 = torch.randn(2,20)    #(num_layers * num_directions,hidden_size)
c0 = torch.randn(2,hidden_size)
# output:(seq_len,num_directions * hidden_size)
# hn,cn(num_layers * num_directions,hidden_size)
output,(hn,cn) = rnn(input,(h0,c0)) 
 
print(output.shape,hn.shape,cn.shape)
>>>torch.Size([5,20])

以上這篇基於pytorch的lstm引數使用詳解就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

PHP定時備份MySQL與mysqldump語法引數詳解

先來為大家介紹幾個MySQL備份命令mysqldump常用操作例項： 1、mysqldump備份只匯出表結構

MySQL中slave_exec_mode引數詳解

今天無意當中看到引數slave_exec_mode，從手冊裡的說明看出該引數和MySQL複製相關，是可以動態修改的變數，預設是STRICT模式（嚴格模式），可選值有IDEMPOTENT模式（冪等模式）。設定成IDEMPOTENT模式可以讓從庫避免

sklearn-SVC實現與類引數詳解

sklearn-SVC實現與類引數對應的API：http://scikit-learn.sourceforge.net/stable/modules/generated/sklearn.svm.SVC.html

Python函式中的可變長引數詳解

一、Python函式中的引數 1、使用python的函式時，有引數類別，比如位置引數、關鍵字引數、可變長引數

C#實現String字串轉化為SQL語句中的In後接的引數詳解

實現把String字串轉化為In後可用引數程式碼： public string StringToList(string aa) { string bb1 = \"(\";

Webpack中SplitChunksPlugin 配置引數詳解

程式碼分割本身和 webpack 沒有什麼關係，但是由於使用 webpack 可以非常輕鬆地實現程式碼分割，所以提到程式碼分割首先就會想到使用 webopack 實現。

python matplotlib:plt.scatter() 大小和顏色引數詳解

語法 plt.scatter(x,y,s=20,c=\'b\') 大小s預設為20，s=0時點不顯示；顏色c預設為藍色。

scrapy爬蟲:scrapy.FormRequest中formdata引數詳解

1. 背景在網頁爬取的時候，有時候會使用scrapy.FormRequest向目標網站提交資料（表單提交）。參照scrapy官方文件的標準寫法是：

object detection api調參詳解（兼SSD演演算法引數詳解）

一、引言使用谷歌提供的object detection api影象識別框架，我們可以很方便地重新訓練一個預訓練模型，用於自己的具體業務。以我所使用的ssd_mobilenet_v1預訓練模型為例，訓練所需引數都在training資料夾下的ssd_m

阿里雲OSS基於java使用詳解

近幾年，雲圖片伺服器五花八門，越來越多，有騰訊雲，阿里雲，又拍雲，華為雲等等，但是使用了這麼多年，我還是感覺阿里雲圖片伺服器oss比較穩定，訪問速度也比較快，因此我在這裡手把手教給你如何使用阿里雲oss服務

SpringBoot配置檔案application.properties引數詳解

轉自：https://www.jianshu.com/p/a4bb58331107 1 # ---------------------------------------- 2 # CORE PROPERTIES

MySQL配置檔案引數詳解

Windows中是my.ini Linux中是my.cnf #*** client options 相關選項 ***# #以下選項會被MySQL客戶端應用讀取。注意只有MySQL附帶的客戶端應用程式保證可以讀取這段內容。如果你想你自己的MySQL應用程式獲取這些值。

pandas.DataFrame.plot( )引數詳解

使用DataFrame的plot方法繪製圖像會按照資料的每一列繪製一條曲線，預設按照列columns的名稱在適當的位置展示圖例，比matplotlib繪製節省時間，且DataFrame格式的資料更規範，方便向量化及計算。

邏輯迴歸引數詳解

邏輯迴歸方法： class sklearn.linear_model.LogisticRegression(penalty=\'l2\', *, dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver=\'

LinkedHashMap建構函式引數詳解

LinkedHashMap 繼承自 HashMap，所以它的底層仍然是基於拉鍊式雜湊結構。該結構由陣列和連結串列+紅黑樹，在此基礎上LinkedHashMap增加了一條雙向連結串列，保持遍歷順序和插入順序一致的問題。

Vue + Element-ui的下拉框el-select獲取額外引數詳解

直接上程式碼吧~ <el-table-column label=\"使用者型別\" width=\"180\"> <template slot-scope=\"scope\">

SpringBoot - 獲取POST請求引數詳解（附樣例：表單資料、json、陣列、物件）

在前文中我介紹了Controller如何接收通過GET方式傳遞過來的引數（點選檢視），下面接著演示如何接收通過POST方式傳遞過來的引數。

sklearn.svm.SVC 支援向量機引數詳解

用法如下： class sklearn.svm.SVC(*, C=1.0, kernel=\'rbf\', degree=3, gamma=\'scale\', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_it

yolov3引數詳解

前段時間模型訓練出來了，現在需要寫報告了，開啟配置檔案，嗯，一大堆引數：

sklearn.ensemble.RandomForestClassifier 隨機深林引數詳解

隨機森林是一種元估計量，它適合資料集各個子樣本上的許多決策樹分類器，並使用平均數來提高預測準確性和控制過度擬合。子樣本大小由max_samples引數bootstrap=True (default)控制，否則整個資料集用於構建每棵樹

基於pytorch的lstm引數使用詳解

相關推薦