淺談keras儲存模型中的save()和save_weights()區別

阿新 • • 發佈：2020-05-22

今天做了一個關於keras儲存模型的實驗，希望有助於大家瞭解keras儲存模型的區別。

我們知道keras的模型一般儲存為字尾名為h5的檔案，比如final_model.h5。同樣是h5檔案用save()和save_weight()儲存效果是不一樣的。

我們用宇宙最通用的資料集MNIST來做這個實驗，首先設計一個兩層全連線網路：

inputs = Input(shape=(784,))
x = Dense(64,activation='relu')(inputs)
x = Dense(64,activation='relu')(x)
y = Dense(10,activation='softmax')(x)
 
model = Model(inputs=inputs,outputs=y)

然後，匯入MNIST資料訓練，分別用兩種方式儲存模型，在這裡我還把未訓練的模型也儲存下來，如下：

from keras.models import Model
from keras.layers import Input,Dense
from keras.datasets import mnist
from keras.utils import np_utils
 
(x_train,y_train),(x_test,y_test) = mnist.load_data()
x_train=x_train.reshape(x_train.shape[0],-1)/255.0
x_test=x_test.reshape(x_test.shape[0],-1)/255.0
y_train=np_utils.to_categorical(y_train,num_classes=10)
y_test=np_utils.to_categorical(y_test,num_classes=10)
 
inputs = Input(shape=(784,outputs=y)
 
model.save('m1.h5')
model.summary()
model.compile(loss='categorical_crossentropy',optimizer='sgd',metrics=['accuracy'])
model.fit(x_train,y_train,batch_size=32,epochs=10)
#loss,accuracy=model.evaluate(x_test,y_test)
 
model.save('m2.h5')
model.save_weights('m3.h5')

如上可見，我一共儲存了m1.h5,m2.h5,m3.h5 這三個h5檔案。那麼，我們來看看這三個玩意兒有什麼區別。首先，看看大小：

淺談keras儲存模型中的save()和save_weights()區別

m2表示save()儲存的模型結果，它既保持了模型的圖結構，又儲存了模型的引數。所以它的size最大的。

m1表示save()儲存的訓練前的模型結果，它儲存了模型的圖結構，但應該沒有儲存模型的初始化引數，所以它的size要比m2小很多。

m3表示save_weights()儲存的模型結果，它只儲存了模型的引數，但並沒有儲存模型的圖結構。所以它的size也要比m2小很多。

通過視覺化工具，我們發現：（開啟m1和m2均可以顯示出以下結構）

淺談keras儲存模型中的save()和save_weights()區別

而開啟m3的時候，視覺化工具報錯了。由此可以論證， save_weights()是不含有模型結構資訊的。

載入模型

兩種不同方法儲存的模型檔案也需要用不同的載入方法。

from keras.models import load_model
 
model = load_model('m1.h5')
#model = load_model('m2.h5')
#model = load_model('m3.h5')
model.summary()

只有載入m3.h5的時候，這段程式碼才會報錯。其他輸出如下：

淺談keras儲存模型中的save()和save_weights()區別

可見，由save()儲存下來的h5檔案才可以直接通過load_model()開啟！

那麼，我們儲存下來的引數(m3.h5)該怎麼開啟呢？

這就稍微複雜一點了，因為m3不含有模型結構資訊，所以我們需要把模型結構再描述一遍才可以載入m3，如下：

from keras.models import Model
from keras.layers import Input,Dense
 
inputs = Input(shape=(784,outputs=y)
model.load_weights('m3.h5')

以上把m3換成m1和m2也是沒有問題的！可見，save()儲存的模型除了佔用記憶體大一點以外，其他的優點太明顯了。所以，在不怎麼缺硬碟空間的情況下，還是建議大家多用save()來存。

注意！如果要load_weights()，必須保證你描述的有引數計算結構與h5檔案中完全一致！什麼叫有引數計算結構呢？就是有引數坑，直接填進去就行了。我們把上面的非引數結構換了一下，發現h5檔案依然可以載入成功，比如將softmax換成relu，依然不影響載入。

對於keras的save()和save_weights()，完全沒問題了吧

以上這篇淺談keras儲存模型中的save()和save_weights()區別就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

淺談keras儲存模型中的save()和save_weights()區別

今天做了一個關於keras儲存模型的實驗，希望有助於大家瞭解keras儲存模型的區別。

淺談Keras引數 input_shape、input_dim和input_length用法

在keras中，資料是以張量的形式表示的，不考慮動態特性，僅考慮shape的時候，可以把張量用類似矩陣的方式來理解。

淺談keras中的目標函式和優化函式MSE用法

mean_squared_error / mse 均方誤差，常用的目標函式，公式為((y_pred-y_true)**2).mean() model = Sequential()

淺談keras中的batch_dot,dot方法和TensorFlow的matmul

概述在使用keras中的keras.backend.batch_dot和tf.matmul實現功能其實是一樣的智慧矩陣乘法，比如A,B,C,D,E,F,G,H，I,J,K,L都是二維矩陣，中間點表示矩陣乘法，AG 表示矩陣A 和G 矩陣乘法（A 的列維度等於G 行維度）

淺談Keras中shuffle和validation_split的順序

模型的fit函式有兩個引數，shuffle用於將資料打亂，validation_split用於在沒有提供驗證集的時候，按一定比例從訓練集中取出一部分作為驗證集

淺談keras使用預訓練模型vgg16分類,損失和準確度不變

問題keras使用預訓練模型vgg16分類，損失和準確度不變。細節：使用keras訓練一個兩類資料，正負比例1：3，在vgg16後添加了幾個全連結並初始化了。並且對所有層都允許訓練。

淺談keras的深度模型訓練過程及結果記錄方式

記錄訓練過程 history=model.fit(X_train,Y_train,epochs=epochs,batch_size=batch_size,validation_split=0.1)

淺談keras中的Merge層(實現層的相加、相減、相乘例項)

【題目】keras中的Merge層（實現層的相加、相減、相乘）詳情請參考： Merge層一、層相加

淺談keras中自定義二分類任務評價指標metrics的方法以及程式碼

對於二分類任務，keras現有的評價指標只有binary_accuracy，即二分類準確率，但是評估模型的效能有時需要一些其他的評價指標，例如精確率，召回率，F1-score等等，因此需要使用keras提供的自定義評價函式功能構建出針

淺談keras通過model.fit_generator訓練模型(節省記憶體)

前言前段時間在訓練模型的時候，發現當訓練集的數量過大，並且輸入的圖片維度過大時，很容易就超記憶體了，舉個簡單例子，如果我們有20000個樣本，輸入圖片的維度是224x224x3，用float32儲存，那麼如果我們一次性將

淺談keras中loss與val_loss的關係

loss函式如何接受輸入值 keras封裝的比較厲害，官網給的例子寫的雲裡霧裡，在stackoverflow找到了答案

淺談keras 模型用於預測時的注意事項

為什麼訓練誤差比測試誤差高很多？一個Keras的模型有兩個模式：訓練模式和測試模式。一些正則機制，如Dropout，L1/L2正則項在測試模式下將不被啟用。

淺談keras中的後端backend及其相關函式(K.prod,K.cast)

一、K.prod prod keras.backend.prod(x,axis=None,keepdims=False) 功能：在某一指定軸，計算張量中的值的乘積。

淺談keras中的keras.utils.to_categorical用法

如下所示： to_categorical(y,num_classes=None,dtype=\'float32\') 將整型標籤轉為onehot。y為int陣列，num_classes為標籤類別總數，大於max(y)（標籤從0開始的）。

淺談keras中Dropout在預測過程中是否仍要起作用

因為需要，要重寫訓練好的keras模型，雖然只具備預測功能，但是發現還是有很多坑要趟過。其中Dropout這個坑，我記憶猶新。

淺談web伺服器專案中靜態請求和動態請求處理

注：完整專案下載在處理了核心任務之後，我們會發現有些請求並不是都是靜態的，那麼我們就需要進行實現處理動態請求的要求，如下面程式碼是我們請求的解決方式，我們只需在HttpRequestImpl實現類中，將如下程式碼實

淺談Vuex的this.$store.commit和在Vue專案中引用公共方法

1、在Vue專案中引用公共方法作為一個新人小白，在使用vue的過程中，難免會遇到很多的問題，比如某個方法在很多元件中都能用的上，如果在每個元件上都去引用一次的話，會比較麻煩，增加程式碼量。怎麼做比較好呢，話

淺談前端儲存之 cookie、localStorage、sessionStorage 和 indexedDB

在開發過程中，我們難免會遇到 token 儲存、程式碼快取、圖片儲存等，以及其它一些可能存在的前端儲存問題。

淺談vue3在專案中的邏輯抽離和欄位顯示

目錄邏輯分層將各個區域業務分開這樣做的優勢這樣的場景應該如何處理優化reactive 不一定非要寫在setup函式中如何在頁面上直接顯示值邏輯分層

淺談PyQt5中非同步重新整理UI和Python多執行緒總結

目前任務需要做一個介面程式，PyQt是非常方便的選擇，QT豐富的控制元件以及python方便的程式設計。近期遇到介面中執行一些後臺任務時介面卡死的情況，解決了在這裡記錄下。

淺談keras儲存模型中的save()和save_weights()區別

相關推薦