1. 程式人生 > 程式設計 >Keras預訓練的ImageNet模型實現分類操作

Keras預訓練的ImageNet模型實現分類操作

本文主要介紹通過預訓練的ImageNet模型實現影象分類,主要使用到的網路結構有:VGG16、InceptionV3、ResNet50、MobileNet。

程式碼:

import keras
import numpy as np
from keras.applications import vgg16,inception_v3,resnet50,mobilenet
 
# 載入模型
vgg_model = vgg16.VGG16(weights='imagenet')
inception_model = inception_v3.InceptionV3(weights='imagenet')
resnet_model = resnet50.ResNet50(weights='imagenet')
mobilenet_model = mobilenet.MobileNet(weights='imagenet')
 
# 匯入所需的影象預處理模組
from keras.preprocessing.image import load_img
from keras.preprocessing.image import img_to_array
from keras.applications.imagenet_utils import decode_predictions
import matplotlib.pyplot as plt
%matplotlib inline
 
filename= 'images/cat.jpg'
 
# 將圖片輸入到網路之前執行預處理
'''
1、載入影象,load_img
2、將影象從PIL格式轉換為Numpy格式,image_to_array
3、將影象形成批次,Numpy的expand_dims
'''
# 以PIL格式載入影象
original = load_img(filename,target_size=(224,224))
print('PIL image size',original.size)
plt.imshow(original)
plt.show()
 
# 將輸入影象從PIL格式轉換為Numpy格式
# In PIL-- 影象為(width,height,channel)
# In Numpy——影象為(height,width,channel)
numpy_image = img_to_array(original)
plt.imshow(np.uint8(numpy_image))
plt.show()
print('numpy array size',numpy_image.size)
 
# 將影象/影象轉換為批量格式
# expand_dims將為特定軸上的資料新增額外的維度
# 網路的輸入矩陣具有形式(批量大小,高度,寬度,通道)
# 因此,將額外的維度新增到軸0。
image_batch = np.expand_dims(numpy_image,axis=0)
print('image batch size',image_batch.shape)
plt.imshow(np.uint8(image_batch[0]))
 
# 使用各種網路進行預測
# 通過從批處理中的影象的每個通道中減去平均值來預處理輸入。 
# 平均值是通過從ImageNet獲得的所有影象的R,G,B畫素的平均值獲得的三個元素的陣列
# 獲得每個類的發生概率
# 將概率轉換為人類可讀的標籤
# VGG16 網路模型
# 對輸入到VGG模型的影象進行預處理
processed_image = vgg16.preprocess_input(image_batch.copy())
 
# 獲取預測得到的屬於各個類別的概率
predictions = vgg_model.predict(processed_image)
# 輸出預測值
# 將預測概率轉換為類別標籤
# 預設情況下將得到最有可能的五種類別
label_vgg = decode_predictions(predictions)
label_vgg
 
# ResNet50網路模型
# 對輸入到ResNet50模型的影象進行預處理
processed_image = resnet50.preprocess_input(image_batch.copy())
 
# 獲取預測得到的屬於各個類別的概率
predictions = resnet_model.predict(processed_image)
 
# 將概率轉換為類標籤
# 如果要檢視前3個預測,可以使用top引數指定它
label_resnet = decode_predictions(predictions,top=3)
label_resnet
 
# MobileNet網路結構
# 對輸入到MobileNet模型的影象進行預處理
processed_image = mobilenet.preprocess_input(image_batch.copy())
 
# 獲取預測得到屬於各個類別的概率
predictions = mobilenet_model.predict(processed_image)
 
# 將概率轉換為類標籤
label_mobilnet = decode_predictions(predictions)
label_mobilnet
 
# InceptionV3網路結構
# 初始網路的輸入大小與其他網路不同。 它接受大小的輸入(299,299)。
# 因此,根據它載入具有目標尺寸的影象。
# 載入影象為PIL格式
original = load_img(filename,target_size=(299,299))
 
# 將PIL格式的影象轉換為Numpy陣列
numpy_image = img_to_array(original)
 
# 根據批量大小重塑資料
image_batch = np.expand_dims(numpy_image,axis=0)
 
# 將輸入影象轉換為InceptionV3所能接受的格式
processed_image = inception_v3.preprocess_input(image_batch.copy())
 
# 獲取預測得到的屬於各個類別的概率
predictions = inception_model.predict(processed_image)
 
# 將概率轉換為類標籤
label_inception = decode_predictions(predictions)
label_inception
 
import cv2
numpy_image = np.uint8(img_to_array(original)).copy()
numpy_image = cv2.resize(numpy_image,(900,900))
 
cv2.putText(numpy_image,"VGG16: {},{:.2f}".format(label_vgg[0][0][1],label_vgg[0][0][2]),(350,40),cv2.FONT_HERSHEY_SIMPLEX,1,(255,0),3)
cv2.putText(numpy_image,"MobileNet: {},{:.2f}".format(label_mobilenet[0][0][1],label_mobilenet[0][0][2]),75),"Inception: {},{:.2f}".format(label_inception[0][0][1],label_inception[0][0][2]),110),"ResNet50: {},{:.2f}".format(label_resnet[0][0][1],label_resnet[0][0][2]),145),3)
numpy_image = cv2.resize(numpy_image,(700,700))
cv2.imwrite("images/{}_output.jpg".format(filename.split('/')[-1].split('.')[0]),cv2.cvtColor(numpy_image,cv2.COLOR_RGB2BGR))
 
plt.figure(figsize=[10,10])
plt.imshow(numpy_image)
plt.axis('off')

訓練資料:

Keras預訓練的ImageNet模型實現分類操作

執行結果:

Keras預訓練的ImageNet模型實現分類操作

以上這篇Keras預訓練的ImageNet模型實現分類操作就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。