【入門】Pytorch實現簡單的圖片分類器

阿新 • • 發佈：2021-04-30

系列文章目錄

【入門】GPU訓練圖片分類器

文章目錄

系列文章目錄
前言
匯入庫
資料歸一化
檢視訓練集
構造網路
定義損失函式和優化器
開始訓練
檢視分類效果
檢視每個類別的準確度
使用你的GPU訓練
優化

前言

本文很適合一些想要入門機器視覺的小夥伴。本實驗推薦在Juypter Notebook上執行。
我們將按次序做如下步驟：

使用torchvision載入並且歸一化CIFAR10的訓練和測試資料集
定義一個卷積神經網路
定義一個損失函式
在訓練集上訓練模型
在測試集上測試模型

匯入庫

使用torchvision載入並歸一化資料集。

import torch
import 
 torchvision
import torchvision.transforms as transforms

資料歸一化

torchvision資料集的輸出範圍是[0,1]，我們將他們歸一化至[-1,1]

tranform = transforms.Compose([transform.ToTensor(),transform.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])
trainset = torchvision.datasets.CIFAR10(root='./data',train = True,download=True,transform = transform) 

trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,shuffle=True, num_workers=2)
testset = torchvision.datasets.CIFAR10(root='./data', train=False,download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,shuffle=False, num_workers=2)
classes = ('plane' 
, 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

下載完成會有如下輸出：
在這裡插入圖片描述

檢視訓練集

# 展示其中的一些訓練圖片
import matplotlib.pyplot as plt
import numpy as np
# functions to show an image
def imshow(img):
    img = img / 2 + 0.5 # unnormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()
    
# get some random training images
dataiter = iter(trainloader)
images, labels = dataiter.next()
# show images
imshow(torchvision.utils.make_grid(images))
# print labels
print(' '.join('%5s' % classes[labels[j]] for j in range(4)))

torchvision.utils.make_grid(images)：將多張圖片拼成一張圖片，在展示資料時很有用。

圖片展示：
在這裡插入圖片描述

構造網路

定義一個卷積神經網路

import torch.nn as nn 
import torch.nn.functional as F
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3,6,5)
        self.pool = nn.MaxPool2d(2,2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)
            
    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
        
net = Net()

nn.Conv2d(3,6,5)表示輸入的圖片是3個通道(in_channel)，輸出的是6個通道(out_channel)，卷積核大小kernel.size等於5
nn.Conv2d(6, 16, 5)同理。
想檢視網路結構的話，可以輸出net康康。

print(net)

定義損失函式和優化器

使用分類交叉熵Cross-Enteopy作損失函式
使用動量SGD做優化器

import torch.optim as optim
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

開始訓練


for epoch in range(2):  # loop over the dataset multiple times

    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        # get the inputs
        inputs, labels = data

        # zero the parameter gradients
        optimizer.zero_grad()

        # forward + backward + optimize
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        # print statistics
        running_loss += loss.item()
        if i % 2000 == 1999:    # print every 2000 mini-batches
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0

print('Finished Training')

訓練兩個epoch之後的效果：
在這裡插入圖片描述

檢視分類效果

correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print('Accuracy of the network on the 10000 test images: %d %%' % (
    100 * correct / total))

在這裡插入圖片描述

檢視每個類別的準確度

class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
with torch.no_grad():
     for data in testloader:
        images, labels = data
        outputs = net(images)
        _, predicted = torch.max(outputs, 1)
        c = (predicted == labels).squeeze()
        for i in range(4):
            label = labels[i]
            class_correct[label] += c[i].item()
            class_total[label] += 1
for i in range(10):
    print('Accuracy of %5s : %2d %%' % (classes[i], 100 * class_correct[i] / class_total[i]))

結果：
在這裡插入圖片描述

使用你的GPU訓練

首先我們定義GPU裝置為第一個可見的cuda裝置

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
# Assume that we are on a CUDA machine, then this should print a CUDA device:
print(device)
net.to(device)

你必須在每個步驟向GPU傳送輸入和目標

inputs, labels = inputs.to(device), labels.to(device)

優化

在你的GPU上訓練分類器
更改網路結構，嘗試增加你的網路寬度，看看會得到怎樣的提升。

如果本文對你有幫助的話請繼續關注，點贊，收藏~ 後續我將繼續更新優化部分的內容，以及一些深度學習的東西。

【入門】Pytorch實現簡單的圖片分類器

系列文章目錄【入門】Pytorch實現簡單的圖片分類器【入門】GPU訓練圖片分類器

pytorch實現簡單的分類器

作為目前越來越受歡迎的深度學習框架，pytorch 基本上成了新人進入深度學習領域最常用的框架。相比於 TensorFlow，pytorch 更易學，更快上手，也可以更容易的實現自己想要的 demo。今天的文章就從 pytorch 的基礎開始

【580】PyTorch 實現 CNN 例子

參考：PyTorch 神經網路參考：PyTorch 影象分類器參考：深度學習框架Keras與Pytorch對比

【581】PyTorch 實現上取樣 —— nn.Upsampling

參考：pytorch torch.nn 實現上取樣——nn.Upsample 參考：PyTorch Upsample() 函式實現上取樣

【Keras】完整實現‘交通標誌’分類、‘票據’分類兩個專案，讓你掌握深度學習影象分類

我們一般用深度學習做圖片分類的入門教材都是MNIST或者CIFAR-10，因為資料都是別人準備好的，有的甚至是一個函式就把所有資料都load進來了，所以跑起來都很簡單，但是跑完了，好像自己還沒掌握圖片分類的完整流程，因

【LeetCode】C++ ：簡單題 - 棧 232. 用棧實現佇列

技術標籤：LeetCodeleetcode棧佇列資料結構 232. 用棧實現佇列難度簡單261 請你僅使用兩個棧實現先入先出佇列。佇列應當支援一般佇列的支援的所有操作（push、pop、peek、empty）：

【pytorch學習筆記3】pytorch實現手寫數字識別

技術標籤：pytorch學習筆記深度學習神經網路前言我們來用手寫數字這個入門案例，拿它來熟悉一下pytorch

TensorFlow.NET機器學習入門【4】採用神經網路處理分類問題

上一篇文章我們介紹了通過神經網路來處理一個非線性迴歸的問題，這次我們將採用神經網路來處理一個多元分類的問題。

【專案實戰】pytorch實現邏輯斯蒂迴歸

視訊指導：https://www.bilibili.com/video/BV1Y7411d7Ys?p=6 一些資料集在pytorch框架下，裡面面有配套的資料集，pytorch裡面有一個torchversion的包，他可以提供相應的，比如MNIST這種很基礎的資料集，但是安裝的

pytorch:實現簡單的GAN示例(MNIST資料集)

我就廢話不多說了，直接上程式碼吧！ # -*- coding: utf-8 -*- \"\"\" Created on Sat Oct 13 10:22:45 2018

利用Pytorch實現簡單的線性迴歸演算法

最近聽了張江老師的深度學習課程，用Pytorch實現神經網路預測，之前做Titanic生存率預測的時候稍微瞭解過Tensorflow，聽說Tensorflow能做的Pyorch都可以做，而且更方便快捷，自己嘗試了一下程式碼的邏輯確實比較簡單

Git【入門】這一篇就夠了

前言歡迎關注公眾號，白嫖原創PDF，也可以催更，微信搜：JavaPub，回覆：【666】

vue實現簡單圖片上傳

本文例項為大家分享了vue實現簡單圖片上傳的具體程式碼，供大家參考，具體內容如下

【vue】---- ElementUI 實現上傳Excel

1、功能描述：vue 專案使用 el-upload 實現上傳 Excel。 2、功能效果：在el-upload基礎上做了樣式整改。

【bat】bat實現自動化指令碼實戰

需求（1）需要把現有test庫備份，修改成test_當前日期，加入現在是 20200716，就改成 test_200716。

【Nginx】如何實現Nginx的高可用負載均衡？看完我也會了！！

寫在前面不得不說，最近小夥伴們的學習熱情是越來越高，不斷向冰河提出新的想學習的技術。這不，又有小夥伴問我：冰河，你在【Nginx專題】寫的文章基本上都是Nginx單機版的，能不能寫一篇關於Nginx的高可用的文章呢

【HTML】input 上傳圖片並預覽

input 上傳圖片並預覽設定 input 標籤 type 屬性為 file <input type="file">

【Spring註解驅動開發】如何實現方法、構造器位置的自動裝配？我這樣回答讓面試官很滿意！

寫在前面在冰河技術微信公眾號前面的文章中，我們介紹瞭如何使用註解來自動裝配Spring元件。之前將的都是在來的欄位上添加註解，那有沒有什麼方法可以實現方法、構造器位置的自動裝配嗎？今天我們就一起來探討下

【LeetCode】28.實現strStr()

題目連結 28. 實現 strStr() 題目描述實現 strStr() 函式。給定一個 haystack 字串和一個 needle 字串，在 haystack 字串中找出 needle 字串出現的第一個位置 (從0開始)。如果不存在，則返回-1。

【入門】Pytorch實現簡單的圖片分類器

系列文章目錄

文章目錄

前言

匯入庫

資料歸一化

檢視訓練集

構造網路

定義損失函式和優化器

開始訓練

檢視分類效果

檢視每個類別的準確度

使用你的GPU訓練

優化

相關推薦