Pytorch 實現資料集自定義讀取

阿新 • • 發佈：2020-01-19

以讀取VOC2012語義分割資料集為例，具體見程式碼註釋：

VocDataset.py

from PIL import Image
import torch
import torch.utils.data as data
import numpy as np
import os
import torchvision
import torchvision.transforms as transforms
import time

#VOC資料集分類對應顏色標籤
VOC_COLORMAP = [[0,0],[128,[0,128,128],[64,[192,64,192,128]]

#顏色標籤空間轉到序號標籤空間，就他媽這裡浪費巨量的時間,這裡還他媽的有問題
def voc_label_indices(colormap,colormap2label):
  """Assign label indices for Pascal VOC2012 Dataset."""
  idx = ((colormap[:,:,2] * 256 + colormap[ :,1]) * 256+ colormap[:,0])
  #out = np.empty(idx.shape,dtype = np.int64) 
  out = colormap2label[idx]
  out=out.astype(np.int64)#資料型別轉換
  end = time.time()
  return out

class MyDataset(data.Dataset):#建立自定義的資料讀取類
  def __init__(self,root,is_train,crop_size=(320,480)):
    self.rgb_mean =(0.485,0.456,0.406)
    self.rgb_std = (0.229,0.224,0.225)
    self.root=root
    self.crop_size=crop_size
    images = []#建立空列表存檔名稱
    txt_fname = '%s/ImageSets/Segmentation/%s' % (root,'train.txt' if is_train else 'val.txt')
    with open(txt_fname,'r') as f:
      self.images = f.read().split()
    #資料名稱整理
    self.files = []
    for name in self.images:
      img_file = os.path.join(self.root,"JPEGImages/%s.jpg" % name)
      label_file = os.path.join(self.root,"SegmentationClass/%s.png" % name)
      self.files.append({
        "img": img_file,"label": label_file,"name": name
      })
    self.colormap2label = np.zeros(256**3)
    #整個迴圈的意思就是將顏色標籤對映為單通道的陣列索引
    for i,cm in enumerate(VOC_COLORMAP):
      self.colormap2label[(cm[2] * 256 + cm[1]) * 256 + cm[0]] = i
  #按照索引讀取每個元素的具體內容
  def __getitem__(self,index):
    
    datafiles = self.files[index]
    name = datafiles["name"]
    image = Image.open(datafiles["img"])
    label = Image.open(datafiles["label"]).convert('RGB')#開啟的是PNG格式的圖片要轉到rgb的格式下，不然結果會比較要命
    #以影象中心為中心擷取固定大小影象，小於固定大小的影象則自動填0
    imgCenterCrop = transforms.Compose([
       transforms.CenterCrop(self.crop_size),transforms.ToTensor(),transforms.Normalize(self.rgb_mean,self.rgb_std),#影象資料正則化
     ])
    labelCenterCrop = transforms.CenterCrop(self.crop_size)
    cropImage=imgCenterCrop(image)
    croplabel=labelCenterCrop(label)
    croplabel=torch.from_numpy(np.array(croplabel)).long()#把標籤資料型別轉為torch
    
    #將顏色標籤圖轉為序號標籤圖
    mylabel=voc_label_indices(croplabel,self.colormap2label)
    
    return cropImage,mylabel
  #返回影象資料長度
  def __len__(self):
    return len(self.files)

Train.py

import matplotlib.pyplot as plt
import torch.utils.data as data
import torchvision.transforms as transforms
import numpy as np

from PIL import Image
from VocDataset import MyDataset

#VOC資料集分類對應顏色標籤
VOC_COLORMAP = [[0,128]]

root='../data/VOCdevkit/VOC2012'
train_data=MyDataset(root,True)
trainloader = data.DataLoader(train_data,4)

#從資料集中拿出一個批次的資料
for i,data in enumerate(trainloader):
  getimgs,labels= data
  img = transforms.ToPILImage()(getimgs[0])

  labels = labels.numpy()#tensor轉numpy
  labels=labels[0]#獲得批次標籤集中的一張標籤影象
  labels = labels.transpose((1,0))#陣列維度切換，將第1維換到第0維，第0維換到第1維

  ##將單通道索引標籤圖片映射回顏色標籤圖片
  newIm= Image.new('RGB',(480,320))#建立一張與標籤大小相同的圖片，用以顯示標籤所對應的顏色
  for i in range(0,480):
    for j in range(0,320):
      sele=labels[i][j]#取得座標點對應畫素的值
      newIm.putpixel((i,j),(int(VOC_COLORMAP[sele][0]),int(VOC_COLORMAP[sele][1]),int(VOC_COLORMAP[sele][2])))

  #顯示影象和標籤
  plt.figure("image")
  ax1 = plt.subplot(1,2,1)
  ax2 = plt.subplot(1,2)
  plt.sca(ax1)
  plt.imshow(img)
  plt.sca(ax2)
  plt.imshow(newIm)
  plt.show()

以上這篇Pytorch 實現資料集自定義讀取就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Pytorch 實現資料集自定義讀取

以讀取VOC2012語義分割資料集為例，具體見程式碼註釋： VocDataset.py from PIL import Image

pytorch學習教程之自定義資料集

自定義資料集在訓練深度學習模型之前，樣本集的製作非常重要。在pytorch中，提供了一些介面和類，方便我們定義自己的資料集合，下面完整的試驗自定義樣本集的整個流程。

pytorch載入語音類自定義資料集的方法教程

前言　　pytorch對一下常用的公開資料集有很方便的API介面，但是當我們需要使用自己的資料集訓練神經網路時，就需要自定義資料集，在pytorch中，提供了一些類，方便我們定義自己的資料集合

實現一個Vue自定義指令懶載入的方法示例

在專案中如果有大量的圖片需要載入的時候，就可以考慮使用懶載入了，懶載入其實就是監聽瀏覽器的滾動，當滾動到一定的範圍的時候就將圖片的真實路徑賦給src,然後取消監聽。實現的方法也比較簡單，可以通過懶載入的外

Python如何實現後端自定義認證並實現多條件登陸

1.須知 JWT擴充套件的登入檢視，在收到使用者名稱與密碼時，也是呼叫Django的認證系統Auth模型中提供的**authenticate()**來檢查使用者名稱與密碼是否正確。

LRU資料結構-自定義

public static void main(String[] args) { try { LRUStruct lruStruct = new LRUStruct(4); lruStruct.put(\"1\", 1);

註解Annotation實現原理與自定義註解例子

轉載：https://www.cnblogs.com/acm-bingzi/p/javaAnnotation.html 什麼是註解？對於很多初次接觸的開發者來說應該都有這個疑問？Annontation是Java5開始引入的新特徵，中文名稱叫註解。它提供了一種安全的

element-ui tree結構實現增刪改自定義功能程式碼

首先是頁面部分 <template> <el-tree id=\"userMtree\" ref=\"tree\" :data=\"treeData\" node-key=\"id\"

Java如何使用JSR303校驗資料與自定義校驗註解

一、自帶校驗註解實現資料校驗 1、web專案匯入依賴

實現一個Vue自定義指令懶載入

什麼是圖片懶載入當我們向下滾動的時候圖片資源才被請求到，這也就是我們本次要實現的效果，進入頁面的時候，只請求可視區域的圖片資源這也就是懶載入。

微信實現分享連結自定義分享功能（標題，圖片，內容，連結自定義分享)

用微信開啟一個網頁，選擇右上角的“傳送給朋友”後，收到的訊息是這樣的：

如何實現 axios 的自定義介面卡 adapter

Axios 是一個非常優秀的基於 promise 的 HTTP 庫，可以用在瀏覽器和 node.js 中。並且提供了很多便捷的功能，例如：

使用DingTalk實現共享庫自定義通知器

參考：https://www.ssgeek.com/post/jenkinssharelibrary-shi-jian-zhi-zi-ding-yi-tong-zhi-qi 和原部落格不同的點：原部落格用的是Http Request外掛，本文用的是DingTalk外掛

thinkphp驗證器獲取$data資料，自定義驗證，多條件唯一性驗證unique驗證

技術標籤：thinkPHPphpmysqlthinphp唯一性驗證 thinkphp驗證器獲取$data資料,自定義驗證，多條件唯一性驗證，軟刪除驗證唯一性，unique驗證

如何在OpenVINO中實現自己的自定義運算元 – 第一篇：搞定模型轉換

技術標籤：程式設計技巧開源專案深度學習前言與主流的深度學習框架類似，OpenVINO也提供一套擴充套件機制，方便開發者可以實現自己的自定義運算元。自定義運算元有如下三種使用場景：

基於awesome實現audio樣式自定義

技術標籤：前端外掛audio音訊播放精簡播放器 1.先看效果 2.完整原始碼（另外為html直接執行）

如何實現axios的自定義介面卡adapter

1. 介面卡要實現的功能我們在基於 axios 實現額外的資料模組時，應當與 axios 的模式進行對齊。因此在返回的資料格式上，實現的功能上儘量保持一致。

TypeScript reflect-metadata 結合方法裝飾器實現的一個自定義語法檢查的例子

reflect-metadata 例子： import \'reflect-metadata\'; function validate( target: Object, key: string, descriptor: PropertyDescriptor

Qt屬性動畫效果的實現QPropertyAnimation & 自定義屬性Q_PROPERTY

原文連結：https://www.cnblogs.com/lvdongjie/p/4366092.html 　　　　　https://blog.csdn.net/wzs250969969/article/details/78418124

直播視訊app原始碼，實現直播內容自定義分頁的效果

直播視訊app原始碼，實現直播內容自定義分頁的效果 1.自定義分類類，注意繼承：

Pytorch 實現資料集自定義讀取

相關推薦