win10 tensorflow faster rcnn訓練自己的資料集（一、製作VOC2007資料集）

阿新 • • 發佈：2019-01-10

參考部落格：http://blog.csdn.net/gaohuazhao/article/details/60871886

一、關於VOC資料集：

1)JPEGImages資料夾

資料夾裡包含了訓練圖片和測試圖片，混放在一起

2)Annatations資料夾

資料夾存放的是xml格式的標籤檔案，每個xml檔案都對應於JPEGImages資料夾的一張圖片

3)ImageSets資料夾

Action存放的是人的動作，我們暫時不用

Layout存放的人體部位的資料。我們暫時不用

Main存放的是影象物體識別的資料，分為20類，當然我們自己製作就呵呵呵不一定了，如果你有精力，Main裡面有test.txt , train.txt, val.txt ,trainval.txt.這四個檔案我們後面會生成

Segmentation存放的是可用於分割的資料

4)其他的資料夾不解釋了，分割XXX等用的

如果你下載了VOC2007資料集，那麼把它解壓，把各個資料夾裡面的東西刪除，保留資料夾名字。

二、JPEGImages資料夾

1、重新命名圖片

使用的為Total_Commander軟體

在軟體中開啟影象所處資料夾

全選圖片後，選擇左上角Files——Multi-Rename Tool

選擇Counter，如圖右上方start為起始數，步長為1，Digits為總位數，設定為6。點選Start即可。

三、Annatations資料夾

使用Github上的labelimg:

https://github.com/tzutalin/labelImg

安裝anaconda再cmd中輸入conda list檢視Pyqt and lxml相應版本（如未安裝，按Github上安裝相應檔案）

下載ZIP檔案後，解壓，在labelimg資料夾下shift+右鍵開啟powershell

輸入命令：

pyrcc5 -o resources.py resources.qrc（數字5為Pyqt對應版本）

python labelImg.py

即可開啟labelimg介面

選擇open dir 開啟圖片所處資料夾。點選create rexbox進行標註，點選Save,即可得到這張圖的xml檔案，點選Next Image處理下一張圖。

標註後得到的xml檔案儲存在annotations資料夾下。

生成的xml檔案如圖

如果需要修改xml檔案中的路徑path，可使用一下程式碼（來自部落格：http://blog.csdn.net/Pennypinch/article/details/77750191）

import os  
import re  
  
#設定為自己Annotations儲存路徑
_dir = "G:/Annotations/"  
xmlList = os.listdir(_dir)  
n = 1  
for xml in xmlList:  
    #f = open(_dir + xml, "r")  
    f = open(_dir + xml, "r", encoding='utf-8')  
    xmldata = f.read()  
#設定為希望修改的path即可
    xmldata = re.sub('\<path>(.*?)\</path>', '<path>G:/data/VOCdevkit2007/VOC2007/JPEGImages/' + str(n).zfill(6) + '.jpg</path>', xmldata)  
    f.close()  
    f = open(_dir + xml, "w")  
    f.write(xmldata)  
    f.close()  
    n += 1

四、生成ImageSets資料夾中的Main資料夾中的檔案

程式碼來源於參考部落格

在自己的VOC2007資料夾下建立.py檔案，執行以下程式

可修改trainval_percent和train_percent兩個引數，調整用於訓練和測試的圖片數量

import os  
import random  
  
trainval_percent = 0.66  
train_percent = 0.5  
xmlfilepath = 'Annotations'  
txtsavepath = 'ImageSets\Main'  
total_xml = os.listdir(xmlfilepath)  
  
num=len(total_xml)  
list=range(num)  
tv=int(num*trainval_percent)  
tr=int(tv*train_percent)  
trainval= random.sample(list,tv)  
train=random.sample(trainval,tr)  
  
ftrainval = open('ImageSets/Main/trainval.txt', 'w')  
ftest = open('ImageSets/Main/test.txt', 'w')  
ftrain = open('ImageSets/Main/train.txt', 'w')  
fval = open('ImageSets/Main/val.txt', 'w')  
  
for i  in list:  
    name=total_xml[i][:-4]+'\n'  
    if i in trainval:  
        ftrainval.write(name)  
        if i in train:  
            ftrain.write(name)  
        else:  
            fval.write(name)  
    else:  
        ftest.write(name)  
  
ftrainval.close()  
ftrain.close()  
fval.close()  
ftest .close()

至此，VOC2007資料集製作完成，後續會將此資料集用於tensorflow faster rcnn中使用。

win10 tensorflow faster rcnn訓練自己的資料集（一、製作VOC2007資料集）

參考部落格：http://blog.csdn.net/gaohuazhao/article/details/60871886 一、關於VOC資料集： 1)JPEGImages資料夾資料夾裡包含了訓練圖片和測試圖片，混放在一起 2)Annatations資料夾資

使用pytorch版faster-rcnn訓練自己資料集

使用pytorch版faster-rcnn訓練自己資料集引言 faster-rcnn pytorch程式碼下載訓練自己資料集接下來工作參考文獻引言最近在復現目標檢測程式碼（師兄強烈推薦F

用Faster RCNN訓練自己的資料集

Faster RCNN（py caffe）工程各個目錄的作用： caffe-fast-rcnn：caffe框架目錄； data：用來存放pretrained（預訓練）模型以及讀取檔案的cache快取，還有一些下載模型的指令碼； experiments:存放配置

Caffe學習系列——Faster-RCNN訓練自己的資料集

由於要實現服裝的目標檢測，所以一直在研究Faster-RCNN 。講到目標檢測，不得不提到rbg大神的深度神經網路檢測算法系列RCNN、Fast-RCNN、Faster-RCNN，其還在github上開源了自己的程式碼，造福廣大碼農。這是rbg大神的主頁 https://people.eecs.berk

Faster RCNN 訓練自己的資料集遇到的一些問題

1. xml標籤格式問題原本的標籤是yaml格式的，需要轉換成xml格式。在製作xml標籤時，有些資訊是比較重要的不能省略 <?xml version="1.0" encoding="utf-8"?> <annotation> <folder>

不能再詳細！！！手把手教你用Faster-RCNN訓練自己的資料集

一、環境安裝準備 python2.7以及相關的包cython, python-opencv, easydict 本文假設你已經按照上面的教程完成了安裝，並可以執行demo.py 並且可以訓練二、準備自己的資料集在實際的應用中，這個資料集肯定是自己專案裡面拍攝的。

深度學習Caffe實戰筆記（20）Windows平臺 Faster-RCNN 訓練自己的資料集

1、把自己的資料集放到Faster-master中我覺得這個過程是最重要的一個過程吧，博主在這裡跳了很多的坑，最後找到了一個非常簡單高效的方法。不用修改任何檔案，就可以輕鬆實現載入自己的資料集。在faster_rcnn-master資料夾下，有一個d

Faster-RCNN 訓練自己資料集的坑記錄

主要照這篇部落格進行訓練配置，因為沒有GPU所以好多坑，CPU訓練可以參見這篇部落格正所謂，跑通了的都一樣，錯誤千萬樣。按照教程來也是坑多訓練： python train_faster_rcnn_alt_opt.py --net_name ZF --weights

利用faster rcnn 訓練自己的資料集——kitti資料集

前言：非常感謝https://blog.csdn.net/flztiii/article/details/73881954，這篇部落格，本文主要參考這篇文章kitti資料集是一個車輛檢測的資料集資料集的準備Kitti資料集的下載只需要第一個圖片集（12G）和標註檔案即可【第一

py-faster-rcnn訓練自己資料集需要修改的引數

faster rcnn預設有三種網路模型ZF（小）、VGG_CNN_M_1024（中）、VGG16 （大）訓練圖片大小為500*500，類別數1。修改VGG_CNN_M_1024模型配置

使用faster rcnn訓練自己的資料（py-faster-rcnn ）

出於在csdn上面學到很多東西這裡也幫自己的一些收穫和大家分享一下直奔主題~~ 前提是已經安裝好caffe的環境本文是在Ubuntu 15.04下做的測試 $Faster_rcnn表示py-faster-rcnn根目錄 1. 修改資料介面（$Faster_rc

faster-rcnn訓練自己的資料時報錯too many indices

利用faster-rcnn 好不容易四個階段訓練完了，在測試的時候出現這個錯誤。原因：在data/VOCdevkit2007/results/VOC2007/Main/ 這個檔案下有n個txt檔案。n是你的類別數每個txt儲存了test.txt

使用faster-rcnn訓練自己的模型

參考 faster-rcnn 原始碼連結論文連結一個不錯的參考 faster rcnn簡介各檔案目錄介紹  caffe-fast-rcnn —> caffe框架  data —> 存放資料，以及讀取檔案的ca

使用faster rcnn訓練自己的模型

安裝caffe 資料預處理我這裡主要是使用python對xml進行處理。生產xml的程式碼： # -*- coding:utf-8 -*- __author__ = "Yu Chen" import xml.dom

jquery-根據現有結果集得到另一個結果集（後代、祖先或兄弟元素）

1、獲取後代元素　　1）children() 　　　　不傳引數：得到結果集內所有元素的子元素　　　　傳入選擇器：得到結果集內元素的匹配傳入選擇器的子元素　　2）find()

Android 客戶端與伺服器端進行資料互動（一、登入伺服器端）

概要安卓APP要實現很多功能（比如登入註冊、發表評論等）時都必須要使用到網路資料互動。所以在學習了這部分內容後，就將其以最常見的登入過程為例整理出來，也方便跟我一樣的新手能迅速學習上手。預期效果圖如下，輸入手機號和密碼，點選Login按鈕，上傳資料到伺

UEFI+GPT下安裝Win10和Ubuntu16.04雙系統相關問題（引導、無線連不上網）

1、安裝雙系統 1）先製作U盤啟動，製作過程不再贅述 2)進入bios，設定從U盤啟動 3）如下圖，選擇第二項為安裝Ubuntu 4）前幾不沒什麼問題，就直接往下走，選擇語言，往下拉有中文選項 5）下面這些選項可選可不選，如果選了安裝時需要花點時間（需要設定密碼之類的

Vue+ElementUI從零開始搭建自己的網站（三、元件間的通訊）

前面討論了環境的搭建和導航頁面以及路由的配置，今天我們討論下如何開發一個擁有表單和表格功能的頁面。先上開發完的效果圖：可以看出頁面非常的簡單，其中上半部分是表單搜尋和查詢，下半部分是用於展示資料的表格。如果按照傳統的開發思路，其實非常簡單，只要用兩個div，第一個d

製作自己的目標檢測資料集再利用tf-faster-rcnn訓練

1.製作資料集的工具我利用資料集標註工具是精靈標註助手，我認為很好用。奉勸一句標註資料集時不要隨便找人給你標，如果他沒有用心給你標註，你在後面訓練會出現很多問題。在一開始標註資料集的時候不要一下子給他標註完，先標註幾十張圖片，然後用在你的網路裡，看看有沒有錯誤，如果沒有問

使用tensorflow訓練自己的資料集（一）——製作資料集

使用tensorflow訓練自己的資料集—製作資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集並沒有使用

win10 tensorflow faster rcnn訓練自己的資料集（一、製作VOC2007資料集）

相關推薦