1. 程式人生 > >Tensorflow深度學習入門——自制資料集

Tensorflow深度學習入門——自制資料集

python 將自己的圖片資料集製作成tensorflow可讀取的資料集檔案*.cvs

這裡假設你已經有了樣本圖片資料集,而且正樣本和負樣本已經分好類了

說明下製作正樣本資料集*.csv的過程,負樣本資料集的製作也同樣

import os,os.path import shutil,string

dir = “F:\Python27\work\deal-file\pos” outdir = “pos” label = " 1"

fileList = os.listdir(dir) #列出dir目錄下的目錄和檔案

fileinfo = open(‘list.csv’,‘w’) #將結果儲存在list.csv中

for i in fileList: curname = os.path.join(outdir, i) print curname fileinfo.write(curname + ’ 1’ + ‘\n’) #這裡 1 為正樣本的標籤 #print i fileinfo.close()

生成的樣本集如下:

其他相關的函式可參考:

Python的os模組,包含了普遍的作業系統功能,這裡主要學習與路徑相關的函式:

os.listdir(dirname):列出dirname下的目錄和檔案

os.getcwd():獲得當前工作目錄

os.curdir:返回當前目錄(’.’)

os.chdir(dirname):改變工作目錄到dirname

os.path.isdir(name):判斷name是不是一個目錄,name不是目錄就返回false

os.path.isfile(name):判斷name是不是一個檔案,不存在name也返回false

os.path.exists(name):判斷是否存在檔案或目錄name

os.path.getsize(name):獲得檔案大小,如果name是目錄返回0

os.path.abspath(name):獲得絕對路徑

os.path.normpath(path):規範path字串形式

os.path.split(name):分割檔名與目錄(事實上,如果你完全使用目錄,它也會將最後一個目錄作為檔名而分離,同時它不會判斷檔案或目錄是否存在)

os.path.splitext():分離檔名與副檔名

os.path.join(path,name):連線目錄與檔名或目錄

os.path.basename(path):返回檔名

os.path.dirname(path):返回檔案路徑