Tensorflow深度學習入門——自制資料集
python 將自己的圖片資料集製作成tensorflow可讀取的資料集檔案*.cvs
這裡假設你已經有了樣本圖片資料集,而且正樣本和負樣本已經分好類了
說明下製作正樣本資料集*.csv的過程,負樣本資料集的製作也同樣
import os,os.path import shutil,string
dir = “F:\Python27\work\deal-file\pos” outdir = “pos” label = " 1"
fileList = os.listdir(dir) #列出dir目錄下的目錄和檔案
fileinfo = open(‘list.csv’,‘w’) #將結果儲存在list.csv中
for i in fileList: curname = os.path.join(outdir, i) print curname fileinfo.write(curname + ’ 1’ + ‘\n’) #這裡 1 為正樣本的標籤 #print i fileinfo.close()
生成的樣本集如下:
其他相關的函式可參考:
Python的os模組,包含了普遍的作業系統功能,這裡主要學習與路徑相關的函式:
os.listdir(dirname):列出dirname下的目錄和檔案
os.getcwd():獲得當前工作目錄
os.curdir:返回當前目錄(’.’)
os.chdir(dirname):改變工作目錄到dirname
os.path.isdir(name):判斷name是不是一個目錄,name不是目錄就返回false
os.path.isfile(name):判斷name是不是一個檔案,不存在name也返回false
os.path.exists(name):判斷是否存在檔案或目錄name
os.path.getsize(name):獲得檔案大小,如果name是目錄返回0
os.path.abspath(name):獲得絕對路徑
os.path.normpath(path):規範path字串形式
os.path.split(name):分割檔名與目錄(事實上,如果你完全使用目錄,它也會將最後一個目錄作為檔名而分離,同時它不會判斷檔案或目錄是否存在)
os.path.splitext():分離檔名與副檔名
os.path.join(path,name):連線目錄與檔名或目錄
os.path.basename(path):返回檔名