tf 數據讀取

阿新 • • 發佈：2018-06-04

local for 允許 inpu 規則 any image join 轉換

tf.train.batch(
    tensors,
    batch_size,
    num_threads=1,
    capacity=32,
    enqueue_many=False,
    shapes=None,
    dynamic_pad=False,
    allow_smaller_final_batch=False,
    shared_name=None,
    name=None
)

tensors：排列的張量或詞典。
batch_size：從隊列中提取新的批量大小。
num_threads：排隊的線程數量tensors。如果批次是不確定的

num_threads > 1。
capacity：一個整數。隊列中元素的最大數量。
enqueue_many：每張張量是否tensors都是一個例子。
shapes:(可選）每個示例的形狀。默認為推斷的形狀tensors。
dynamic_pad：布爾值。在輸入形狀中允許可變尺寸。給定的尺寸在出列時填充，以便批次內的張量具有相同的形狀。
allow_smaller_final_batch:(可選）布爾值。如果True，如果隊列中剩余物品不足，則允許最終批次更小。
shared_name：（可選的）。如果設置，該隊列將在多個會話中以給定名稱共享。
name:(可選）操作的名稱。

tf.train.slice_input_producer(
    tensor_list,
    num_epochs=None,
    shuffle=True,
    seed=None,
    capacity=32,
    shared_name=None,
    name=None
)

tensor_list：Tensor對象列表。每一個Tensor都 tensor_list必須在第一維中具有相同的尺寸。
num_epochs：一個整數（可選）。如果指定，則會在生成錯誤之前生成slice_input_producer 每個切片num_epochs時間OutOfRange。如果沒有指定，slice_input_producer可以循環切片無限次數。
shuffle：布爾值。如果為真，整數在每個時期內隨機洗牌。
seed：一個整數（可選）。種子使用，如果洗牌==真。
capacity：一個整數。設置隊列容量。
shared_name：（可選的）。如果設置，該隊列將在多個會話中以給定名稱共享。
name：操作的名稱（可選）。

核心步驟：

調用 tf.train.slice_input_producer，從本地文件裏抽取tensor，準備放入Filename Queue（文件名隊列）中;
調用 tf.train.batch，從文件名隊列中提取tensor，使用單個或多個線程，準備放入文件隊列;
調用 tf.train.Coordinator() 來創建一個線程協調器，用來管理之後在Session中啟動的所有線程;
調用tf.train.start_queue_runners, 啟動入隊線程，由多個或單個線程，按照設定規則，把文件讀入Filename Queue中。函數返回線程ID的列表，一般情況下，系統有多少個核，就會啟動多少個入隊線程（入隊具體使用多少個線程在tf.train.batch中定義）;
文件從 Filename Queue中讀入內存隊列的操作不用手動執行，由tf自動完成;
調用sess.run 來啟動數據出列和執行計算;
使用 coord.should_stop()來查詢是否應該終止所有線程，當文件隊列（queue）中的所有文件都已經讀取出列的時候，會拋出一個 OutofRangeError 的異常，這時候就應該停止Sesson中的所有線程了;
使用coord.request_stop()來發出終止所有線程的命令，使用coord.join(threads)把線程加入主線程，等待threads結束。

Queue和Coordinator操作事例：

import tensorflow as tf
import numpy as np

# 樣本個數
sample_num=5
# 設置叠代次數
epoch_num = 2
# 設置一個批次中包含樣本個數
batch_size = 3
# 計算每一輪epoch中含有的batch個數
batch_total = int(sample_num/batch_size)+1

# 生成4個數據和標簽
def generate_data(sample_num=sample_num):
    labels = np.asarray(range(0, sample_num))
    images = np.random.random([sample_num, 224, 224, 3])
    print(‘image size {},label size :{}‘.format(images.shape, labels.shape))
    return images,labels

def get_batch_data(batch_size=batch_size):
    images, label = generate_data()
    # 數據類型轉換為tf.float32
    images = tf.cast(images, tf.float32)
    label = tf.cast(label, tf.int32)

    #從tensor列表中按順序或隨機抽取一個tensor準備放入文件名稱隊列
    input_queue = tf.train.slice_input_producer([images, label], num_epochs=epoch_num, shuffle=False)

    #從文件名稱隊列中讀取文件準備放入文件隊列
    image_batch, label_batch = tf.train.batch(input_queue, batch_size=batch_size, num_threads=2, capacity=64, allow_smaller_final_batch=False)
    return image_batch, label_batch

image_batch, label_batch = get_batch_data(batch_size=batch_size)


with tf.Session() as sess:

    # 先執行初始化工作
    sess.run(tf.global_variables_initializer())
    sess.run(tf.local_variables_initializer())

    # 開啟一個協調器
    coord = tf.train.Coordinator()
    # 使用start_queue_runners 啟動隊列填充
    threads = tf.train.start_queue_runners(sess, coord)

    try:
        while not coord.should_stop():
            print (‘************‘)
            # 獲取每一個batch中batch_size個樣本和標簽
            image_batch_v, label_batch_v = sess.run([image_batch, label_batch])
            print(image_batch_v.shape, label_batch_v)
    except tf.errors.OutOfRangeError:  #如果讀取到文件隊列末尾會拋出此異常
        print("done! now lets kill all the threads……")
    finally:
        # 協調器coord發出所有線程終止信號
        coord.request_stop()
        print(‘all threads are asked to stop!‘)
    coord.join(threads) #把開啟的線程加入主線程，等待threads結束
    print(‘all threads are stopped!‘)

輸出：

************
((3, 224, 224, 3), array([0, 1, 2], dtype=int32))
************
((3, 224, 224, 3), array([3, 4, 0], dtype=int32))
************
((3, 224, 224, 3), array([1, 2, 3], dtype=int32))
************
done! now lets kill all the threads……
all threads are asked to stop!
all threads are stopped!

以上程序在 tf.train.slice_input_producer 函數中設置了 num_epochs 的數量，所以在文件隊列末尾有結束標誌，讀到這個結束標誌的時候拋出 OutofRangeError 異常，就可以結束各個線程了。

如果不設置 num_epochs 的數量，則文件隊列是無限循環的，沒有結束標誌，程序會一直執行下去。

tf 數據讀取

local for 允許 inpu 規則 any image join 轉換 tf.train.batch( tensors, batch_size, num_threads=1, capacity=32, enqueue_many

Python數據分析－Kobe Bryan生涯數據讀取及分析

type lag col 導入 csv hot plot 打印 cat 1.將數據（csv格式）導入jupyter import pandas as pd import matplotlib.pyplot as plt filename＝‘data.csv‘ raw=pd.

高光譜數據讀取

var point con num 數據讀取 offset erl precision esp 利用matlab中multibandread函數參考數據的hdr文件讀取：函數格式： im = multibandread(filename,dims,precision,..

10 張圖幫你搞定 TensorFlow 數據讀取機制

小夥伴圖片文章網上如何導讀在學習tensorflow的過程中，有很多小夥伴反映讀取數據這一塊很難理解。確實這一塊官方的教程比較簡略，網上也找不到什麽合適的學習材料。今天這篇文章就以圖片的形式，用最簡單的語言，為大家詳細解釋一下tensorflow的數據讀取機制，文章的最後還會給出

bzoj2035: [2009國家集訓隊]數據讀取問題

nlogn 2009國家集訓隊 output tput lin desc urn class jpg Description Input Output 可以轉為邊權為1的最短路：將不修改並讀取x個數看作有向邊，原先樹上的邊仍保留且視

Spark學習筆記4：數據讀取與保存

讀取數據 chapter byte hadoop tar .lib 文件中 api sequence Spark對很多種文件格式的讀取和保存方式都很簡單。Spark會根據文件擴展名選擇對應的處理方式。 Spark支持的一些常見文件格式如下：　1、文本文件　　　使用文件

Modbus通用數據讀取工具設計及使用

技術分享需要 ima 因此 https 界面設計打開 csdn 一、公共功能碼定義二、能讀取的數據類型 1.bit類型，比如01功能碼，讀到的就是位的狀態，是ON 還是OFF，也就是對應著0或1。 2.byte類型，比如03功能碼。 3.short類型

（轉載）高光譜數據讀取by multibandread函數

format) 數據參考 sig little long header hdr gin 原文地址：http://www.cnblogs.com/yxxx/p/6873834.html 利用matlab中multibandread函數參考數據的hdr文件讀取：函數格式：

『TensorFlow』數據讀取類_data.Dataset

args call 集中使用 with src keyword border api 一、資料參考原文： TensorFlow全新的數據讀取方式：Dataset API入門教程 API接口簡介： TensorFlow的數據集二、背景註意，在TensorFlow

R語言外部數據讀取

必須 uci tom bsp false line 16px 出現 true 0 引言　　使用R語言、Python等進行數據處理的第一步就是要導入數據（也可以使用UCI數據集），下文主要根據R語言的幫助文檔來介紹外部文件數據的導入方法和註意事項。 1 格式read.t

C# Modbus 數據讀取使用NModBus4庫

ddr reat 協議 nbsp clas dad 開源 code NPU ModBus通訊協議方法名作用所需參數返回值對應功能碼 ReadCoils 讀取DO的狀態從站地址(8位) byte slaveA

瀏覽器和服務器之間數據讀取

nco rec nbsp 數據格式 pre aes amp 鍵值對瀏覽器瀏覽器發送的數據格式: get: 是從url欄發送例如:/index/?a=1&b=2 get方式沒有請求體 request.body 是一個空的 b‘‘ post: 通過f

python--學習筆記7 文件格式、數據讀取、儲存

字段 message series index 正則表達式 ESS 對象之一 pan 讀取文本類數據 pandas提供了一些將表格型數據讀取為DataFrame對象的函數。read_csv 默認分隔符為逗號， read_table 默認分隔符為制表符 "\t" 類型

地震儀數據讀取項目

交互進行圖片實現進制缺少獲取 host soc 1、打印buf出現數據不正確，應該是printf("%x",*buf);十六進制是不能直接像字符串一樣打印出來的，必須一個一個打印 2、std::string 的字符串鏈接函數不能用於含有0的字符串，會導致錯誤判斷

ROS tf-數據類型

介紹 times timestamp 基本類型 class 博客 ast wid style 博客參考：https://www.ncnynl.com/archives/201702/1305.html ROS與C++入門教程-tf-數據類型說明：介紹roscp

TF從文件中讀取數據

pytho value extern dea __name__ which detail 二進制 learning 從文件中讀取數據在TensorFlow中進行模型訓練時,在官網給出的三種讀取方式,中最好的文件讀取方式就是將利用隊列進行文件讀取,而且步驟有兩步: 把樣本

jsp中讀取數據庫內容（一）

reat cor mysq ava roo 數據 state imp nav 在jsp中將數據庫表格內容讀出為一個表格，並在表格中添加超鏈接： 1 <%@ page language="java" contentType="text/html; charset=U

ASP.NET Core實現強類型Configuration讀取配置數據

控制器項目最好前言實現讀取JSON文件幾種方式，在項目中采取老辦法簡單粗暴，結果老大過來一看，恩，這樣不太可取，行吧那我就用.NET Core中最新的方式諾，切記，適合的才是最好的，切勿懶。.NET Core讀取JSON文件通過讀取文件方式當我將VS2015項目用VS2017打開後

關於讀取Sql Server數據庫時間前端處理問題

pre lac span creat server eat rep code div var time = this.CreateTime; this.CreateTime = new Date(time.replace("T", " ")).FormatD("yy

使用NPOI讀取Excel數據到DataTable

交換 tac sin 沒有 != region csharp edi XML 如今XML文件的存儲格式大行其道，可是也不是適用於全部情況，非常多單位的數據交換還是使用Excel的形式。這就使得我們須要讀取Excel內的數據。載入到程序中進行處理。可是如何有效率的讀取，如

tf 數據讀取

核心步驟：

Queue和Coordinator操作事例：

輸出：

相關推薦