1. 程式人生 > >Device Placement Optimization with Reinforcement Learning

Device Placement Optimization with Reinforcement Learning

規模 一起 專家 AR 運行 CP ear device 過去

摘要

過去許多年的神經網絡計算量規模擴大了許多,現在的應對方法是使用異質的CPU和GPU混合在一起組成的系統。問題是決定現在系統中哪個神經模型放置到哪個節點上是由專家根據其經驗和直覺來決定的。在本篇論文中,我們提出一個方法來優化TensorFlow的計算圖譜,方法的關鍵是使用一個序列模型來預測TensorFlow圖譜應該使用設備。預測的放置方法的運行時間是我們模型的反饋值。得到的結果顯示在Inception-V3的圖片分類算法,RNN LSTM和語言模型上相比於傳統的手動調整方法運行的時間更短。

2. 介紹

Device Placement Optimization with Reinforcement Learning