谷歌新引擎可將深度學習提速 1000 倍：1 個 GPU 幾分鐘搞定強化學習訓練

阿新 • • 發佈：2021-07-22

7 月 22 日訊息，機器人要如何完成這樣一個動作？我們一般會基於強化學習，在模擬環境中進行模擬訓練。

這時，如果在一臺機器的 CPU 環境下進行模擬訓練，那麼需要幾個小時到幾天。

但現在，只需一個 TPU/GPU，就能和數千個 CPU 或 GPU 的計算叢集的速度一樣快，直接將所需時間縮短到幾分鐘，相當於將強化學習的速度提升了 1000 倍！

這就是來自谷歌的科學家們開發的物理模擬引擎 Brax。

三種策略避免邏輯分支

現在大多數的物理模擬引擎都是怎麼設計的呢？

將重力、電機驅動、關節約束、物體碰撞等任務都整合在一個模擬器中，並行地進行多個模擬，以此來逼近現實中的運動系統。

▲ 對於每個模擬時間步長，力和力矩被整合在一起

這種情況下，每個模擬器中的計算都不相同，且資料必須在資料中心內通過網路傳輸。

這種並行佈局也就導致了較高的延遲時間 —— 即學習者可能需要超過 10000 納秒的等待時間，才能從模擬器中獲得經驗。

那麼怎樣才能縮短這種延遲時間呢？

Brax 選擇通過避免模擬中的分支來保證數千個並行環境中的計算完全統一，進而降低整個訓練架構的複雜度。

直到複雜度降低到可以在單一的 TPU 或 GPU 上執行，跨機器通訊的計算開銷就隨之降低，延遲也就能被有效消除。

主要分為以下三個方法：

連續函式替換離散分支邏輯

比如，在計算一個小球與牆壁之間的接觸力時，就產生了一個分支：

如果球接觸牆壁，就執行模擬球從牆壁反彈的獨立程式碼；

否則，就執行其他程式碼；

這裡就可以通過符號距離函式來避免這種 if/else 的離散分支邏輯的產生。

使用 JAX 即時編譯中評估分支

在模擬時間之前評估基於環境靜態屬性的分支，例如兩個物體是否有可能發生碰撞。

在模擬中只選擇需要的分支結果

在使用了這三種策略之後，我們就得到了一個模擬由剛體、關節、執行器組成環境的物理引擎。

同時也是一種實現在這種環境中各類操作（如進化策略，直接軌跡優化等）的學習演算法。

那麼 Brax 的效能究竟如何呢？

速度最高提升 1000 倍

Brax 測試所用的基準是 OpenAI Gym 中 Ant、HalfCheetah、Humanoid、Reacher 四種。

同時也增加了三個新環境：包括對物理的靈巧操作、通用運動（例如前往周圍任何一個放置了物體的地點）、以及工業機器人手臂的模擬：

研究人員首先測試了 Brax 在並行模擬越來越多的環境時，可以產生多少次物理步驟（也即對環境狀態的更新）。

測試結果中的 TPUv3 8x8 曲線顯示，Brax 可以在多個裝置之間進行無縫擴充套件，每秒可達到數億個物理步驟：

而不僅是在 TPU 上，從 V100 和 P100 曲線也能看出，Brax 在高階 GPU 上同樣表現出色。

然後就是 Brax 在單個工作站（workstation）上執行一個強化學習實驗所需要的時間。

在這裡，研究人員將基於 Ant 基準環境訓練的 Brax 引擎與 MuJoCo 物理引擎做了對比：

可以看到，相對於 MuJoCo（藍線）所需的將近 3 小時時間，使用了 Brax 的加速器硬體最快只需要 10 秒。

使用 Brax，不僅能夠提高單核訓練的效率，還可以擴充套件到大規模的並行模擬訓練。

谷歌新引擎可將深度學習提速 1000 倍：1 個 GPU 幾分鐘搞定強化學習訓練

7 月 22 日訊息，機器人要如何完成這樣一個動作？我們一般會基於強化學習，在模擬環境中進行模擬訓練。

不滿澳大利亞新規谷歌威脅澳政府將退出澳大利亞

谷歌全球最知名的技術公司之一，旗下搜尋引擎也在諸多地區佔據主要地位，在澳大利亞也是如此。不過，隨著澳大利亞的一項新規釋出，谷歌與Facebook等公司或將撤出澳大利亞以表抗議。

耗資近 4 億美元，谷歌新園區規劃曝光：可容納 3500 名員工，騎車上班還能洗個澡

據美國媒體 CNBC 報道，谷歌正在規劃一處名為“Midpoint”的矽谷新園區，這個新園區與谷歌一個新的硬體產品中心相鄰，谷歌將以此推進其智慧硬體業務。

谷歌 Google Play 商店將優化 App 評價系統：可檢視裝置專屬評分

9 月 13 日消息穀歌宣佈，Google Play 商店將啟動一個長期的改進計劃，打造更具個性化的評分機制，讓其能夠反映每位使用者的期望值以及更容易為開發者導航和使用：自 2021 年 11 月起，手機使用者可以檢視註冊地所在

訊息稱谷歌 Pixel Notepad 可摺疊手機將採用 5.8 英寸外屏，機身短而寬

感謝網友肖戰割割的線索投遞！

火狐上如何使用谷歌翻譯外掛_將Google翻譯功能新增到Firefox

火狐上如何使用谷歌翻譯外掛 Are you looking for a quick no-fuss way to translate webpages? Then you will want to take a good look at the Translate extension for Firefox.

谷歌下一代 Chrome WebView 將為安卓應用內網頁預設增添分享按鈕

1月23日消息穀歌近日釋出了 Chrome 88 版本，但是安卓平臺瀏覽器依舊停留在 87 版本。據外媒 Neowin 訊息，谷歌下一代採用 Chrome 88 核心的最新版 WebView，將為應用內網頁標籤預設增添分享按鈕，便於使用者進行快速

谷歌詳解 Chrome 89 降低記憶體佔用的方法：每個標籤頁可回收 100MB

3月13日消息穀歌 Chrome 89 正式版瀏覽器於本月推出，修復了一些 Bug，提升了瀏覽器記憶體佔用和速度。據外媒 onmsft 訊息，谷歌近日在一篇文章中詳解了 89 版本瀏覽器降低記憶體佔用的方法。

三星助力谷歌新作業系統，已開始向 Fuchsia OS 提交程式碼

5 月 14 日訊息多年來，谷歌一直在開發全新作業系統 Fuchsia OS，該系統基於名為 Zircon 的微核心，有望不久後釋出首個預覽版本。

爆料：谷歌 Pixel 6 或將搭載谷歌自研晶片，效能接近驍龍 870

5 月 25 日訊息近日爆料人士 Yogesh 稱，谷歌即將釋出的新手機谷歌 Pixel 6 可能會搭載谷歌自研的晶片，該晶片暫時被命名為“Whitechapel”，其效能將會接近於高通驍龍 870 晶片。

微軟加入蘋果和谷歌，共同反對將“維修權”立法

5 月 25 日訊息據外媒 IOL 報道，微軟已經加入了蘋果和谷歌的行列，一同反對將“維修權”寫入法律。這些公司的反對目前初見成效，美國 27 個州的立法者決定不對“維修權”立法。

微軟 Xbox Series X/S 將支援 AMD FSR 新技術：可將遊戲幀率翻倍

6 月 5 日訊息據外媒 Gamesadar 報道，微軟宣佈其 Xbox Series X/S 將會支援 AMD 近日在臺北國際電腦展上釋出的 FSR（FidelityFX Super Resolution）技術，該技術對標英偉達的 DLSS 技術，為遊戲主機提供更高的執

谷歌 Pixel 6 手機將至，如何與 iPhone 13 / Pro 抗衡

6 月 6 日消息穀歌 Pixel 6 系列手機的外觀目前已被曝光，這款產品將採用三段式後蓋，後置三攝，包含標準版以及 Pixel 6 Pro。在今年下半年，蘋果 iPhone 13/Pro 系列手機也將如期而至。儘管這兩類的手機的預期銷量

谷歌 Android 12 推出一大波全新 emoji 表情符號：各種“餡餅”, 可剪東西的剪刀

7 月 17 日消息穀歌今天釋出部落格文章，表示為了慶祝世界表情符號日，谷歌宣佈了一套新的 emoji 表情符號，將與安卓 12 系統和其他通過 Appcompat 更新的安卓手機一起推出。

谷歌 Wear OS 手錶將支援 Spotify 離線下載音樂、播客，無需手機即可聽歌

8 月 12 日訊息三星昨晚釋出了 Galaxy Watch 4/4 Classic 智慧手錶，搭載了融合谷歌Wear OS 和 Tizen UI 的全新 Wear OS。

Firefox 火狐瀏覽器跟上谷歌 Chrome 步伐，將預設阻止不安全的下載

8 月 15 日訊息Mozilla 近日在官網說明了一項 Firefox 火狐瀏覽器的改進，將預設阻止“混合內容”網頁進行不安全的檔案下載。

谷歌確認 Pixel 6 將不再附帶充電器

8 月 18 日消息穀歌剛剛釋出了價效比手機 Pixel 5a，定價 449 美元，將於 8 月 26 日在美國和日本上市。Pixel 5a 相比 Pixel 4a 5G 升級了更大的電池（4680mAh）、更大的螢幕（6.3 英寸），且支援防水，同時支援 5G

谷歌冷門功能“書籤”將於 9 月 30 日停用，瀏覽器和地圖不受影響

9 月 18 日訊息根據網友投稿，谷歌冷門功能 Google 書籤，將於 2021 年 9 月 30 日後不再受支援。官方提示，要儲存已有的書籤，目前可以選擇手動匯出。谷歌這一功能與 Chrome 瀏覽器的書籤功能完全不同，曾被谷歌自

澳大利亞運營商暗示，谷歌 Pixel 6/Pro 將於 10 月 19 日推出

9 月 22 日訊息幾周前，谷歌分享了一張 Pixel 6 手機的圖片，上面顯示的是 10 月 19 日“星期二” 的日期。據 gsmarena 報道，澳大利亞電信運營商 Telstra 在 Facebook 上釋出了一則 Pixel 6/Pro 的廣告，同樣出現了

谷歌 Android 開發者峰會將於 10 月 27 日召開

9 月 30 日消息穀歌今年最大的開發者大會是谷歌 I/O，在會上推出了大量新服務和對現有服務的升級。不過，按照谷歌的體量，無法在 I/O 大會上公佈所有專案，所以谷歌打算再來三場開發者峰會，分別是：Android 開發者

谷歌新引擎可將深度學習提速 1000 倍：1 個 GPU 幾分鐘搞定強化學習訓練

三種策略避免邏輯分支

速度最高提升 1000 倍

相關推薦