強化學習AI，20分鐘可學會開自動駕駛汽車

阿新 • • 發佈：2019-01-11

640?wx_fmt=gif

本文由人工智慧觀察編譯

譯者：Sandy

據外媒報道，來自英國的一組研究人員在短短20分鐘之內就教會了一輛自動駕駛汽車在正確車道上行駛——這是一個令人印象深刻的壯舉，畢竟人類司機永遠無法達到一個這樣的成績。

Wayve是一家由劍橋大學工程學院的研究人員建立的公司，該公司於6月28日在一篇部落格文章中詳細闡述了其“強化學習”演算法。可以說，是一名人類安全駕駛員與這個演算法一起，用了15-20的分鐘時間，教會了一輛自動駕駛汽車如何保持在正確的車道上。

事實上，人工智慧的強化學習在之前就已經被證明是非常有效的學習手段了。舉個例子，DeepMind的技術顯示，它可以讓AI學會下圍棋或象棋，而OpenAI則教會了人工智慧玩Dota 2，並且每天的訓練量可達人類180年的遊戲量。

在圍棋或者Dota 2這樣的複雜遊戲中擊敗人類玩家固然令人感到驚訝，但是教一輛車學會自動駕駛無疑是另一個重要的里程碑。該研究小組在YouTube上釋出了一段視訊，展示了其人工智慧系統的學習過程，並表示這是“自動駕駛汽車領域利用強化學習的第一案例”。

一開始，這輛車就像一個新生兒學習在臺階上行走。當汽車逐漸偏離路線時，坐在車上的安全駕駛員就會介入，掌控方向盤，將它引回正確的軌道。對演算法來說，它會發現，每次被介入都是因為自己出錯了，同時還會因為不受干預的情況下行駛的距離受到“獎勵”。

視訊講述了一種被用作“深度卷積神經網路”（Deep Convolution Neural Network）的模型。該模型接收單個影象輸入，只使用一個GPU進行處理。與其他自動駕駛汽車不同的是，Wayve改裝的雷諾汽車不需要“大量的感測器以及無盡的資料”，而是根據該公司的理念，利用了“可以快速進行有效學習的聰明的訓練過程”。

Wayve的聯合創始人Amar Shah今年5月接受TechCrunch的採訪時表示，他們希望給汽車以更好地大腦，而不是更多的硬體。同時，根據Wayve的官方說法，這些演算法正在變得越來越聰明。

接下來，他們計劃進一步擴大這項技術，以完成更復雜的駕駛任務，而不僅僅是停留在車道上，最終希望這個系統可以“駕馭交通訊號燈，行駛在環形車道以及交叉路口”。

（文中圖片來自網路）

投稿、約訪、合作，聯絡郵箱[email protected]

新增微信aixiaozhijun，更多交流或進AI觀察團

強化學習AI，20分鐘可學會開自動駕駛汽車

強化學習AI，20分鐘可學會開自動駕駛汽車

從蘋果店員到機器學習工程師：學習AI，我是這樣起步的

Google釋出“多巴胺”開源強化學習框架，三大特性全滿足

這裡是強化學習入門，的入門 | 絕對新手友好

陳俊龍：從深度強化學習到寬度強化學習—結構，演算法，機遇及挑戰

強化學習入門基礎——馬爾可夫決策過程（MDP）

強化學習入門基礎-馬爾可夫決策過程（MDP）

7天自動收貨，30分鐘不支付訂單自動取消是如何實現的？

15天自動收貨，30分鐘不支付訂單自動取消是如何實現的？

馬斯克首次證實特斯拉正在研發AI芯片：用途不限於自動駕駛

百度和福特宣佈為期兩年的合作，在中國測試自動駕駛汽車

高德“牽手”吉利，用高精地圖助力自動駕駛發展

TactileMobility使用“觸覺感知”方案，為自動駕駛汽車實時提供路況資訊

端到端深度學習在自動駕駛汽車上的應用

鐳射雷達VS攝像頭，未來哪種會成為自動駕駛的核心感測器？

當自動駕駛汽車撞過來的時候，你希望它如何判斷？

AI強化學習正滲入“更高階學科”，比如心理學！

學習Git---20分鐘git快速上手

[深度學習]實現一個博弈型的AI，從五子棋開始（1）

不是說朝聞道夕死可矣嗎（如果你發現了自己的學習模式，願意學並且能堅持，我覺得沒什麽能阻擋你征服軟件世界的腳步），安曉輝大神的感悟

強化學習AI，20分鐘可學會開自動駕駛汽車

相關推薦