1. 程式人生 > >強化學習AI,20分鐘可學會開自動駕駛汽車

強化學習AI,20分鐘可學會開自動駕駛汽車

640?wx_fmt=gif

本文由人工智慧觀察編譯

譯者:Sandy

據外媒報道,來自英國的一組研究人員在短短20分鐘之內就教會了一輛自動駕駛汽車在正確車道上行駛——這是一個令人印象深刻的壯舉,畢竟人類司機永遠無法達到一個這樣的成績。

Wayve是一家由劍橋大學工程學院的研究人員建立的公司,該公司於6月28日在一篇部落格文章中詳細闡述了其“強化學習”演算法。可以說,是一名人類安全駕駛員與這個演算法一起,用了15-20的分鐘時間,教會了一輛自動駕駛汽車如何保持在正確的車道上。

事實上,人工智慧的強化學習在之前就已經被證明是非常有效的學習手段了。舉個例子,DeepMind的技術顯示,它可以讓AI學會下圍棋或象棋,而OpenAI則教會了人工智慧玩Dota 2,並且每天的訓練量可達人類180年的遊戲量。

在圍棋或者Dota 2這樣的複雜遊戲中擊敗人類玩家固然令人感到驚訝,但是教一輛車學會自動駕駛無疑是另一個重要的里程碑。該研究小組在YouTube上釋出了一段視訊,展示了其人工智慧系統的學習過程,並表示這是“自動駕駛汽車領域利用強化學習的第一案例”。

一開始,這輛車就像一個新生兒學習在臺階上行走。當汽車逐漸偏離路線時,坐在車上的安全駕駛員就會介入,掌控方向盤,將它引回正確的軌道。對演算法來說,它會發現,每次被介入都是因為自己出錯了,同時還會因為不受干預的情況下行駛的距離受到“獎勵”。

視訊講述了一種被用作“深度卷積神經網路”(Deep Convolution Neural Network)的模型。該模型接收單個影象輸入,只使用一個GPU進行處理。與其他自動駕駛汽車不同的是,Wayve改裝的雷諾汽車不需要“大量的感測器以及無盡的資料”,而是根據該公司的理念,利用了“可以快速進行有效學習的聰明的訓練過程”。

Wayve的聯合創始人Amar Shah今年5月接受TechCrunch的採訪時表示,他們希望給汽車以更好地大腦,而不是更多的硬體。同時,根據Wayve的官方說法,這些演算法正在變得越來越聰明。

接下來,他們計劃進一步擴大這項技術,以完成更復雜的駕駛任務,而不僅僅是停留在車道上,最終希望這個系統可以“駕馭交通訊號燈,行駛在環形車道以及交叉路口”。

(文中圖片來自網路

640?wx_fmt=png

投稿、約訪、合作,聯絡郵箱[email protected]

新增微信aixiaozhijun,更多交流或進AI觀察團

640?wx_fmt=gif

相關推薦

強化學習AI20分鐘學會自動駕駛汽車

本文由人工智慧觀察編譯譯者:Sandy據外媒報道,來自英國的一組研究人員在短短20分鐘之內就教會

從蘋果店員到機器學習工程師:學習AI我是這樣起步的

機器學習工程師的職位並不只是為 AI 博士準備的:通過網路上公開的課程和視訊,人們可以學習人工智慧領域的基礎知識、培養寫程式碼的能力,最終找到 AI 領域的相關工作——只要你不輕言放棄。本文中,這位名為 Daniel Bourke 的小哥介紹了自己從零開始的心路歷程。 我曾經在蘋果商店

Google釋出“多巴胺”開源強化學習框架三大特性全滿足

編譯整理 | Just編輯 | 阿司匹林來源:AI科技大本營強化學習是一種非常重要 AI 技

這裡是強化學習入門的入門 | 絕對新手友好

原作:Thomas Simonini牆化栗子 編譯自 FreeCodeCamp量子位 出品 |

陳俊龍:從深度強化學習到寬度強化學習—結構演算法機遇及挑戰

來源:AI科技評論摘要:如何賦予機器自主學習的能力,一直是人工智慧領域的研究熱點。強化學習與寬度

強化學習入門基礎——馬爾夫決策過程(MDP)

## MDP背景介紹 ### Random Variable **隨機變數(Random Variable)**,通常用大寫字母來表示一個隨機事件。比如看下面的例子: $X$: 河水是鹹的 $Y$: 井水是甜的 很顯然,$Y$, $Y$兩個隨機事件是沒有關係的。也就是說$X$和$Y$之間**是相互獨

強化學習入門基礎-馬爾夫決策過程(MDP)

> 作者:YJLAugus 部落格: https://www.cnblogs.com/yjlaugus 專案地址:https://github.com/YJLAugus/Reinforcement-Learning-Notes,如果感覺對您有所幫助,煩請點個⭐Star。 ## MDP背景介紹 ### R

7天自動收貨30分鐘不支付訂單自動取消是如何實現的?

1.我們以支付以後7天自動收貨為例來說明下: (1)使用者支付完成以後,把訂單ID插入到記憶體的一個DelayQueue中,同時插入到Redis中。 (2)7天之內,使用者點選了確認收貨,則從DelayQueue中刪除,從Redis中刪除。 (3)超過7天,DelayQue

15天自動收貨30分鐘不支付訂單自動取消是如何實現的?

(1)使用者支付完成以後,把訂單ID插入到記憶體的一個DelayQueue中,同時插入到Redis中。(2)15天之內,使用者點選了確認收貨,則從DelayQueue中刪除,從Redis中刪除。(3)超過7天,DelayQueue中的訂單ID出隊,查詢資料庫,改狀態為自動收貨

馬斯克首次證實特斯拉正在研發AI芯片:用途不限於自動駕駛

lfw post targe gpo xls class lan body zzu 44暇蒂鐐k8副嘏裁yg瘸酥訊http://6jjzs.wikidot.com/3r鼐棺源9h話推叭t5路漣輝http://nlyjzb.wikidot.com/2c姆腿何ei尚瑯腋us扒囤

百度和福特宣佈為期兩年的合作在中國測試自動駕駛汽車

百度和福特汽車公司今天宣佈啟動為期兩年的聯合自動駕駛汽車測試專案,兩家公司將進一步推動該專案的開發,並在中國進行自動駕駛汽車道路試驗。 此次合作與福特進一步推進和推廣自動駕駛汽車技術的計劃保持一致,支援公司設計智慧汽車的願景。 “與百度等領先的技術合作夥伴合作,使我們能夠利用中國的新機

高德“牽手”吉利用高精地圖助力自動駕駛發展

近日,在阿里巴巴2018全球投資者大會上,阿里巴巴合夥人、高德地圖總裁劉振飛透露,高德與吉利在高精地圖領域達成全面合作。 有利於吉利汽車自動駕駛的發展 近年來無論是新興的一些造車企業還是傳統的車企都在向自動駕駛發展,時下,發展自動駕駛儼然成為了個大汽車製造商爭奪的一個

TactileMobility使用“觸覺感知”方案自動駕駛汽車實時提供路況資訊

Tactile Mobility(以前的MobiWize)是一家位於以色列海法的創業公司,成立於2012年,開發了一種稱為“觸覺感知”的解決方案。通過收集非可視資料,如車輪速度,車輪角度,轉速,槳位和齒輪定位和執行復雜的分析,它能夠實時生成可操作的見解。 該公司今天公佈

端到端深度學習自動駕駛汽車上的應用

在最近的一款汽車應用產品中,我們用卷積神經網路(CNNs)將車前部攝像頭捕捉到的原始畫素圖對映為汽車的方向操控命令。這種強大的端到端技術意味著,只需要人們提供少量的訓練資料,系統就能自動學會駕駛技術,無論有沒有車道標誌線,無論是在普通公路還是高速公路。這套系統還可以工作在視線不清晰的區域,比如停車場或者崎

鐳射雷達VS攝像頭未來哪種會成為自動駕駛的核心感測器?

當自動駕駛車輛行駛上路時,不僅需要它能看懂交通標誌、注意路況、檢測物件,還需要它能感知速度/軌跡及其他車輛,這時就要依靠它的眼睛——感測器了。無論是攝像頭、雷達、超聲波、GPS天線,還是利用光脈衝測距的光達(Lidar)元件,每一種感測器都有其優缺點。但在未來,哪種感測器會脫

自動駕駛汽車撞過來的時候你希望它如何判斷?

關注網易智慧,聚焦AI大事件,讀懂下一個大時代!【網易智慧訊 11月3日訊息】據國外媒體報道,當

AI強化學習正滲入“更高階學科”比如心理學!

全文共2359字,預計學習時長5分鐘 圖片來源:pexels.com/@pixabay 最近,拉斯維加斯舉行了AWSre:

學習Git---20分鐘git快速上手

diff 是什麽 學習 改變世界 ren ont 其中 網線 復雜 學習Git-----20分鐘git快速上手 (圖片已修復)在Git如日中天的今天,不懂git都不好意思跟人說自己是程序猿。你是不是早就躍躍欲試了,只是苦於沒有借口(契機)。 好吧,機會就在今

[深度學習]實現一個博弈型的AI從五子棋開始(1)

com class svm 顏色 display 深度 images += have 好久沒有寫過博客了,多久,大概8年???最近重新把寫作這事兒撿起來……最近在折騰AI,寫個AI相關的給團隊的小夥伴們看吧。 搞了這麽多年的機器學習,從分

不是說朝聞道夕死矣嗎(如果你發現了自己的學習模式願意學並且能堅持我覺得沒什麽能阻擋你征服軟件世界的腳步)安曉輝大神的感悟

說我 服務器 摘錄 syn 給他 sync 外包 學習曲線 有限公司 從技術支持中途轉戰軟件開發,如今從事編程工作已十多有余,2014年CSDN博文大賽編程語言組冠軍、CSDN Qt論壇的版主安曉輝老師從今天開始,坐鎮CSDN社區問答欄目的 第十四期,屆時會接受廣大網友的提