百度論文研究：單目攝像頭實時感知車輛形狀，顯著提高 3D 目標檢測效能

阿新 • • 發佈：2021-09-04

通常，自動駕駛汽車通過單目攝像頭看到的世界長這個樣子：

馬路上的其他車輛、物體，都被統一建模成一個個立方體，具體的結構細節則被忽略。

想要更精準地勾勒出車輛的真實形態，當然也不是不行，但那就需要用上鐳射雷達、雙目相機等更加昂貴的感測器。

不過現在，一項最新研究賦予了單目攝像頭新的能力 ——

是的，僅憑單目相機，就能實時感知物體的 3D 形狀，進而提高 3D 目標檢測效能。

這項研究來自百度，論文已經入選 ICCV 2021。

考慮 2D/3D 形狀感知約束的 3D 檢測框架

具體如何實現？

大體上可以分為三步：

首先，引入 CAD 模型，在 CAD 模型上預先定義幾個不同的 3D 關鍵點。
然後利用深度學習網路，來建立 3D 關鍵點和它們在影象上的 2D 投影之間的關聯。
最後，利用這樣的對應關係為每個目標物體建立 2D/3D 約束。

整體的網路架構如上圖所示，8 個分支頭分別對應中心點分類、中心點偏移、2D 關鍵點、3D 座標、關鍵點置信度、物體方向、維度，以及 3D 檢測置信度得分。所有迴歸資訊最後都會被用來恢復物體在攝像機座標中的 3D 邊界框。

而為了自動生成 2D/3D 關鍵點的真實標註，研究人員還提出了一種自動模型擬合方法。也就是根據攝像頭觀測到的 2D 影象，自動擬合不同的 3D 物體模型和物體掩碼。

具體而言，該方法是基於不同種類的車輛 CAD 模型，以及 KITTI 資料集中的 3D 物體樣本實現的。

研究人員指出，實際上，3D 形狀標註的過程可以看作一個優化問題，其目的是計算出最佳引數組合，來適應 AI 通過“視覺觀察”得到的結果（如 2D 物體掩碼、3D 邊界框、3D 點雲等）。

實驗結果

研究人員在 KITTI 3D 目標檢測基準上測試了這一新方法的效能。

KITTI 3D 目標檢測基準包含 7481 張訓練影象、7518 張測試影象，以及對應的點雲，總共包括 80256 個標記物件。

在這項研究中，由於測試集的真實資料不可用，研究人員將訓練資料分為訓練集（3712 個樣本）和驗證集（3769 個樣本），用以完善模型。

另外，用以測試的模型是在 2 塊英偉達 V100 上訓練完成的，批量大小設為 16。

△紅色代表最佳結果，藍色代表次佳結果

可以看到，在全部 6 個任務中，採用了 48 個關鍵點的 AutoShape 方法取得了 4 項第一。而採用 16 個關鍵點的 AutoShape 速度更快，準確性損失也並不大。

此外，從上圖中可以看出，模型預測的 3D 形狀與真實物體一致性較高。

即使是畫面中位置較遠的車輛、被截斷/遮擋的物體，其位置也能被準確檢測到。

總而言之，相比於其他現有方法，AutoShape 更準確，並且推理速度更快，可以達到 25FPS 的處理速度，也就是說可以實現實時檢測的效果。

論文地址：

https://arxiv.org/abs/2108.11127

專案地址：

https://github.com/zongdai/AutoShape

百度論文研究：單目攝像頭實時感知車輛形狀，顯著提高 3D 目標檢測效能

通常，自動駕駛汽車通過單目攝像頭看到的世界長這個樣子：馬路上的其他車輛、物體，都被統一建模成一個個立方體，具體的結構細節則被忽略。

百度 MEG 轉型：銷售體系全調整拆分九部門，“收入模式要更多元”

新浪科技通過百度內部人士獲悉，百度移動生態事業群（MEG）於近日啟動了銷售體系全面調整，百度 MEG 銷售體系將分為九個部分，百度將重點設立大眾消費類、大健康類、內容消費類、商務服務類四個行業部門，以及渠道生

體驗百度無人車：時速不超60km/時，線路單一候車時間長

10 月 12 日下午訊息，昨日，百度宣佈其自動駕駛出租車服務在北京全面開放，市民可在北京經濟技術開發區、海淀區、順義區的數十個自動駕駛出租車站點，無需預約，直接下單免費試乘自動駕駛出租車服務。

百度吳甜：自研晶片在搜尋引擎部署，已培養超 100 萬名 AI 人才

10 月 14 日下午訊息，2020 中國國際資訊通訊展覽會今日開幕，在數字經濟領導者論壇上，百度副總裁吳甜發表主旨演講。

百度陶吉：無人計程車在北京全面鋪開，乘客普遍持認可態度

一週前，百度宣佈北京使用者可通過百度地圖及 Apollo GO APP 一鍵呼叫自動駕駛出租車服務 Apollo GO，測試區域總長度約 700 公里，覆蓋亦莊、海淀、順義的生活圈和商業圈等數十個站點。

百度(外推接)單代)(發資料結構第一節（初步認識）——三個小題

三個小題 01-複雜度1 最大子列和問題 (20point(s))# 給定K個整陣列成的序列{ N1, N2, ..., NK }，“連續子列”被定義為{ Ni, Ni+1, ..., Nj}，其中 1≤i≤j≤K。“最大子列和”則被定義為所有連續子列

百度魏東：“蘿蔔快跑”無人車出行要像網約車一樣好用，2023 年開放 30 城

8 月 18 日，以“AI 這時代，星辰大海”為主題的 2021 百度世界大會在京召開，本次大會由總檯央視主持人撒貝南擔任主持，在 3 個小時的直播中展示百度人工智慧在出行、生活、產業、自主創新等領域如何改善社會民生。

百度魏東：自動駕駛終極目標是比人類駕駛安全 100 倍，消除 90% 以上交通事故

11 月 12 日下午訊息，百度智慧駕駛事業群副總裁、首席安全運營官魏東指出，自動駕駛助力城市交通和出行消費高質量發展有三個關鍵指標。首先，自動駕駛技術要比人類駕駛更安全，消除 90% 以上交通事故。其次，“智慧

OPPO Air Glass 新一代智慧眼鏡釋出：單目分體式設計，重量不到 30g

12 月 14 日訊息，OPPO 未來科技大會2021 今天下午正式開幕（直播），除了自研晶片馬里亞納 MariSilicon X 之外，OPPO 還發布了新一代智慧眼鏡 ——OPPO Air Glass。OPPO稱，作為 OPPO 三年來推出的第三代智慧眼鏡，

python+selenium+bs4爬取百度文庫內文字 && selenium 元素可以定位到，但是無法點選問題 && pycharm多行縮排、左移

先說一下可能用到的一些python知識一、python中使用的是unicode編碼, 而日常文字使用各類編碼如:gbk utf-8 等等所以使用python進行文字讀寫操作時候經常會出現各種錯誤, 一般都是操作時沒有進行轉碼操作.而轉碼則需

（C++11/14/17學習筆記）：單例設計模式共享資料分析，call_once()函式

技術標籤：C++11/14/17 目錄單例設計模式共享資料分析、解決，call_once 設計模式大概談

進百度公司10道Java面試題虐哭小李，面試直接泡湯（上集）

有一天，小李告訴我，他去一家公司面試 Java 崗，結果被面試官虐哭了。整整 10 道 Java 面試題，小李一道也沒答正確。

百度確認AI晶片崑崙業務完成新一輪融資，估值20億美元

3 月 15 日訊息，據路透報道，百度 AI 晶片部門崑崙完成了新一輪融資，估值為 20 億美元。一位訊息人士稱，此次募資是在百度著力推進人工智慧晶片設計和製造之際進行的，由中國私募股權投資公司中信私募基金管理公司

當微短劇成為人設“工具”：單集預算飆漲 50 萬，賺錢要靠帶貨

探索了一段時間後，今年年初，陳寧的公司放棄了微短劇業務。背後原因錯綜複雜，他感覺，短劇成為風口以來，市場仍舊在炒概念，而商業化路徑還沒有人跑通，這多少說明了一定的問題。

中興官宣：屏下攝像頭手機 Axon 30 5G，即將登場

7 月 5 日訊息中興手機官方宣佈，中興 Axon 30 5G 全新一代屏下攝像頭手機，即將登場。從官方海報來看，屏下攝像頭技術已較為成熟，前置攝像頭從上方斜看不可見。

百度宣佈 ERNIE 3.0 重新整理 54 個 NLP 任務基準，複雜語言理解超人類 0.8%

7 月 6 日晚間訊息，百度ERNIE 於近期升級到 3.0，重磅釋出知識增強的百億引數大模型。該模型除了從海量文字資料中學習詞彙、結構、語義等知識外，還從大規模知識圖譜中學習。

新研究：人體細胞內的細菌祖先線粒體，會導致神經和精神疾病

北京時間 8 月 10 日訊息，據國外媒體報道，線粒體是大腦健康的關鍵因素嗎？一些研究人員懷疑線粒體作為人體細胞內的細菌祖先，可能導致了廣泛的神經和精神疾病。

美國大學研究：經常使用谷歌搜尋引擎的使用者，對自己的智商更“謎之自信”

北京時間 10 月 30 日訊息，搜尋引擎是了不起的工具，不過，通過敲幾下鍵盤就能找到關心問題的答案，會使使用者高估自己的聰明程度。美國德州大學的一項研究顯示，對於經常使用谷歌搜尋服務的使用者，即使不使用它，

小米“旋出式攝像模組”相關專利獲授權：可加快攝像頭的旋出速度，提升全面屏手機使用體驗

11 月 23 日訊息，北京小米移動軟體有限公司“旋出式攝像模組及終端”專利在今日獲得授權，授權公告號為 CN111866329B。企查查專利摘要顯示，本公開提供了一種旋出式攝像模組及終端，屬於電子裝置領域。在終端上，設

百度宣佈“蘿蔔快跑”自動駕駛出行服務落地深圳，實現超一線城市全覆蓋

2 月 17 日下午訊息，百度 Apollo 自動駕駛出行服務平臺“蘿蔔快跑”正式落地深圳市創新高地 —— 南山區，面向市民提供自動駕駛示範應用出行服務。至此，百度已實現對北上廣深超一線城市的服務全覆蓋。據介紹，“蘿

百度論文研究：單目攝像頭實時感知車輛形狀，顯著提高 3D 目標檢測效能

考慮 2D/3D 形狀感知約束的 3D 檢測框架

實驗結果

相關推薦