基於DL的目標檢測技術：R-CNN、Fast R-CNN、Faster R-CNN

阿新 • • 發佈：2018-11-27

目標檢測：在給定的圖片中精確找到物體所在位置，並標註出物體的類別。
目標檢測=影象識別（CNN）+定位（迴歸問題/取影象視窗）

遇到多物體識別+定位多個物體？
用選擇性搜尋找出可能含有物體的框（候選框）判定得分。這些框之間是可以互相重疊互相包含的，從而避免暴力列舉的所有框了。

1.R-CNN

步驟一：訓練（或者下載）一個分類模型（比如AlexNet）
步驟二：對該模型做fine-tuning

修改分類數
去掉最後一個全連線層

步驟三：特徵提取

提取影象的所有候選框（選擇性搜尋）
對於每一個區域：修正區域大小以適合CNN的輸入，做一次前向運算，將第五個池化層的輸出（就是對候選框提取到的特徵）存到硬碟

步驟四：訓練一個SVM分類器（二分類）來判斷這個候選框裡物體的類別

每個類別對應一個SVM，判斷是不是屬於這個類別，是就是正類，反之負類

步驟五：訓練一個迴歸器精細修正候選框位置：對於每一個類，訓練一個線性迴歸模型去判定這個框是否框得完美。
在這裡插入圖片描述

速度瓶頸

計算機對所有候選框進行特徵提取時會有重複計算。

2.Fast R-CNN

在RCNN的基礎上採納了SPP Net方法（空間金字塔池化）

整張圖輸入CNN提取一次特徵
找出每個候選框在feature map上的對映patch

速度瓶頸

選擇性搜尋，找出所有的候選框這個過程也耗時

3.Faster R-CNN

在Fast R-CNN的基礎上加入一個提取候選區域的網路RPN(Region Proposal Network)，代替了費時的選擇性搜尋，使得檢測速度大幅提高。

具體做法

將RPN放在CNN最後一個卷積層的後面
RPN直接訓練得到候選區域

RPN簡介

本質是 “ 基於滑窗的無類別目標檢測器 ” :
在feature map上滑動視窗產生錨點
建立一個神經網路用於物體分類+框位置的迴歸
滑動視窗的位置提供了物體的大體位置資訊
框位置的迴歸提供了框更精確的位置

基於DL的目標檢測技術：R-CNN、Fast R-CNN、Faster R-CNN

目標檢測：在給定的圖片中精確找到物體所在位置，並標註出物體的類別。目標檢測=影象識別（CNN）+定位（迴歸問題/取影象視窗）遇到多物體識別+定位多個物體？用選擇性搜尋找出可能含有物體的框（候選框）判定得分。這些框之間是可以互相重疊互相包含的，從而避免暴力列舉的所有框了。 1.R

基於深度學習的目標檢測技術演進：R-CNN、Fast R-CNN、Faster R-CNN

object detection我的理解，就是在給定的圖片中精確找到物體所在位置，並標註出物體的類別。object detection要解決的問題就是物體在哪裡，是什麼這整個流程的問題。然而，這個問題可不是那麼容易解決的，物體的尺寸變化範圍很大，擺放物體的角度，姿態不定，而且可以出現在圖片的任何地方，更何況物

目標檢測技術演進：Fast R-CNN、Faster R-CNN

在上一篇目標檢測技術演進：R-CNN、Fast R-CNN、Faster R-CNN 之 RCNN中，我講了 RCNN 演算法，似乎它的表現不太好，所以這次我們講講它的進化版 —— Fast RCNN 和 Faster RCNN。如果你還沒看上一篇，可以在我的部落格或者知乎檢視。

目標檢測技術演進：R-CNN、Fast R-CNN、Faster R-CNN 之 RCNN

這篇文章的內容總結翻譯自 A Step-by-Step Introduction to the Basic Object Detection Algorithms (Part 1) ，文中有加入自己的理解。當你想要在雜亂的桌子上面尋找鑰匙的時候，是不是有想過要是有種東西可以直接告訴我鑰

基於深度學習的目標檢測演算法：Faster R-CNN

問題引入： R-CNN、SPP net、Fast R-CNN等目標檢測演算法，它們proposals都是事先通過selecetive search方法得到。然而，這一過程將耗費大量的時間，從而影響目標檢測系統的實時性。Faster R-CNN針對這一問題，提

常用目標檢測演算法：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一、目標檢測常見演算法 object detection，就是在給定的圖片中精確找到物體所在位置，並標註出物體的類別。所以，object detection要解決的問題就是物體在哪裡以及是什麼的整個流程問題。

基於深度學習的目標檢測技術演進：從目標檢測到人臉檢測

本篇部落格主要轉載兩篇寫得好的分別介紹基於深度學習的目標檢測和人臉檢測的文章，最近在調研基於深度學習的人臉檢測相關的文章，在網上查相關資料時，有幸看到。文末附帶基於深度學習的目標檢測和人臉檢測相關經典文獻及下載地址。 object detection我

帶你深入AI（4）- 目標檢測領域：R-CNN，faster R-CNN，yolo，SSD, yoloV2

系列文章，請多關注 Tensorflow原始碼解析1 – 核心架構和原始碼結構自然語言處理1 – 分詞帶你深入AI（1） - 深度學習模型訓練痛點及解決方法帶你深入AI（2）- 深度學習啟用函式，準確率，優化方法等總結帶你深入AI（3）- 物體分類領域：AlexNet VGG I

【目標檢測】：SPP-Net深入理解（從R-CNN到SPP-Net）

一. 導論 SPP-Net是何凱明在基於R-CNN的基礎上提出來的目標檢測模型，使用SPP-Net可以大幅度提升目標檢測的速度，檢測同樣一張圖片當中的所有目標，SPP-Net所花費的時間僅僅是RCNN的百分之一，而且檢測的準確率甚至會更高。那麼SPP-Net是怎麼設計的呢？我們要想理解SPP-Net，先來回顧

人工智慧初學- 1.4 基於深度學習的目標檢測技術

目標檢測顧名思義，就是需要確定兩個特徵： 1，目標的位置 2，目標的類別即這個目標的具體位置是在哪裡，它是個什麼樣的東西。從影象識別的任務說起這裡有一個影象任務：既要把圖中的物體識別出來，又要用方框框出它的位置。 &n

基於神經網路的目標檢測論文之目標檢測系統：實時路況檢測系統的設計與實現

注：本文源自本人的碩士畢業論文，未經許可，嚴禁轉載！原文請參考知網：知網地址第五章實時路況檢測系統的設計與實現物體識別技術被廣泛應用於人們的生產生活中。隨著深度學習與雲端計算的飛速發展，帶動了物體識別技術產生質的飛躍。高解析度影象和檢測的實時性要求越來越

語義分割與目標檢測入門：若干經典工作綜述

語義分割從原理上來說，語義分割就是畫素級別的分類，傳統的方法也是直接按照這個思路來做的，效率比較低，而從FCN開始，語義分割有了相對比較專用的方法。 0. 重要的資料集：PASCAL VOC和COCO 1. FCN 用於影象（N×M）分類的網路前端用卷積層提取特徵，後端用全連線層進

SSD目標檢測(1)：圖片+視訊內的物體定位（附原始碼）

一、SSD用於圖片物體的定位與檢測 SSD原理介紹這一篇部落格對我的幫助比較大，很詳細的介紹了SSD原理，送給大家做了解 1、下載SSD框架原始碼 1.1

目標檢測安裝：SSD編譯時json_parser_read.hpp報錯

方法1：報錯原因: json_parser_read.hpp:257:264: error: ‘type name’ declared as function returning an array escape 因為是在公共伺服器上，沒有許可權修改json_parse

深度學習目標檢測系列：faster RCNN實現|附python原始碼

目標檢測一直是計算機視覺中比較熱門的研究領域，有一些常用且成熟的演算法得到業內公認水平，比如RCNN系列演算法、SSD以及YOLO等。如果你是從事這一行業的話，你會使用哪種演算法進行目標檢測任務呢？在我尋求在最短的時間內構建最精確的模型時，我嘗試了其中的R-CNN系列演算法，如果讀者們對這方面的

深度學習目標檢測系列：一文弄懂YOLO演算法|附Python原始碼

在之前的文章中，介紹了計算機視覺領域中目標檢測的相關方法——RCNN系列演算法原理，以及Faster RCNN的實現。這些演算法面臨的一個問題，不是端到端的模型，幾個構件拼湊在一起組成整個檢測系統，操作起來比較複雜，本文將介紹另外一個端到端的方法——YOLO演算法，該方法操作簡便且模擬速度快，效

目標檢測(一)：背景減法

目標檢測是將運動的物體從背景中檢測出來,人們希望設計能適用於各種監控環境,不受光照、天氣等外界因素影響的目標檢測演算法。但這種演算法難免複雜度大,現有一些演算法大多是針對某一類問題提出

目標檢測YOLO：YoloV3和之前版本的對比

轉載：http://www.cnblogs.com/makefile/p/YOLOv3.htmlKmeans計算anchors的方法：https://github.com/PaulChongPeng/darknet/blob/master/tools/k_means_yolo

SSD目標檢測(2)：如何製作自己的資料集（詳細說明附原始碼）

前言：因為要依賴上一章SSD目標檢測(1)：圖片+視訊版物體定位（附原始碼）來訓練預測自己的資料集，所以建立自己的資料集是一個複雜且避不開的步驟，以下給出了製作自己的資料集所要經過的簡單步驟，而後也有更詳細的說明奉上。 VOC2007資料集簡介；規定資料夾

SSD目標檢測(3)：使用自己的資料集做預測（詳細說明附原始碼）

前言：上兩章已經詳細介紹了SSD目標檢測(1)：圖片+視訊版物體定位（附原始碼），SSD目標檢測(2)：如何製作自己的資料集（詳細說明附原始碼）。由於SSD框架是開源的程式碼，自然有很多前輩研究後做了改進。我也不過是站在前輩的肩膀上才能完成這篇部落格，在這裡表示

基於DL的目標檢測技術：R-CNN、Fast R-CNN、Faster R-CNN

1.R-CNN

速度瓶頸

2.Fast R-CNN

速度瓶頸

3.Faster R-CNN

具體做法

RPN簡介

相關推薦