深度學習論文筆記（六）--- FCN-2015年（Fully Convolutional Networks for Semantic Segmentation）

阿新 • • 發佈：2019-02-04

深度學習論文筆記（六）--- FCN 全連線網路

FullyConvolutional Networks for Semantic Segmentation

Author：J Long ， E Shelhamer， T Darrell

Year： 2015

1、導引

通常CNN網路在卷積層之後會接上若干個全連線層, 將卷積層產生的特徵圖(feature map)對映成一個固定長度的特徵向量。以AlexNet為代表的經典CNN結構適合於影象級的分類和迴歸任務，因為它們最後都期望得到整個輸入影象的一個數值描述（概率），比如AlexNet的ImageNet模型輸出一個1000維的向量表示輸入影象屬於每一類的概率(softmax歸一化)。

而要做SemanticSegmentation（語義分割），希望能夠直接輸出一幅分割影象結果，所以就有了本篇FCN網路的提出。

2、模型解讀

①FCN將傳統CNN中的全連線層轉化成一個個的卷積層。如下圖所示，在傳統的CNN結構中，前5層是卷積層，第6層和第7層分別是一個長度為4096的一維向量，第8層是長度為1000的一維向量，分別對應1000個類別的概率。FCN將這3層表示為卷積層，卷積核的大小(寬，高，通道數)分別為（1,1，4096）、（1,1，4096）、（1,1，1000）。所有的層都是卷積層，故稱為全卷積網路。

②但是，經過多次卷積（還有pooling）以後，得到的影象越來越小,解析度越來越低。為了從這個解析度低的粗略影象恢復到原圖的解析度，FCN使用了增取樣操作。這個增取樣是通過反捲積來實現的（deconvolution），文中用的反捲積操作很簡單，後來有其他人就在反捲積這一步上做了進一步優化，使得分割結果更為準確。

③對第5層的輸出（32倍放大）反捲積到原圖大小，得到的結果還是不夠精確，還是有細節內容丟失了。於是作者採用skiplayer的方法，將第4層的輸出和第3層的輸出也依次反捲積，分別需要16倍和8倍上取樣，結果就精細一些了。下圖是這個卷積和反捲積上取樣的過程：

我們來把位置稍微調整一下利於理解：

在淺層處減小upsampling的步長，得到的finelayer 和高層得到的coarselayer做融合，然後再upsampling得到輸出。這種做法兼顧local和global資訊，即文中說的combiningwhat and where，取得了不錯的效果提升。FCN-32s為59.4，FCN-16s提升到了62.4，FCN-8s提升到62.7。可以看出效果還是很明顯的。

3、創新點分析

①由於沒有全連線層的存在，所以輸入影象的尺寸要求並不固定了。這個原因是因為全連線層是一個矩陣乘法的操作，可以自己去想一想。

②實現的是對每個畫素點的分類預測：

Pixel-wiseprediction

之所以能做到這樣，是因為卷積層的輸出的結果是datamap，而不是一個向量！經過反捲積後得到與原圖一樣大小的1000層heatmap，每一層代表一個類，然後觀察每個位置的畫素，在哪一層它這個點對應的值最大，就認為這個畫素點屬於這一層的類，

就比如圖中點貓那個位置的點，在tabby cat這個類的heatmap上表現的值很高，所以認為那一坨畫素點是屬於tabby cat這個類的。

從而這樣對每個畫素點進行分類，最後輸出的就是分割好的影象。

深度學習論文筆記（六）--- FCN-2015年（Fully Convolutional Networks for Semantic Segmentation）

深度學習論文筆記（六）--- FCN 全連線網路 FullyConvolutional Networks for Semantic Segmentation Author：J Long ， E Shelhamer， T Darrell Year： 2015 1、導

FCN筆記（Fully Convolutional Networks for Semantic Segmentation）

width height training 註意 die str 指標 his repl FCN筆記（Fully Convolutional Networks for Semantic Segmentation）（1）FCN做的主要操作 (a)將之前分類網絡的全連接

論文筆記《Fully Convolutional Networks for Semantic Segmentation》

FCN 的全稱是Fully Convolutional Networks，即全卷積網路。通常的CNN是在若干個卷積層之連線上若干個全連線層，將卷積層產生的特徵圖對映成一個固定長度的特徵向量。例如，AlexNet就是五個卷積層後面連線三個全連線層，它在Imagenet資料集上的輸出就是一個1000

FCN(Fully Convolutional Networks for Semantic Segmentation) 學習

FCN：全卷積神經網路，在神經網路中只有conv層（pooling act）將fc層的功能用conv層替代，更好地實現語義分割。 2016年發表在ieee上的大作。 fc層被替代有諸多好處，最直接的就是引數減少。輸入AlexNet, 得

深度估計 Fully Convolutional Networks for Semantic Segmentation

1.介紹該文講述的是語義分割，但思路和框架和深度恢復是十分相似的，畢竟當前語義和深度問題本質上是一個畫素級的分類問題。從該文3000+引用用量也可見該文章的巨大啟發效果。所謂全卷積網路，是指由僅由卷積層、池化層和非線性啟用函式層交錯組織起來的網路。作者的貢獻在於將

Fully Convolutional Networks for Semantic Segmentation論文閱讀

FCN： Fully Convolutional Networks for Semantic Segmentation 作者：Jonathan Long， Evan Shelhamer ，Trevor Darrell UC Berkeley [pdf]—C

深度學習論文筆記：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes

這篇文章將深度學習演算法應用於機械故障診斷，採用了“小波包分解+深度殘差網路(ResNet)”的思路，將機械振動訊號按照故障型別進行分類。文章的核心創新點：複雜旋轉機械系統的振動訊號包含著很多不同頻率的衝擊和振盪成分，而且不同頻帶內的振動成分在故障診斷中的重要程度經常是不同的，因此可以按照如下步驟設計深度

【深度學習論文筆記】Deep Neural Networks for Object Detection

論文:<<Deep Neural Networks for Object Detection>> 作者:Christian Szegedy Al

[深度學習論文筆記][總結]Invariant gait feature extraction based on image transformation

近期有兩篇來自於同一第一作者單位的工作，使用基於神經網路的影象變換模型來處理不同視角、不同衣著或手持物的CEI特徵到統一的90°正常特徵(SPAE與GaitGAN)。在這裡加以簡單總結與對比。 [Neurocomputing 17] Invariant fea

[深度學習論文筆記][AAAI 18]Accelerated Training for Massive Classification via Dynamic Class Selection

[AAAI 18] Accelerated Training for Massive Classification via Dynamic Class Selection Xingcheng Zhang, Lei Yang, Junjie Yan, Dahua

[深度學習論文筆記][Image Classification] 影象分類部分論文導讀

[ImageNet] • Over 15M labeled high resolution images. • Roughly 22k categories.• Collected from web and labeled by Amazon Mechanical Turk

[深度學習論文筆記][Visualizing] 網路視覺化部分論文導讀

There are several ways to understanding and visualing CNN 1 Visualizing Activations Show the activations of the network during the forwar

[深度學習論文筆記] Convolutional Neuron Networks and its Applications

In artificial intelligence, there exists a Moravec’s Paradox, 1 “High-level reasoning requires very little computation, but low-level sen

[深度學習論文筆記][arxiv 1804]ExFuse: Enhancing Feature Fusion for Semantic Segmentation

[arxiv 1804]ExFuse: Enhancing Feature Fusion for Semantic Segmentation Zhenli Zhang, Xiangyu Zhang, Chao Peng, Dazhi Cheng, Jian S

[深度學習論文筆記][CVPR 18]Path Aggregation Network for Instance Segmentation

[CVPR 18]Path Aggregation Network for Instance Segmentation Shu Liu, Lu Qi, Haifang Qin, Jianping Shi and Jiaya Jia from CUHK, P

深度學習研究理解6:OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks

本文是紐約大學Yann LeCun團隊中Pierre Sermanet ，David Eigen和張翔等在13年撰寫的一篇論文，本文改進了Alex-net，並用影象縮放和滑窗方法在test資料集上測試網路；提出了一種影象定位的方法；最後通過一個卷積網路來同時進行分類，定位和

CVPR2018論文解析之《Fully Convolutional Adaptation Networks for Semantic Segmentation》(全卷積適配網路)

論文網址：Fully Convolutional Adaptation Networks for Semantic Segmentation 1.摘要：問題：收集大量畫素級標記的資料是一個費事費力的過程，一個比較好的選擇是使用合成數據，比如遊戲視訊，來自動產生標籤。

Fully Convolutional Instance-aware Semantic Segmentation論文解讀

進入2017年之後，深度學習計算機視覺領域有了新的發展。在以往的研究中，深度神經網路往往是單任務的，比如影象分類(AlexNet, VGG16等等)，影象分割(以FCN為代表的一眾論文)，目標檢測(R-CNN，Fast R-CNN和Fatser R-CNN，以及後來的YOLO和SSD，目標檢測領域已

【筆記】SPP-Net : Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

基於空間金字塔池化的卷積神經網路物體檢測論文：http://xueshu.baidu.com/s?wd=paperuri%3A%28c51f05992150d24c15f0dabf0913382e%29&filter=sc_long_sign&tn=SE

[深度學習論文閱讀]Facenet論文閱讀筆記（包括GoogLenet引數計算方式）

1 統述功能：face verification (is this the same person) recognition (who is this person) clustering (find common people among

深度學習論文筆記（六）--- FCN-2015年（Fully Convolutional Networks for Semantic Segmentation）

深度學習論文筆記（六）--- FCN 全連線網路

1、 導引

2、模型解讀

3、 創新點分析

相關推薦

1、導引

3、創新點分析