高光譜影象輸入卷積神經網路的維度問題

阿新 • • 發佈：2019-01-21

現在處理高光譜影像大多使用3D-CNN，對於高斯光譜資料而言，輸入網路模型的shape是（x,y,z）這種形式，x，y是長寬尺寸，而z是光譜維度，IN資料集一般是200，UP資料集一般是103。

keras中Conv2D的輸入張量尺寸：(samples, rows, cols, channels)

Conv3D的輸入張量尺寸：(samples, conv_dim1, conv_dim2, conv_dim3, channels)

Conv2D的輸入應該是一個4D，第一維是batch，後面三維是長，寬，三基色，這個在高分影像資料集上就是這樣，和普通光學影像的輸入沒有什麼區別。

Conv3D的輸入是一個5D，第一維也是batch，最後一維也是通道，通道通常會和後面的濾波器的核的個數相關聯，卷積核數目的變化就在這個維度上，對於高光譜資料來說，輸入的channel，我們通常處理成1，以IN為例的話，也就是（1，224,224,200），batch這個維度在實際運算中會有體現。

Conv3D的卷積核操作和Conv2D是有區別的，Conv2D利用一個滑窗在卷積上滑動，產生feature map，有多少個核就產生多少個feature map。但是Conv3D是沿著光譜維度進行運算，同時在空間上進行滑窗操作，產生的同樣是三維的feature map，有多少核就產生多少個feature map。

高光譜影象輸入卷積神經網路的維度問題

高光譜影象輸入卷積神經網路的維度問題

基於深度卷積神經網路的高光譜遙感影象分類---PCA+2D-CNN(偽空譜特徵)

深度學習、影象識別入門，從VGG16卷積神經網路開始

機器學習筆記（十二）：TensorFlow實戰四（影象識別與卷積神經網路）

基於卷積神經網路特徵圖的二值影象分割

基於cifar10實現卷積神經網路影象識別

卷積神經網路經過卷積之後的影象尺寸

cs231n 卷積神經網路與計算機視覺 1 基礎梳理與KNN影象分類

機器學習筆記（十二）：TensorFlow實現四（影象識別與卷積神經網路）

基於深度卷積神經網路（D-CNN）的影象去噪方法

卷積神經網路CNN（1）——影象卷積與反捲積（後卷積，轉置卷積）

MatConvNet卷積神經網路（三）【影象滑動窗】

機器學習：利用卷積神經網路實現影象風格遷移 (一)

卷積神經網路系列之softmax loss對輸入的求導推導

快速理解卷積神經網路的輸入輸出尺寸問題

全卷積神經網路影象分割(U-net)-keras實現

第4門課程-卷積神經網路-第四周作業(影象風格轉換)

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層

深度學習：卷積神經網路與影象識別基本概念

深度卷積神經網路影象風格變換 Deep Photo Style Transfer

高光譜影象輸入卷積神經網路的維度問題

相關推薦