1. 程式人生 > >高光譜影象輸入卷積神經網路的維度問題

高光譜影象輸入卷積神經網路的維度問題

現在處理高光譜影像大多使用3D-CNN,對於高斯光譜資料而言,輸入網路模型的shape是(x,y,z)這種形式,x,y是長寬尺寸,而z是光譜維度,IN資料集一般是200,UP資料集一般是103。

keras中Conv2D的輸入張量尺寸:(samples, rows, cols, channels)

Conv3D的輸入張量尺寸:(samples, conv_dim1, conv_dim2, conv_dim3, channels)

Conv2D的輸入應該是一個4D,第一維是batch,後面三維是長,寬,三基色,這個在高分影像資料集上就是這樣,和普通光學影像的輸入沒有什麼區別。

Conv3D的輸入是一個5D,第一維也是batch,最後一維也是通道,通道通常會和後面的濾波器的核的個數相關聯,卷積核數目的變化就在這個維度上,對於高光譜資料來說,輸入的channel,我們通常處理成1,以IN為例的話,也就是(1,224,224,200),batch這個維度在實際運算中會有體現。

Conv3D的卷積核操作和Conv2D是有區別的,Conv2D利用一個滑窗在卷積上滑動,產生feature map,有多少個核就產生多少個feature map。但是Conv3D是沿著光譜維度進行運算,同時在空間上進行滑窗操作,產生的同樣是三維的feature map,有多少核就產生多少個feature map。

相關推薦

no