卷積層，池化層等，前向/反向傳播原理講解

阿新 • • 發佈：2018-03-24

簡單代碼構建 range expand 使用場景神經網絡右下角 body

今天閑來無事，考慮到以前都沒有好好研究過卷積層、池化層等等的前向/反向傳播的原理，所以今天就研究了一下，參考了一篇微信好文，講解如下：

參考鏈接：https://www.zybuluo.com/hanbingtao/note/485480

https://github.com/hanbt/learn_dl/blob/master/cnn.py

一、卷積層

（1）首先是卷積神經網絡中的卷積操作：

技術分享圖片

計算公式為：

技術分享圖片

註意上式的使用場景：stride = 1 , channel = 1

我們可以將其擴展到 stride = s , channel = d時的情況，這個時候公式如下：

技術分享圖片

（2）然後，我們再來看一下數學中的卷積操作，下面引入數學中的二維卷積公式：

技術分享圖片

對於如下的圖，數學中的卷積操作如下：

技術分享圖片

從上圖可以看到，A左上角技術分享圖片的值

（3）再來說說卷積層的前向、反向傳播：

首先是前向傳播：很簡單，直接使用互相關的公式計算即可；

然後是反向傳播：可以參考我之前作的關於全連接層的反向傳播過程，原理公式近似；

具體說一下反向傳播過程：

首先引入一道題：

技術分享圖片

可以發現，卷積層的反向傳播過程和全連接層的反向傳播過程真的是神似啊，只不過公式需要對應的修改一下；

這裏還要註意一點的是，步長stride = s和stride = 1時反向傳播的區別：

技術分享圖片

這裏面就涉及到了“擴展”和"zero padding"操作，在後面代碼中有所體現；

緊接著我們可以得到權重梯度和偏置項梯度如下：

技術分享圖片

好的，放出代碼了，如下：

import numpy as np 
from activators import 
 ReluActivator , IdentityActivator

#獲取卷積區域
def get_patch(input_array , i , j , filter_width , filter_height , stride):
    ‘‘‘
    從輸入數組中獲取本次卷積的區域，自動適配輸入為2D和3D的情況
    ‘‘‘
    start_i = i * stride
    start_j = j * stride
    if input_array.dim == 2:
        return input_array[start_i : start_i + filter_height , start_j : start_j + filter_width]
    elif input_array.dim == 3:
        return input_array[: , start_i : start_i + filter_height , start_j : start_j + filter_width]

#獲取一個2D區域的最大值的索引
def get_max_index(array):
    max_i = 0
    max_j = 0
    max_value = array[0 , 0]
    for i in range(array.shape[0]):
        for j in range(array.shape[1]):
            if(array[i , j] > max_value):
                max_value = array[i , j]
                max_i , max_j = i , j
    return max_i , max_j

#計算卷積，是互相關操作
def conv(input_array , kernel_array , output_array , stride , bias):
    ‘‘‘
    計算卷積，自動適配輸入為2D和3D的情況
    ‘‘‘
    channel_number = input_array.ndim
    output_width = output_array.shape[1]
    output_height = output_array.shape[0]
    kernel_width = kernel_array.shape[1]
    kernel_height = kernel_array.shape[0]
    for i in range(output_height):
        for j in range(output_width):
            output_array[i][j] = (
                get_patch(input_array , i , j , kernel_width ,
                    kernel_height , stride) * kernel_array).sum() + bias

#對數組增加zero padding
def padding(input_array , zp):
    ‘‘‘
    對數組增加zero padding，自動適配2D的情況
    ‘‘‘
    if zp == 0:
        retrun input_array
    else:
        if(input_array.ndim == 3):
            input_width = input_array.shape[2]
            input_height = input_array.shape[1]
            input_depth = input_array.shape[0]
            padded_array = np.zeros((input_depth , input_height + 2 * zp , input_width + 2 * zp))
            padded_array[: , zp : zp + input_height , zp : zp + input_width] = input_array
            return padded_array
        elif (input_array.ndim == 2):
            input_width = input_array.shape[1]
            input_height = input_array.shape[0]
            padded_array = np.zeros((input_height + 2 * zp , input_width + 2 * zp))
            padded_array[zp : zp + input_height , zp : zp + input_width] = input_array
            return padded_array

#對numpy數組進行element wise操作
def element_wise_op(array , op):
    for i in np.nditer(array , op_flags = [‘readwrite‘]):
        i[...] = op(i)

#卷積核類
class Filter(object):
    def __init__(self , width , height , depth):
        self.weights = np.random.uniform(-1e-4 , 1e-4 , (depth , height , width))
        self.bias = 0
        self.weights_grad = np.zeros(self.weights.shape)
        self.bias_grad = 0

    def __repr__(self):
        return ‘filter weights : \n%s\nbias : \n%s‘ % (repr(self.weights) , repr(self.bias))

    def get_weights(self):
        return self.weights

    def get_bias(self):
        return self.bias

    def update(self , learning_rate):
        self.weights -= learning_rate * self.weights_grad
        self.bias -= learning_rate * self.bias_grad

#卷積層類
class ConvLayer(object):

    def __init__(self , input_width , input_height , channel_number,
                 filter_width , filter_height , filter_number ,
                 zero_padding , stride , activator , learning_rate):
        self.input_width = input_width
        self.input_height = input_height
        self.channel_number = channel_number
        self.filter_width = filter_width
        self.filter_height = filter_height
        self.filter_number = filter_number
        self.zero_padding = zero_padding
        self.stride = stride
        self.output_width = ConvLayer.calculate_output_size(self.input_width , filter_width , zero_padding , stride)
        self.output_height = ConvLayer.calculate_output_size(self.input_height , filter_height , zero_padding , stride)
        self.output_array = np.zeros((self.filter_number , self.output_height , self.output_width))
        self.filters = []
        for i in range(filter_number):
            self.filters.append(Filter(filter_width , filter_height , filter_number))
        self.activator = activator
        self.learning_rate = learning_rate

    def forward(self , input_array):
        ‘‘‘
        計算卷積層的輸出
        輸出結果保存在self.output_array
        ‘‘‘
        self.input_array = input_array
        self.padded_input_array = padding(input_array , self.zero_padding)
        for f in range(self.filter_number):
            filter = self.filters[f]
            conv(self.padded_input_array , filter.get_weights() , self.output_array[f] , self.stride , filter.get_bias())
            element_wise_op(self.output_array , self.activator.forward)  #對輸出的每一個元素做激活操作

    def backward(self , input_array , sensitivity_array , activator):
        ‘‘‘
        計算傳遞給前一層的誤差項，以及計算每個權重的梯度
        前一層的誤差項保存在self.delta_array，梯度保存在Filter對象的weights_grad中
        ‘‘‘
        self.forward(input_array)
        self.bp_sensitivity_map(sensitivity_array , activator)
        self.bp_gradient(sensitivity_array)

    def update(self):
        ‘‘‘
        按照梯度下降，更新權重
        ‘‘‘
        for filter in self.filters:
            filter.update(self.learning_rate)

    #計算傳遞到上一層的誤差項
    def bp_sensitivity_map(self , sensitivity_array , activator):
        ‘‘‘
        計算傳遞到上一層的sensitivity_map
        sensitivity_array：本層的sensitivity map
        activator：上一層的激活函數
        ‘‘‘
        #處理卷積步長，對原始sensitivity map進行擴展
        expanded_array = self.expand_sensitivity_map(sensitivity_array)
        #full卷積，對sensitivity map進行zero padding
        #雖然原始輸入的zero padding單元也會獲得殘差，但這個殘差不需要繼續向上傳播，因此就不計算了
        expanded_width = expanded_array.shape[2]
        #zero padding的值
        zp = (self.input_width + self.filter_width - 1 - expanded_width) / 2
        padded_array = padding(expanded_array , zp)
        #初始化delta_array,用於保存傳遞到上一層的sensitivity map
        self.delta_array = self.create_delta_array()
        #對於具有多個filter的卷積層來說，最終傳遞到上一層的sensitivity map相當於所有filter的sensitivity map之和
        #註意：這裏的求和只是針對所有的num求和，而不是針對所有的channel求和；
        for f in range(self.filter_number):
            filter = self.filters[f]
            #將filter的權重翻轉180度
            filpped_weights = np.array(map(lambda i : np.rot90(i , 2) , filter.get_weights()))
            #計算與一個filter對應的delta_array
            delta_array = self.create_delta_array()
            for d in range(delta_array.shape[0]):
                conv(padded_array[f] , filpped_weights[d] , delta_array[d] , 1 , 0)
            self.delta_array += delta_array
        #將計算結果與激活函數的偏導數做element-wise懲罰操作
        derivative_array = np.array(self.input_array)
        element_wise_op(derivative_array , activator.backward)
        self.delta_array *= derivative_array

    #計算傳遞到上一層的權重梯度
    def bp_gradient(self , sensitivity_array):
        #處理卷積步長，對原始的sensitivity map進行擴展
        expanded_array = self.expand_sensitivity_map(sensitivity_array)
        for f in range(self.filter_number):
            #計算每個權重的梯度
            filter = self.filters[f]
            for d in range(filter.weights.shape[0]):
                conv(self.padded_input_array[d] , expanded_array[f] , filter.weights_grad[d] , 1 , 0)
            #計算偏置項的梯度
            filter.bias_grad = expanded_array[f].sum()

    #對步長不為1的sensitivity map進行擴展，使之還原成stride=1時的情況
    def expand_sensitivity_map(self , sensitivity_array):
        depth = sensitivity_array.shape[0]
        #確定擴展後sensitivity map的大小
        #計算stride為1時的sensitivity map的大小，之所以這麽做是因為後面對於stride不等於1的情況時，進行反向傳播時，都是先還原成stride=1時的情況再做處理
        expanded_width = (self.input_width - self.filter_width + 2 * zero_padding + 1)
        expanded_height = (self.input_height - self.filter_height + 2 * zero_padding + 1)
        #構建新的sensitivity map
        expand_array = np.zeros((depth , expanded_height , expanded_width))
        #從原始的sensitivity map拷貝誤差值
        for i in range(self.output_height):
            for j in range(self.output_width):
                i_pos = i * self.stride
                j_pos = j * self.stride
                expand_array[: , i_pos , j_pos] = sensitivity_array[: , i , j]  #stride = s還原到stride=1時的情況，通過對應位置0進行擴展
        return expand_array

    def create_delta_array(self):
        return np.zeros((self.channel_number , self.input_height , self.input_width))

    @staticmethod
    def calculate_output_size(input_size , filter_size , zero_padding , stride):
        return (input_size - filter_size + 2 * zero_padding) / stride + 1

二、池化層

卷積層，池化層等，前向/反向傳播原理講解

簡單代碼構建 range expand 使用場景神經網絡右下角 body 今天閑來無事，考慮到以前都沒有好好研究過卷積層、池化層等等的前向/反向傳播的原理，所以今天就研究了一下，參考了一篇微信好文，講解如下：參考鏈接：https://www.zybuluo.co

CNN（卷積層convolutional layer，激勵層activating layer，池化層pooling，全連線層fully connected）

CNN產生的原因：當使用全連線的神經網路時，因為相鄰兩層之間的神經元都是有邊相連的，當輸入層的特徵緯度非常高時（譬如圖片），全連線網路需要被訓練的引數就會非常多（引數太多，訓練緩慢），CNN可以通過訓練少量的引數從而進行特徵提取。上圖每一個邊就代表一個需要訓練的引數，可以直觀

理解CNN卷積層與池化層計算

CNN網絡卷積層池化層深度學習 OpenCV 概述深度學習中CNN網絡是核心，對CNN網絡來說卷積層與池化層的計算至關重要，不同的步長、填充方式、卷積核大小、池化層策略等都會對最終輸出模型與參數、計算復雜度產生重要影響，本文將從卷積層與池化層計算這些相關參數出發，演示一下不同步長、

【深度學習】基於im2col的展開Python實現卷積層和池化層

一、回顧上一篇我們介紹了，卷積神經網的卷積計算和池化計算，計算過程中視窗一直在移動，那麼我們如何準確的取到視窗內的元素，並進行正確的計算呢？另外，以上我們只考慮的單個輸入資料，如果是批量資料呢？首先，我們先來看看批量資料，是如何計算的二、批處理在神經網路的

【深度學習】卷積神經網路的卷積層和池化層計算

一、簡介 \quad\quad 卷積神經網路（Convolutional neural network, CNN），

【深度學習筆記】關於卷積層、池化層、全連線層簡單的比較

卷積層池化層全連線層功能提取特徵壓縮特徵圖，提取主要特徵將學到的“分散式特徵表示”對映到樣本標記空間操作可看這個的動態圖，可惜是二維的。對於三維資料比如RGB影象（3通道），卷積核的深度必須

卷積層和池化層後輸出大小方法

卷積後圖片輸出大小几個數W:影象寬，H:影象高，D:影象深度（通道數）F：卷積核寬高，N:卷積核（過濾器）個數S:步長，P:用零填充個數卷積後輸出影象大小： Width=(W-F+2P)/S+1

轉：卷積層和池化層後輸出大小方法

卷積後圖片輸出大小几個數轉自：https://blog.csdn.net/ddy_sweety/article/details/79798117 W:影象寬，H:影象高，D:影象深度（通道數） F：卷積核寬高，N:卷積核（過濾器）個數 S:步長，P:用零填充個數

通過卷積層和池化層後輸出大小怎麼得出

通過卷積層與池化層後，特徵圖的大小怎麼計算這裡引入cs231n中的課件說明一下：卷積層：引數：W：寬 H：高 D：深度 K：卷積核的個數 F：卷積核的大小 S：步長 P：用0填充 W/H=[(輸入大小-卷積核大小+2*P）/步長] +1. 舉個例子上

利用Tensorflow和matplotlib直觀理解CNN的卷積層與池化層

卷積神經網路，CNN（Convolutional Neural Network），卷積神經網路是一種多層神經網路，擅長處理影象相關的深度學習問題。與普通神經網路的區別在於，卷積神經網路包含了由卷積層（Convolutional layer）和池化層（Pooling lay

卷積層以及池化層的輸出維度

在學習tensorflow時，總是對各種各樣的引數煩的死去活來，尤其是卷積核的長寬高步長什麼的，特別“迷人”。因此本人搜尋了很多的資料，進行了綜合，並加上了自己的理解，供大家學習參考。一、輸入的四個維度 1）batch_size：說白了，就是圖片的個數。 2）height/weight

利用tensorflow實現神經網路卷積層、池化層、全連線層

第一步：匯入相應的庫import tensorflow as tf import numpy as np12第二步：準備資料（隨機生成一維資料）data_size=25 x_data=np.random.normal(size=data_size) x_input_1d=

Keras深度神經網路模型分層分析【輸入層、卷積層、池化層】

一.輸入層　　1.用途　　　　構建深度神經網路輸入層，確定輸入資料的型別和樣式。　　2.應用程式碼　　　　input_data = Input(name='the_input', shape=(1600, 200, 1)) 　　3.原始碼 def Input(shape=None, batch_sh

自己動手實現深度學習框架-6 卷積層和池化層

程式碼倉庫: https://github.com/brandonlyg/cute-dl (轉載請註明出處!) # 目標上個階段使用MLP模型在在MNIST資料集上實現了92%左右的準確率，達到了tensorflow同等模型的水平。這個階段要讓cut

tf.nn的conv2d卷積與max_pool池化

() 矩陣 ray 產生 des bsp 卷積 sam sans tf.nn.conv2d(value,filter,strides,[...]) 對於圖片來說 value : 形狀通常是np.array()類型的4維數組也稱tensor(張量), (batch

深度學習基礎--卷積計算和池化計算公式

卷積計算和池化計算公式卷積卷積計算中，（）表示向下取整。輸入：n* c0* w0* h0 輸出：n* c1* w1* h1 其中，c1就是引數中的num_output，生成的特徵圖個數。 w1=(w0+2pad-kernel_size)/stride+1;

對CNN中pooling層（池化層）的理解

自己在學習CNN過程中,查詢網上一些資料,對pooling層有了一些理解,記錄下來,也供大家參考: pooling層(池化層)的輸入一般來源於上一個卷積層,主要有以下幾個作用: 1.保留主要的特徵,同時減少下一層的引數和計算量，防止過擬合 2. 保持某種不變性，包括translation

卷積神經網路池化後的特徵圖大小計算

卷積後的大小 W：矩陣寬，H：矩陣高，F：卷積核寬和高，P：padding（需要填充的0的個數），N：卷積核的個數，S：步長 width：卷積後輸出矩陣的寬，height：卷積後輸出矩陣的高 width = （W - F + 2P）/ S + 1 height = （

cs231n-(7)卷積神經網路：架構，卷積層/池化層

卷積神經網路和普通神經網路非常類似。卷積神經網路由神經元組成，每個神經元包含權重weight和諞置bias；它接收上一層輸入，和權重相乘，通常再經過一個非線性函式（可選）輸出。整個網路擬合一個可微分的score function:從原始影象到每類別得分。在

tensorflow中的卷積和池化層(一)

oat avg 滑動 shape 要求網絡 vol 加速 ali 在官方tutorial的幫助下，我們已經使用了最簡單的CNN用於Mnist的問題，而其實在這個過程中，主要的問題在於如何設置CNN網絡，這和Caffe等框架的原理是一樣的，但是tf的設置似乎更加簡潔、方便，

卷積層，池化層等，前向/反向傳播原理講解

相關推薦