1. 程式人生 > >深度學習(計算機視覺)面試中問題(二)

深度學習(計算機視覺)面試中問題(二)

博主在前面一篇部落格,已經把面試問到的問題敘述了11個,接下來把最近遇到的問題拿出來分享,回答的的不對,麻煩指正,謝謝。前面一篇部落格為:深度學習面試常問問題(一)

1、1*1卷積作用。

答:1. 實現跨通道的互動和資訊整合

2. 進行卷積核通道數的降維和升維

3、實現多個feature map的線性組合,實現通道個數的變換。

4、對特徵圖進行一個比例縮放。

2、CNN池化層有什麼作用?

答:1、減小影象尺寸,資料降維。

2、緩解過擬合。

3、保持一定程度的旋轉和平移不變性,MaxPooling能保證卷積神經網路在一定範圍內平移特徵能得到同樣的激勵,具有平移不變形。 

3、卷積神經網路中空洞卷積的作用是什麼?

答、空洞卷積也叫擴張卷積,在保持引數個數不變的情況下增大了卷積核的感受野,同時它可以保證輸出的特徵對映(feature map)的大小保持不變。一個擴張率為2的3×3卷積核,感受野與5×5的卷積核相同,但引數數量僅為9個。 

4、深度學習中常用的損失函式?

答:交叉熵損失,平方差損失,絕對值損失,Hinge Loss。具體介紹:損失函式具體介紹

5、 Sigmoid啟用函式為什麼會出現梯度消失?Sigmoid函式導數的最大值出現在哪個值?

答:為什麼會出現梯度消失,從兩方面來看,首先先看本身函式,若輸入值X過大,sigmoid函式導數為零,第二方面:sigmoid函式求導,導數最大是等於1/4,小於1,經過深的網路傳遞就會出現梯度消失的問題。

在x=0時導數最大。

6.faster rcnn是怎麼樣一個框架?

答:有一篇部落格講的挺清楚的。rcnn系列詳解

7、faster rcnn,roi pooling具體是如何工作的?(如何把不同大小的框,pooling到同樣的大小)

答、RoIPool首先將浮點數值的RoI量化成離散顆粒的特徵圖,然後將量化的RoI分成幾個空間的小塊(spatial bins),最後對每個小塊進行max pooling操作生成最後的結果。

8、評價指標有哪些?

答、機器學習中評價指標: Accuracy(準確率)、 Precision(查準率或者精準率)、Recall(查全率或者召回率)。

目標檢測的指標:識別精度,識別速度,定位精度。

a、目標檢測中衡量識別精度的指標是mAP(mean average precision)。多個類別物體檢測中,每一個類別都可以根據recall和precision繪製一條曲線,AP就是該曲線下的面積,mAP是多個類別AP的平均值。

b、  目標檢測評價體系中衡量定位精度的指標是IoU,IoU就是演算法預測的目標視窗和真實的目標視窗的交疊(兩個視窗面積上的交集和並集比值)

9、深度學習訓練時網路不收斂的原因有哪些?如何解決?

答:不收斂一般都是資料不乾淨,學習率設定不合理,網路等問題,詳細知識根據博主的經驗和看的的別人一些經驗整理了下,

不收斂的原因與解決辦法

10、如何應對影象光照變化大?

答:1、直方圖均衡化

2、對比度拉伸,或者調節

3、若受光源影響,使得圖片整體色彩往一方面移動,用白平衡演算法進行修正,使其發黃、發藍、發紅的照片更加趨於自然光下的影象

4、若是過爆或者過暗,可是設計閾值函式,不用全域性閾值,對特定區域進行特定閾值分割。

5、若是太暗,可以採用對數變化,對數影象增強是影象增強的一種常見方法,其公式為: S = c log(r+1),對數使亮度比較低的畫素轉換成亮度比較高的,而亮度較高的畫素則幾乎沒有變化,這樣就使圖片整體變亮。

6、採用拉普拉斯運算元增強 , filter2D(src,dst)

 

11、常用的分割方法有哪些?

答:1、基於閾值的分割方法:比較常用的閡值法有大律法、最小誤差法

2、基於邊緣的分割方法:常見的微分運算元包括Robert運算元、Prewitt運算元、Sobel運算元、Laplaeian運算元、Canny運算元等

3、基於區域的分割方法:主要包括種子區域生長法、區域分裂合併法和分水嶺法等幾種型別。

4、基於圖論的分割方法:Graph Cut方法

5、深度學習:語義分割等