1. 程式人生 > >[深度學習]Object detection物體檢測之YOLO v3(9)

[深度學習]Object detection物體檢測之YOLO v3(9)

論文全稱:《YOLOv3: An Incremental Improvement》

論文地址:https://pjreddie.com/media/files/papers/YOLOv3.pdf

這是我目前看過最輕鬆詼諧的論文,作者的開頭特別有意思。他說自己過去一年花了很多時間在推特上面,也去研究了GAN,後來又回來提升YOLO。他還指出了其實這個版本的更新沒有什麼特別了不起的地方,只是將別人的一些好的方法融合到v2版本里然後獲得了提升,都是些小修小補。

最後論文還寫了很多作者對於計算機視覺的一些看法,比如不應該拿來當做軍隊的武器濫殺無辜,非常值得一看。真是一個又厲害又善良的學者。

改進之處

1.多尺度預測 (類FPN)

YOLOv3在三個不同的尺度上預測。在YOLO v3中採用類似FPN的上取樣(upsample)和融合做法(最後融合了3個scale,其他兩個scale的大小分別是2626和52*52),在多個scale的feature map上做檢測,對於小目標的檢測效果提升還是比較明顯的。

2.分類器 darknet-53

網路使用連續3×3和1×1卷積層,但現在有一些shortcut connections。因為有53層卷積層所以被叫做darknet-53。

這個網路的效能比darknet-19優越,分類的準確率接近resnet但是實時性方面比resnet要好得多。

檢測結果

參考文獻:

https://pjreddie.com/media/files/papers/YOLOv3.pdf

https://blog.csdn.net/App_12062011/article/details/77554288

https://zhuanlan.zhihu.com/p/44092856