[深度學習]Object detection物體檢測之YOLO v3(9)
阿新 • • 發佈:2018-11-26
論文全稱:《YOLOv3: An Incremental Improvement》
論文地址:https://pjreddie.com/media/files/papers/YOLOv3.pdf
這是我目前看過最輕鬆詼諧的論文,作者的開頭特別有意思。他說自己過去一年花了很多時間在推特上面,也去研究了GAN,後來又回來提升YOLO。他還指出了其實這個版本的更新沒有什麼特別了不起的地方,只是將別人的一些好的方法融合到v2版本里然後獲得了提升,都是些小修小補。
最後論文還寫了很多作者對於計算機視覺的一些看法,比如不應該拿來當做軍隊的武器濫殺無辜,非常值得一看。真是一個又厲害又善良的學者。
改進之處
1.多尺度預測 (類FPN)
YOLOv3在三個不同的尺度上預測。在YOLO v3中採用類似FPN的上取樣(upsample)和融合做法(最後融合了3個scale,其他兩個scale的大小分別是2626和52*52),在多個scale的feature map上做檢測,對於小目標的檢測效果提升還是比較明顯的。
2.分類器 darknet-53
網路使用連續3×3和1×1卷積層,但現在有一些shortcut connections。因為有53層卷積層所以被叫做darknet-53。
這個網路的效能比darknet-19優越,分類的準確率接近resnet但是實時性方面比resnet要好得多。
檢測結果
參考文獻:
https://pjreddie.com/media/files/papers/YOLOv3.pdf
https://blog.csdn.net/App_12062011/article/details/77554288
https://zhuanlan.zhihu.com/p/44092856