1. 程式人生 > >【ECCV2018】DeepTAM: Deep Tracking and Mapping

【ECCV2018】DeepTAM: Deep Tracking and Mapping

覺得還是應該多看看文章的,不然思緒總會呆滯,躊躇不前,而且對於接受下一週的討論班來說也是一種刺激自我得到方法。

採用了深度學習的方法,對SLAM問題中的Tracking模組以及Mapping模組分別進行了利用深度網路的方法改進,且取得了不錯的結果。

這是一篇採用了深度學習的文章,主要參考的就是DTAM的思想: drift-free camera pose tracking via a dense depth map towards a keyframe and aggregation of depth over time 但是卻採取了不同實現手段實現DTAM提出的這個理念。 尤其值得之一的是: Tracking和Mapping兩個模組都使用了深度學習的卷積神經網路的方法,都是單單從資料中解決了Tracking和Mapping的問題。

————————————————————————————————————————————————————— 記錄一下本文中提到的和SLAM有關的用到學習的方法的文章,之後自己可能會用得到,具體都在下面:

  • Ummenhofer, B., Zhou, H., Uhrig, J., Mayer, N., Ilg, E., Dosovitskiy, A., Brox, T.: DeMoN: Depth and Motion Network for Learning Monocular Stereo. In: IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (2017) 這篇文章主要講的是:implements 6 DOF egomotion and depth estimation for two images as a learning problem. 相比於參考的這篇文章,DeepTAM的方法則是處理更多的Images(多與2張的更多),這樣就避免了使用keyframe所產生的漂移,而且之後隨著送到這個系統之中的frame數量的增加使得作者可以進一步對獲取的圖象的深度以及地圖進行完善和優化。

其他的一些與相機位姿估計以及地圖構建相關的工作還有:

  • Agrawal, P., Carreira, J., Malik, J.: Learning to See by Moving. In: 2015 IEEE International Conference on Computer Vision (ICCV). pp. 37–45 (Dec 2015). https://doi.org/10.1109/ICCV.2015.13 這篇文章的工作:trains a neural network to estimate the egomotion, which mainly serves as a supervision for feature learning.

  • Kendall, A., Cipolla, R.: Geometric loss functions for camera pose regression with deep learning. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (2017)

具體的來講文章後面又分別以tracking、mapping來講,在每個模組裡面都分別介紹了相應的原理以及網路結構,還有訓練等~~~ 嗯還有還很很多,我覺得自己目前消化起來又是另外一個跨領域的東西,所以應該有難度的吧我覺得,之後慢慢的學習了python以及深度學習的東西之後再來接觸我覺得應該會好很多吧~