【目標跟蹤】MemTrack：Learning Dynamic Memory Networks for Object Tracking

阿新 • • 發佈：2018-12-12

ECCV2018一篇用LSTM做tracking的文章，文章連結：MemTrack

Motivation：

作者主要是想解決基於模板匹配類演算法對目標形變的適應性問題。典型的模板匹配演算法比如Siamese通常採用第一幀或者上一幀目標特徵作為模板。採用第一幀為模板難以適應目標的形狀變化，而直接用前一幀的目標特徵作為模板又很容易因為累積性的誤差導致跟蹤漂移。所以作者提出用一個動態記憶網路來適應目標的形態變化，同時採用LSTM網路來控制目標特徵的讀取。

Contribution

提出了一個動態記憶網路（dynamic memory network）來適應外觀的變化
提出了一個門控殘差模板學習策略（gated residual template learning）來控制最終模板的生成，能夠在初始特徵之上新增適當的特徵變化量。

Method

先來看看MemTrack的網路結構在這裡插入圖片描述兩個主要的模組記憶模組和LSTM模組我分別用藍色和綠色框表示了出來。記憶模組用來儲存目標的外形特徵，LSTM模組用來輸出一系列的控制訊號。整個的流程大概是：候選區 $S_t$ 輸入 $\rightarrow$ 特徵提取 $\rightarrow$ LSTM讀控制訊號 $\rightarrow$ 讀取記憶模組特徵 $\rightarrow$ 與原始特徵模板融合生成最終模板 $\rightarrow$ 模板匹配目標 $\rightarrow$ 邊界框迴歸 $\rightarrow$ 提取目標特徵 $\rightarrow$ LSTM寫控制訊號 $\to$

\rightarrow

\to

存入新的目標特徵

\rightarrow

提取下一幀候選區

LSTM控制模組 在這裡插入圖片描述這幅圖詳細的描述了LSTM和記憶模組的互動結構，當前幀的特徵向量 $a_t$ 和上一幀的隱藏狀態 $h_{t-1}$ 輸入到LSTM，輸出當前幀的隱藏狀態 $h_t$ ，然後用 $h_t$ 計算一系列的控制訊號

讀控制訊號 LSTM產生讀控制訊號用來將儲存區內的不同特徵加權求和，對於儲存區 $M_t \in R^{N\times n\times n\times c}$ N表示儲存的feature map 的數量，每個feature map 尺寸是 $n$

×n×cn\times n \times c

n \times n \times c

， c是通道數。 LSTM通過

h_t

計算祕鑰和強度：

其中

W^k, W^\beta, b^k, b^\beta

表示對應的權值矩陣和偏移量。

k_t \in R^c

用來匹配儲存區的內容，

\beta_t

表示生成的祕鑰的可信度。通過這兩個引數，可以求得權重在這裡插入圖片描述

k_{M_t(j)} \in R^c

表示對應特徵

M_t(j)

的祕鑰，

C(x,y)

是一個餘弦函式，用來度量

k_t

和

k_{M_t(j)}

的相似度。

w^r_t(j)

表示儲存區內第 j 個特徵在t幀的加權權重。最終，可以得到模板：在這裡插入圖片描述

寫控制訊號 當得到了新的目標時，就需要考慮更新儲存區的特徵了。對於當前幀的模板，有三種可能情況：

當新的模板不可靠，選擇不更新儲存區的特徵
當目標在當前幀外形變化不大，選擇更新儲存區特徵
當目標在當前幀存在很大的外形變化，選擇將當前幀的特徵儲存在一個儲存槽內。

為了解決這三種case，作者提出了一種計算寫權重的公式：在這裡插入圖片描述 $w^\gamma_t, w^a_t$ 分別表示讀取的權重和分配一個新空間的權重。三個門訊號 $g^\omega, g^\gamma, g^a$ 由LSTM控制器生成：分配權重 $w^a_t(j)$ 是這麼定義的：

在這裡插入圖片描述其中 $w^u_t$ 表示訪問向量：表示對應特徵被讀取的頻繁程度， $w^u_t$ 越大，表示該特徵與當前的目標越像，而 $w^u_t$ 太小，則可能會被新的特徵直接覆蓋。最終，每個槽內的特徵用以下公式更新： $e^\omega$ 表示一個擦除因子，用來控制槽內的特徵更新或者直接重寫。

殘差模板學習（Residual Template Learning） 作者提出一個殘差模板學習的策略，使得最終的模板更夠適應目標實時的變化，又不會完全受上一幀的影響而導致跟蹤漂移。在這裡插入圖片描述 $T^{final}_t$ 是最終的模板， $T_0$ 是初始模板， $r_t \in R^c$ 是一個LSTM生成的殘差門控制引數，用來控制不同通道中模板的學習率。

Experiment

ablation study 在這裡插入圖片描述左邊是不同components的漲點情況，右邊是不同儲存容量下的效能，在容量為8時達到飽和。

OTB2015 在這裡插入圖片描述點不算很高，但考慮到速度（~50）和novelty，算是一個比較solid的工作。

【目標跟蹤】MemTrack：Learning Dynamic Memory Networks for Object Tracking

Motivation：

Contribution

Method

Experiment

【目標跟蹤】MemTrack：Learning Dynamic Memory Networks for Object Tracking

C-COT 【目標跟蹤】個人理解

【目標跟蹤】KCF高速跟蹤詳解

【目標跟蹤】Long-term Correlation Tracking 閱讀筆記

基於全卷積的孿生網路目標跟蹤（Fully-Convolutional Siamese Networks for Object Tracking）

C-COT：Learning Continuous Convolution Operators for Visual Tracking程式問題

Fully-Convolutional Siamese Networks for Object Tracking基於全卷積孿生網路的目標跟蹤演算法SiameseFC

物體跟蹤-Fully-Convolutional Siamese Networks for Object Tracking

【目標檢測】：SPP-Net深入理解（從R-CNN到SPP-Net）

【程序5】題目：利用條件運算符的嵌套來完成此題：學習成績>=90分的同學用A表示，60-89分之間的用B表示，60分以下的用C表示。 1.程序分析：(a>b)?a:b這是條件運算符的基本例子。

【詳細資料】ICN6202：MIPI DSI轉LVDS芯片簡介

【BubbleCup X】E：Casinos and travel

【完整資料】TC358779XBG：HDMI轉MIPI DSI芯片方案

【入門OJ】1047：字符圖形3-平行四邊形

【入門OJ】1044：字母三角形

【入門OJ】1053：字符圖形9-數字正三角

【入門OJ】1054：字符圖形10-字母三角

【入門OJ】1052：字符圖形8-數字三角

【入門OJ】1058：數字走向Ⅲ

【入門OJ】1064：斜角Ⅰ

【目標跟蹤】MemTrack：Learning Dynamic Memory Networks for Object Tracking

Motivation：

Contribution

Method

Experiment

相關推薦