1. 程式人生 > >稀疏表示和字典學習

稀疏表示和字典學習

1. 引言

  近年來,隨著晶片、感測器、儲存器以及其他硬體裝置的快速發展,很多領域都面臨著資料量過大、處理時間過長的問題。傳統的訊號處理方式已經無法滿足人們對大量資料處理的需求,簡潔、高效、稀疏的訊號表示方法是人們研究、關注的熱點。稀疏表示和字典學習方法在解決資料量過大的問題上有獨特的優勢,稀疏表示和字典學習方法最早用於壓縮感知中訊號處理問題,現在越來越多的研究者把稀疏表示用在影象處理、目標識別、機器視覺、音訊處理等領域中。將稀疏表示和字典學習方法應用到影象處理上,可以簡單、高效地將影象中的噪聲分離,實現影象品質的提升。

2. 稀疏表示理論

2.1 簡介

  稀疏表示本質上是一種訊號表示方法,它從原始訊號中儘可能少地選取基本訊號,並將這些基本訊號通過線性組合來表達大部分或全部的原始訊號。通過稀疏表示可以獲得訊號更為簡潔的表示方式,從而使我們更容易地獲取訊號中所蘊含的資訊,更方便進一步對訊號進行加工處理。

  典型的稀疏表示過程可用圖1.1形象的表示如下:

2.2 稀疏表示模型

  一般的稀疏模型主要是線上性方程組的基礎上進行構建的,通過線性方程求解得到的結果是確定的、合理的,線性方程在稀疏表示中具有重要作用。一般的稀疏訊號是指在實數空間中,訊號Y可以由長度有限的離散訊號進行線性表示。一般稀疏表示中的線性方程為:

  

  式中訊號,字典為一個內部原子相互正交的基矩陣,是訊號Y在字典D的對映下的稀疏係數矩陣。如果n<m,則無法用字典D對訊號Y進行線性表示;如果n=m,則有唯一的係數矩陣X使得字典D對訊號Y進行線性表示;如果n>m,則存在無數種系數矩陣X使得字典D對訊號Y

進行線性表示。當n>m時,字典D是一個過完備字典矩陣,線性方程組是非正定的,可以得到無數個稀疏係數矩陣X,從中尋找最稀疏的矩陣X。係數矩陣X中的大部分元素值是零,只有很少一部分能夠對訊號特徵進行表示的元素值是非零的。用稀疏度k表示稀疏係數矩陣X中非零元素的總個數,則訊號的稀疏能力可用稀疏度k來體現:

  式中p是範數的度量。在訊號Y和字典D已知的情況下,構建稀疏模型對其進行求解,得到稀疏係數矩陣X,從而實現訊號Y的稀疏表示,即稀疏度k確定的情況下,求上式的最優解。主要的範數求解模型有L0,L1,L2求解模型,不同的求解方式決定著訊號Y稀疏程度的不同。有關範數求解模型就不在此贅述,具體可以參考

機器學習中的範數規則化之(一)L0、L1與L2範數

2.3 稀疏表示求解演算法

  稀疏表示求解演算法的目的是對訊號的優化求解,主要有鬆弛演算法和貪婪演算法兩大類。

  鬆弛演算法是指通過具有凸特性的高階範數如L1範數或者其他合適的具有稀疏性的度量對非凸的L0範數進行替換,實現將對NP問題的求解轉化為凸優化問題的求解,從而簡化運算方程,降低演算法運算的複雜度。典型的鬆弛優化演算法主要有基追蹤演算法(Basis Pursuit,BP)、交替投影演算法(Alternate Projection,AP)、梯度投影演算法(Gradient Projection for Sparse Reconstruction,GPSR)以及基於框架的演算法(Method of Frame,MF)等。

  貪婪演算法是對稀疏模型進行迭代的演算法,根據迭代前選擇的引數標準進行不斷地迭代計算,對區域性的最優結果進行追蹤,最終得到最優的稀疏表示結果。經典的貪婪演算法主要有匹配追蹤演算法(Matching Pursuit,MP)、正交匹配追蹤演算法(Orthogonal Matching Pursuit,OMP)、稀疏自適應匹配追蹤演算法(Compressive Sampling Matching Pursuit,CoSaMP)等。

3. 稀疏表示應用

  隨著稀疏理論的發展,稀疏表示得以在諸多場景中應用,如雷達目標識別、視覺追蹤等,這裡舉例稀疏表示在視覺追蹤方面的應用。

  視覺追蹤是在影象序列中對特定目標的運動軌跡以及相對於周邊環境位置資訊進行確定。在複雜環境中進行目標追蹤時易受到環境、外觀相似目標的影響導致追蹤失敗,一般的目標追蹤方法可以分為目標確定、環境區域確定、位置確定、模型更新等四個部分。稀疏表示方法用在視覺追蹤中主要是通過貝葉斯結構體系求得目標的先驗狀態,然後對目標的下一狀態的後驗概率進行求解從而實現準確定位。在稀疏表示方法下的視覺追蹤更容易獲取目標的特徵及位置資訊,且能夠在最少的資料情況下進行高精度的目標定位、追蹤,能夠達到實時追蹤的要求。