1. 程式人生 > >稀疏表示去噪的理解

稀疏表示去噪的理解

1、  對稀疏表示的理解

稀疏訊號定義為:若訊號僅有限非零取樣點,而其他取樣點均為零(或接近於零),則稱訊號是稀疏的。

但是自然影象訊號中,可以稀疏表示的情況是極少的,因為儘管有的地方值很小,但是並不為零,因此另一種概念“可壓縮的”就被提出來,其定義是:如果在不丟失全部(大部分)資訊的前提下,訊號經過任何變換後是稀疏的,也就是說訊號再某個變換域是稀疏的,那麼可以稱之為可壓縮訊號,自然影象訊號多數是可壓縮訊號。

利用可壓縮訊號的概念,那麼大多數自然訊號可以由有限個特徵線性表達:

這裡,是用來表達訊號的特徵原子,是稀疏編碼。

如上圖所示,D是訓練好的過完備字典,通過稀疏編碼,可以得到稀疏向量x,在重建過程中,利用字典D和稀疏向量x相乘,就可以用對應的第3,7,14個原子來線性表示原影象,稀疏向量x中不為0的個數是有限的,因此其表示是稀疏的。

稀疏表示在實現中的細節問題:

a.        在稀疏表示的過程中,影象首先被向量化,然後再用有限個原子向量稀疏表示,最後再把重構的影象reshape為二維影象

b.        字典的原子個數是自定義的,但是為了構造過完備的字典,要求字典是一個矮矩陣,即行數小於列數,字典的行數,即每個原子的維數是影象patch的行數乘以列數,即patch的畫素數。

c.        對於全域性的稀疏表示來說,字典在訓練的時候,使用時訓練樣本是從觀測影象中分割出來的一個一個的patch,所有的patch訓練一個字典,用於訓練字典的patch也是經過向量化以後,作為列向量,構成訓練樣本的矩陣

d.         為什麼要分塊?

我覺得是因為字典的原子是向量化的,其維數是影象塊的行列積,而一幅影象的行列積是很大的,因此原子用分塊的patch來表示,可以大大降低字典原子的維數,此外,用重疊的patch,有利於訓練集的豐滿,這樣訓練出來的字典才更加的準確。


稀疏表示能夠去噪的原因:可以認為含噪(觀測)影象是由無噪(原始)影象和噪聲合成的影象,而觀測影象被認為是可稀疏的,即可以通過有限個原子來表示,而噪聲是隨機的不可稀疏的,即不可以通過有限個原子表示,因此通過觀測影象去提取影象的係數成分,再用這些稀疏成分來重構影象,在這個過程中,噪聲被處理為觀測影象和重構影象之間的殘差,在重構過程中殘差被丟棄,從而達到去噪的效果。

稀疏表示又稱為稀疏編碼,這個過程可以被視為特徵提取的過程,可以看作把目標訊號投影到一組非正交的基構成的空間中,而在每個基上投影的係數,就是稀疏編碼。這組非正交的基向量中,每一個基向量被稱為一個原子,這些原子(列向量)可以構成一個超完備的字典。

那麼,為什麼要使用過完備的字典,或者說要在非正交的空間進行投影呢?

對於一組正交基而言,它們可以準確而唯一地表示空間中的任何向量,而且這些向量間沒有冗餘(因為正交),正式因為嚴格的正交限制,因此正交基的展開簡單,但是稀疏性不夠理想,因為嚴格正交的基往往只能表示影象的某一個特徵而不能夠同時表示其他特徵,因此正交基的稀疏性不及非正交基(過完備字典)。

2、  稀疏表示模型

稀疏表示的模型有3種,分別是:

1)        利用拉格朗日乘子將兩個約束條件合為一個不等式:

2)        固定稀疏係數的個數,優化最小誤差:

3)        固定最小誤差,優化稀疏係數個數:

3、  常見的稀疏表示方法

稀疏表示可以分為兩個步驟:稀疏編碼和字典學習

1)        稀疏編碼:在進行稀疏編碼的時候,字典D是固定的

在進行優化的時候,0範數的優化是一個NP難題,稀疏編碼主要分為了3中主流的演算法:

a.        針對0範數的貪婪演算法:MP(匹配追蹤)演算法,OMP(正交匹配追蹤)演算法,梯度追蹤演算法,此外還有ROMP(正則化正交匹配追蹤)演算法,Stage-wise OMP演算法等。

這些貪婪演算法通過每次迭代時選擇一個區域性最優解來逐步逼近原始訊號,MP演算法運算量相對於BP演算法計算量減少,但是容易陷入區域性最優解,而後來提出的OMP演算法在MP 的基礎上,將選中的原子經Gram-Schmidt正交化處理後,然後再將原始訊號在正交化的原子構成的子空間中投影,OMP可以得到全域性最優解並且收斂速度比MP更快。

b.        凸鬆弛法:BP(基追蹤)演算法,GPSR(梯度投影稀疏重構)

這些凸鬆弛演算法是針對範數最小提出的線性規劃最優演算法,這種演算法需要的觀測訊號數量最少,但是計算量大

c.        組合演算法:就是將粒子群演算法等結合到貪婪演算法或者凸鬆弛演算法中

這種演算法組合要求訊號的取樣支援通過分組測試快速重建,它的複雜度低,但是收斂性還沒有得到證明

2)        字典學習:傳統的小波變換,曲波變換,DCT變換等,都是使用的固定的正交字典,這種字典和影象本身的統計特性沒有關聯,因此其表示的稀疏性往往得不到保證,而學習的字典是提取的資料特徵是依賴於原始資料的統計特徵的,因此在表示的時候,其稀疏性遠遠優於固定字典

常見的字典學習的方法有MOD(最優方向)演算法,K-SVD演算法,Online演算法,最大後驗概率演算法等。


相關推薦

稀疏表示理解

1、  對稀疏表示的理解稀疏訊號定義為:若訊號僅有限非零取樣點,而其他取樣點均為零(或接近於零),則稱訊號是稀疏的。但是自然影象訊號中,可以稀疏表示的情況是極少的,因為儘管有的地方值很小,但是並不為零,因此另一種概念“可壓縮的”就被提出來,其定義是:如果在不丟失全部(大部分)

稀疏表示中的一些小問題

1.基於稀疏表示的影象去噪,是將影象分塊,對於每個塊進行稀疏表示得到係數矩陣,然後重構影象通過係數矩陣*字典得到嗎?稀疏表示過程中每次將影象的每一列與字典做內積,選擇最大的一個,計算殘差,多次迭代,

dodo:人臉識別方法個人見解(包括稀疏表示方法的理解

科院網站 http://www.cbsr.ia.ac.cn/Li%20Group/publicationsCH.htmlgoogle的軟體picasa漢王公司  dodo:人臉識別方法個人見解(2008-01-07 20:56:37)  dodo:人臉識別方法個人見解 (此貼最開始於 2007-6-23

高維數據稀疏表示-什麽是字典學習(過完備詞典)

字典 cnblogs href title itl pos tle logs post 高維數據稀疏表示-什麽是字典學習(過完備詞典) http://www.cnblogs.com/Tavion/p/5166695.html高維數據稀疏表示-什麽是字典學習(過完備詞典)

稀疏解的幾何理解

格式 標簽 position 表示 發現 jpeg2000 理論 完成 信號 稀疏解的幾何理解 轉載 2015-04-09 11:53:23 標簽:稀疏解稀疏理論幾何解釋 回顧信號與圖像處理過程,我們可以發現很多媒體格式都是通過變換域的稀疏表示來完成的

稀疏表示的高光譜分類

訓練 dict 什麽 最好 基本概念 流程 現在 名稱 我們 下圖是一個稀疏表示模型 1.稀疏系數: 最右邊的α, 白色小格子表示0,有色小格子表示非0數(0,1),稀疏的意思就是非零系數很少。 2.字典:相信大家在做科研的時候,應該都聽說過字典Dictionary,

IEEE Trans 2006 使用K-SVD構造超完備字典以進行稀疏表示稀疏分解)

收縮 ons net 求逆 最大似然法 隨機 出了 約束 如同 K-SVD可以看做K-means的一種泛化形式,K-means算法總每個信號量只能用一個原子來近似表示,而K-SVD中每個信號是用多個原子的線性組合來表示的。 K-SVD算法總體來說可以分成兩步,首先給

稀疏表示

稀疏表示信號分解圖像識別稀疏表示定義稀疏表示的數學本質就是稀疏正規化約束下的信號分解。隨著信號和圖像處理技術的不斷發展, 如何利用信號和圖像的成分(如主成分、次成分、獨立成分、稀疏成 分、 形態成分等)來表示信號和圖像已成為很多信號和 圖像處理任務, 例如壓縮、重構、抑噪和特征提取等的研 究熱點, 並有著相當

[轉摘]圖像復原(圖片模糊)-低級圖像處理/視覺任務

ted miss gin 去模糊 eight 密度 第一個 lan data- [轉摘自知乎]鏈接:https://www.zhihu.com/question/272305330/answer/366831382 去除雨滴,去霧,去除噪聲,去塵土和去模糊等都是這一類的,

頻率域基本實現思想

思想 圖像去噪 con 相關 性能 變化 copy 比較 class 1. 頻率域去噪基本實現思想:首先將原始圖像通過一些積分變換,將其變換到頻率域,接著再通過頻率域對其進行操作,得到的結果再反變換到空間域中,進而使圖像得到增強。根據傅裏葉頻譜的特性可得到,圖像的平均灰度級

小波MATLAB程式碼

本文基於北京交通大學陳後金教授的課件。我加以整理,若有冒犯還請諒解 1利用MATLAB產生分解與重建濾波器組 計算濾波器組的函式[Ld,Hd,Lr,Hr]=wfilters('wname') Ld:分解低通濾波器h0[-n]; Hd:分解高通濾波器h1[-n]; Lr:分解低通濾

歐盟為區塊鏈再添支援 歐洲議會議員表示中心化系統提供了更多的安全保障

  馬耳他政治家兼歐洲議會議員Roberta Metsola在11月2日的馬耳他區塊鏈峰會上發表了演講。她在演講時表示,由區塊鏈驅動的去中心化系統“提供了更多的安全保障”。 Metsola在峰會上表達了歐洲議會(EP)對區塊鏈和加密貨幣等新興行業的積極立場。這位馬耳他政治家還透露說

一種基於凸優化的影象方法演示

本文介紹一種基於凸優化的影象去噪方法。 該方法採用L1範數來衡量影象的平滑度,即能濾除澡聲,又能最大限度地儲存影象的邊緣。 模型如下:   其中f(x)為差分矩陣,存放了X每個元素與其4鄰域的差值。 I為輸入的灰度影象。 對於三通道彩色影象,可

影象模糊

    一坑未平,一坑又起。前陣子研究的Ocr檢測+識別演算法算是告一段落。整體來說目前相關演算法效果算是不錯的了,通用於身份證通行證等各類證件識別,車票識別,彩票,發票等各類票據識別,車牌識別,溫度儀表盤等。     接下來即將進行的工作是影象去去除雨滴

學習 python_opencv影象筆記

最近一直在跟OpenCV-Python 中文教程學習,在學到使用 cv2.fastNlMeansDenoisingColored()函式去噪時,在使用教程程式碼時發現結果不一樣,原始碼如下: import numpy as np import cv2 from matplotlib i

訊號的稀疏表示

訊號的稀疏表示 看了一下閆敬文老師的訊號的稀疏表示,把自己的理解寫出來吧!之前也看過一些文章,但是一直沒看得太懂,今天我感覺自己應該是弄明白了!寫出來,希望和我有同樣迷惑的人可以借鑑。 1.訊號的稀疏表示分為 閾值法和 冗餘字典法。其中閾值法

卷積自編碼器專案實現

import numpy as np import tensorflow as tf import matplotlib.pyplot as plt from tensorflow.examples.tutorials.mnist import input_data mnist = input

(轉載)影象濾波及初步

定義 說到濾波,不得不提的就是卷積。關於卷積的定義,知乎上有個很有名的段子: 這個話大致講出了卷積的物理意義。 而在影象中,影象濾波的定義也是由卷

驗證碼/OCR影象識別預處理(

去噪 獲取影象紅色通道(字型一般是黑色的,去除印章等其它因素) 二值化 鄰域畫素演算法: 對於畫素值>245的鄰域畫素,判別為屬於背景色,如果一個畫素上下左右4各畫素值有超過2個畫素屬於背景色,那

傅立葉變換及其在opencv中影象的實現

前言 我保證這篇文章和你以前看過的所有文章都不同,這是12年還在果殼的時候寫的,但是當時沒有來得及寫 完就出國了……於是拖了兩年,嗯,我是拖延症患者…… 這篇文章的核心思想就是: 要讓讀者在不看任何數學公式的情況下理解傅立葉分析。 傅立葉分析不僅僅是一個數學工