1. 程式人生 > >計算機視覺之線性濾波

計算機視覺之線性濾波

在影象上使用filter的過程可稱為卷積,filter使用的權重模式稱為filter核。
filter三大應用場景:
增強影象(去噪、增強對比度、resize)、提取資訊(邊緣、角點、紋理)、檢測某一模式(Pattern)
幾個有意思的filter:
在這裡插入圖片描述在這裡插入圖片描述

一、不得不知道的filter(影象增強方面的應用):
高斯核:
用某一畫素其周圍畫素加權值(權值服從高斯分佈,離該畫素越近的畫素權值越大)來代替該畫素,以達到平滑。所選用的高斯核的標準差越大,平滑效果越好,同時丟失的細節資訊越多,可以看出平滑是以丟失細節為代價的(影象多少會有些模糊)。

在這裡插入圖片描述表示某一方向上變化快慢的filter:
在x方向上變化程度可用如下filter表示
在這裡插入圖片描述

非線性filter:
中值filter(不會帶來模糊感)、最大值filter、最小值filter
來一組直觀的對比圖(高斯濾波和中值濾波):
在這裡插入圖片描述

高斯濾波的另一大應用場景:構建影象金字塔(多尺度的影象表示)!
給定一張影象輸出其在不同尺度下的表示。尺度越小,影象越粗糙。
如何構建呢?簡單來說,從最精細的影象開始,先做高斯濾波,再做下采樣,於是乎,影象尺度越來越小,最終可獲取同一影象的多個尺度的表示,形象地稱其為影象金字塔。
在這裡插入圖片描述

二、filter在尋找相似Pattern上的應用:
換一種方式看待卷積:我們將filter看作pattern向量,卷積過程可視為和影象的一個小pattern(也看作向量)做點積運算,求出的結果視為響應值,響應值越大代表越相似。
但是使用這種方式尋找Pattern有很大的bug,比如:影象本身的畫素值就很大,那麼計算出的響應值也大,但並不相似,於是就有了Normalized Correlation,計算兩個向量夾角的餘弦值,如下所示:
在這裡插入圖片描述