1. 程式人生 > >影象處理與識別

影象處理與識別

數字影象處理是對影象進行分析、加工、和處理,使其滿足視覺、心理以及其他要求的技術。影象處理是訊號處理在影象域上的一個應用。目前大多數的影象是以數字形式儲存,因而影象處理很多情況下指數字影象處理。此外,基於光學理論的處理方法依然佔有重要的地位。 數字影象處理是訊號處理的子類, 另外與電腦科學、人工智慧等領域也有密切的關係。 傳統的一維訊號處理的方法和概念很多仍然可以直接應用在影象處理上,比如降噪、量化等。然而,影象屬於二維訊號,和一維訊號相比,它有自己特殊的一面,處理的方式和角度也有所不同。大多數用於一維訊號處理的概念都有其在二維影象訊號領域的延伸,它們中的一部分在二維情形下變得十分複雜。同時影象處理也具有自身一些新的概念,例如,連通性、旋轉不變性,等等。這些概念僅對二維或更高維的情況下才有非平凡的意義。影象處理中常用到快速傅立葉變換,因為它可以減小資料處理量和處理時間。 
數字影象處理應用在以下方面 :

攝影及印刷 (Photography and printing)

衛星影象處理 (Satellite image processing)

醫學影象處理 (Medical image processing)

面孔識別, 特徵識別 (Face detection, feature detection, face identification)

顯微影象處理 (Microscope image processing)

汽車障礙識別 (Car barrier detection)

數字影象基礎

影象的基本概念、影象取樣和量化、數字影象表示、 空間和灰度級解析度、影象紋理、畫素間的一些基本關係(相鄰畫素、鄰接性、連通性、區域和邊界、距離度量)、線性和非線性變換。

線性變換:如果變換函式是線性的或是分段線性,這種變換就是線性變換。以線性函式加大影象的對比度的效果是使整幅影象的質量改善。以分段線性函式加大影象中某個(或某幾個)亮度區間的對比度的效果是使區域性亮度區間的質量得到改善。

非線性變換:當變換函式是非線性時,即為非線性變換。常用的有指數變換和對數變換。

RGB (red green blue): 紅綠藍三基色

CMYK (Cyan-Magenta-Yellow-black inK): 青色-品紅-黃色-黑色

HSI (Hue-Saturation-Intensity): 色調-飽和度-強度

DDB (device-dependent bitmap): 裝置相關點陣圖

DIB (device-independent bitmap): 裝置無關點陣圖

CVBS (Composite Video Broadcast Signal): 複合電視廣播訊號

YUV(亦稱Y Cr Cb)是被歐洲電視系統所採用的一種顏色編碼方法(屬於PAL制)。

數字影象儲存與顯示

影象格式

在計算機中,有兩種型別的圖:向量圖(vector graphics)和位映象圖(bitmapped graphics)。向量圖是用數學方法描述的一系列點、線、弧和其他幾何形狀,如圖(a)所示。因此存放這種圖使用的格式稱為向量圖格式,儲存的資料主要是繪製圖形的數學描述;位映象圖(bitmapped graphics)也稱光柵圖(raster graphics),這種圖就像電檢視像一樣,由象點組成的,如圖(b),因此存放這種圖使用的格式稱為位映象圖格式,經常簡稱為點陣圖格式,儲存的資料是描述畫素的數值。

向量圖與位映象圖

目前包括bmp格式、gif格式、jpeg格式、jpeg2000格式、tiff格式、psd格式、

Png格式、swf格式、svg格式、pcx格式、dxf格式、wmf格式、emf格式、LIC格式、eps格式、TGA格式。

目前比較出名的影象處理庫有很多,比如LEADTOOLS、,LEADTOOLS這個是功能非常強大的影象多媒體庫,但是這個是收費註冊的。OpenCV 是一個跨平臺的中、高層 API 構成,目前包括300 多個 C 函式。它不依賴與其它的外部庫,儘管也可以使用某些外部庫。OpenCV 對非商業用途和商業用途都是免費(FREE)的。開源的影象庫也有不少,比如:

ImageStone、GIMP、CxImage等,雖然它們的功能沒有LEADTOOLS強大,但是一般的影象處理是可以應付的。

具體的功能介紹參考:http://blog.csdn.NET/byxdaz/archive/2009/03/09/3972293.aspx

數字影象增強

影象增強的目的在於改善影象的顯示質量,以利於資訊的提取和識別。從方法上說,則是設法摒棄一些認為不必要或干擾的資訊,而將所需要的資訊得以突出出來,以利於分析判讀或作進一步的處理。以下介紹幾種較為簡單的遙感數字影象增強處理方法。

A空間域增強處理

空間域是指影象平面所在的二維空間,空間域影象增強是指在影象平面上應用某種數學模型,通過改變影象像元灰度值達到增強效果,這種增強並不改變像元的位置。空域增強包括空域變換增強與空域濾波增強兩種。空域變換增強是基於點處理的增強方法、空域濾波增強是基於鄰域處理的增強方法。

1)、空域變換增強

常用的空域變換增強方法包括:對比度增強、直方圖增強和影象算術運算等。

對比度增強是一種通過改變影象像元的亮度分佈態勢,擴充套件灰度分佈區間來改變影象像元對比度,從而改善影象質量的影象處理方法。因為亮度值是輻射強度的反映,所以也稱為輻射增強。常用的方法有對比度線性變換和非線性變換。其關鍵是尋找到一個函式,以此函式對影象中每一個像元進行變換,使像元得到統一的重新分配,構成得到反差增強的影象。

直方圖增強

直方圖均衡化

     直方圖均衡化基本做法是將每個灰度區間等概率分佈代替了原來的隨機分佈,即增強後的圖象中每一灰度級的像元數目大致相同。直方圖均衡化可使得面積最大的地物細節得以增強,而面積小的地物與其灰度接近的地物進行合併,形成綜合地物。減少灰度等級換取對比度的增大。

直方圖歸一化 

     直方圖歸一化是把原影象的直方圖變換為某種指定形態的直方圖或某一參考影象的直方圖,然後按著已知的指定形態的直方圖調整原影象各像元的灰級,最後得到一個直方圖匹配的影象。這種方法主要應用在有一幅很好的影象作為標準的情況下,對另一幅不滿意的影象用標準影象的直方圖進行匹配處理,以改善被處理影象的質量。如在數字鑲嵌時,重疊區影像色調由於時相等原因差異往往很大,利用直方圖匹配這一方法後可以改善重疊區影像色調過度,如果鑲嵌影象時相相差不大,完全可以作到無縫鑲嵌。

數字影象的算術運算

兩幅或多幅單波段影像,完成空間配準後,通過一系列運算,可以實現影象增強,達到提取某些資訊或去掉某些不必要資訊的目的。

2)、空域濾波增強

空域變換增強是按像元逐點運算的,從整體上改善影象的質量,並不考慮周圍像元影響。空間濾波增強則是以重點突出影象上的某些特徵為目的的(如突出邊緣或紋理等),通過像元與周圍相鄰像元的關係,採取空間域中的鄰域處理方法進行影象增強。鄰域法處理用於去噪聲、影象平滑、銳化和相關運算。

影象卷積運算是在空間域上對影象作區域性檢測的運算,以實現平滑和銳化的目的。具體作法是選定一卷積函式,又稱為“M×N視窗”或“模板”,如3×3或5×5等。然後從影象左上角開始開一與模板同樣大小的活動視窗,影象視窗與模板像元的亮度值對應相乘再相加。將計算結果賦予中心像元作為其灰度值,然後待移動後重新計算,將計算結果賦予另一箇中心像元,以此類推直到全幅影象掃描一遍結束生成新的影象。

平滑是指影象中出現某些亮度變化過大的區域,或出現不該有的亮點(“噪聲”)時,採用平滑方法可以減小變化,使亮度平緩或去掉不必要“噪聲”點。它實際上是使影象中高頻成分消退,即平滑影象的細節,降低其反差,儲存低頻成分,在頻域中稱為低通濾波。具體方法有:均值平滑、中值濾波、銳化。

銳化的作用在於提高邊緣灰度值的變化率,使界線更加清晰。它是增強影象中的高頻成分,在頻域處理中稱為高通濾波,也就是使影象細節的反差提高,也稱邊緣增強。要突出影象的邊緣、線狀目標或亮度變化率大的部分常採用銳化方法。一般有三種實現方法:

(1)梯度法

    梯度反映了相鄰像元的亮度變化率,即影象中如果存在邊緣,如湖泊、河流的邊界,山脈和道路等,則邊緣處有較大的梯度值。對於亮度值較平滑的部分,亮度梯度值較小。因此,找到梯度較大的位置,也就找到邊緣,然後再用不同的梯度計算值代替邊緣處像元的值,也就突出了邊緣,實現了影象的銳化。通常有羅伯特梯度和索伯爾梯度方法。

(2)拉普拉斯演算法

    拉普拉斯演算法的意義與梯度法不同,它不檢測均勻的亮度變化,而是檢測變化率的變化率,相當於二階微分。計算出的影象更加突出亮度值突變的位置。

(3)定向檢測

    當有目的地檢測某一方向的邊、線或紋理特徵時,可選擇特定的模板卷積運算作定向檢測。可以檢測垂直邊界、水平邊界和對角線邊界等,各使用的模板不同

B、頻率域影象增強處理
頻域增強指在影象的頻率域內,對影象的變換系數(頻率成分)直接進行運算,然後通過Fourier逆變換以獲得影象的增強效果。

一般來說,影象的邊緣和噪聲對應Fourier變換中的高頻部分,所以低通濾波能夠平滑影象、去除噪聲。

影象灰度發生聚變的部分與頻譜的高頻分量對應,所以採用高頻濾波器衰減或抑制低頻分量,能夠對影象進行銳化處理。

頻域,就是由影象f(x,y)的二維傅立葉變換和相應的頻率變數(u,v)的值所組成的空間。在空間域影象強度的變化模式(或規律)可以直接在該空間得到反應。F(0,0)是頻域中的原點,反應影象的平均灰度級,即影象中的直流成分;低頻反映影象灰度發生緩慢變化的部分;而高頻對應影象中灰度發生更快速變化的部分,如邊緣、噪聲等。但頻域不能反應影象的空間資訊。

 

二維DFT及其反變換、Fast FT

關於這方面的內容需要參考數學知識。

空域和頻域濾波間的對應關係:

卷積定理是空域和頻域濾波的最基本聯絡紐帶。二維卷積定理:

 

基本計算過程:

  1. 取函式h(m,n)關於原點的映象,得到h(-m,-n)
  2. 對某個(x,y),使h(-m,-n)移動相應的距離,得到h(x-m,y-n)
  3. 對積函式f(m,n)h(x-m,y-n)在(m,n)的取值範圍內求和
  4. 位移是整數增量,對所有的(x,y)重複上面的過程,直到兩個函式:f(m,n)和h(x-m,y-n)不再有重疊的部分。

傅立葉變換是空域和頻域的橋樑,關於兩個域濾波的傅立葉變換對:

頻域與空域濾波的比較:

1. 對具有同樣大小的空域和頻率濾波器:h(x,y), H(u,v),頻域計算(由於FFT)往往更有效(尤其是影象尺寸比較大時)。但對在空域中用尺寸較小的模板就能解決的問題,則往往在空域中直接操作。

2. 頻域濾波雖然更直接,但如果可以使用較小的濾波器,還是在空域計算為好。    因為省去了計算傅立葉變換及反變換等步驟。

3. 由於更多的直觀性,頻率濾波器設計往往作為空域濾波器設計的嚮導。

平滑的頻率域濾波器型別
1 、理想低通濾波器
2 、巴特沃思低通濾波器
3 、高斯低通濾波器
頻率域銳化濾波器型別
1 理想高通濾波器
2 巴特沃思高通濾波器

3 高斯型高通濾波器

4 頻率域的拉普拉斯運算元
5 鈍化模板、高頻提升濾波和高頻加強濾波
頻率域影象增強處理的過程:

影象復原
影象復原:試圖利用退化過程的先驗知識,去恢復已被退化影象的本來面目。

影象復原的基本思路:先建立退化的數學模型,然後根據該模型對退化影象進行擬合。


邊緣檢測

數字影象的邊緣檢測是影象分割、目標區域的識別、區域形狀提取等影象分析領域十分重要的基礎,影象理解和分析的第一步往往就是邊緣檢測,目前它以成為機器視覺研究領域最活躍的課題之一,在工程應用中佔有十分重要的地位。所謂邊緣就是指影象區域性亮度變化最顯著的部分,它是檢測影象區域性變化顯著變化的最基本的運算。邊緣的記錄有鏈碼錶和線段表2種,鏈碼錶適合計算周長,線段表容易計算面積以及相關的,他們之間可以相互的轉換。

常見的邊緣檢測演算法:

Roberts邊緣檢測運算元

Sobel邊緣運算元

Prewitt邊緣運算元

Kirsch邊緣運算元

CANNY邊緣檢測


影象壓縮
影象壓縮是資料壓縮技術在數字影象上的應用,它的目的是減少影象資料中的冗餘資訊從而用更加高效的格式儲存和傳輸資料。影象壓縮可以是有損資料壓縮也可以是無損資料壓縮。對於如繪製的技術圖、圖表或者漫畫優先使用無失真壓縮,這是因為有失真壓縮方法,尤其是在低的位速條件下將會帶來壓縮失真。如醫療影象或者用於存檔的掃描影象等這些有價值的內容的壓縮也儘量選擇無失真壓縮方法。有損方法非常適合於自然的影象,例如一些應用中影象的微小損失是可以接受的(有時是無法感知的),這樣就可以大幅度地減小位速。

無損影象壓縮方法有:

行程長度編碼

熵編碼法

LZW演算法

有失真壓縮方法有:

將色彩空間化減到影象中常用的顏色。所選擇的顏色定義在壓縮影象頭的調色盤中,影象中的每個畫素都用調色盤中顏色索引表示。這種方法可以與 抖動(en:dithering)一起使用以模糊顏色邊界。

色度抽樣,這利用了人眼對於亮度變化的敏感性遠大於顏色變化,這樣就可以將影象中的顏色資訊減少一半甚至更多。

變換編碼,這是最常用的方法。首先使用如離散餘弦變換(DCT)或者小波變換這樣的傅立葉相關變換,然後進行量化和用熵編碼法壓縮。

分形壓縮(en:Fractal compression)。



形態學影象處理
 膨脹與腐蝕

 膨脹
腐蝕
開操作與閉操作
擊中或擊不中變換
一些基本的形態學演算法

邊界提取
區域填充
連通分量的提取
凸殼
細化
粗化
骨架

裁剪


影象分割
影象分割是指通過某種方法,使得畫面場景中的目標物被分為不同的類別。通常影象分割的實現方法是,將影象分為“黑”、“白”兩類,這兩類分別代表了兩個不同的物件。

影象分割方法:閾值分割、區域分割、數學形態學、模式識別方法

A、閾值分割包括以下幾種:

(1)由直方圖灰度分佈選擇閾值

(2)雙峰法選擇閾值

(3)迭代法選取閾值

     原理如下,很好理解。

     迭代法是基於逼近的思想,其步驟如下:
      1. 求出圖象的最大灰度值和最小灰度值,分別記為ZMAX和ZMIN,令初始閾值T0=(ZMAX+ZMIN)/2;
     2. 根據閾值TK將圖象分割為前景和背景,分別求出兩者的平均灰度值ZO和ZB;
     3. 求出新閾值TK+1=(ZO+ZB)/2;
     4. 若TK=TK+1,則所得即為閾值;否則轉2,迭代計算。

(4 )大津法選擇閾值

大津法是屬於最大類間方差法,它是自適應計算單閾值的簡單高效方法,或者叫(Otsu)

大津法由大津於1979年提出,對影象Image,記t為前景與背景的分割閾值,前景點數佔影象比例為w0,平均灰度為u0;背景點數佔影象比例為w1,平均灰度為u1。影象的總平均灰度為:u=w0*u0+w1*u1。從最小灰度值到最大灰度值遍歷t,當t使得值g=w0*(u0-u)2+w1*(u1-u)2 最大時t即為分割的最佳閾值。對大津法可作如下理解:該式實際上就是類間方差值,閾值t分割出的前景和背景兩部分構成了整幅影象,而前景取值u0,概率為 w0,背景取值u1,概率為w1,總均值為u,根據方差的定義即得該式。因方差是灰度分佈均勻性的一種度量,方差值越大,說明構成影象的兩部分差別越大, 當部分目標錯分為背景或部分背景錯分為目標都會導致兩部分差別變小,因此使類間方差最大的分割意味著錯分概率最小。直接應用大津法計算量較大,因此一般採用了等價的公式g=w0*w1*(u0-u1)2。

(5)由灰度拉伸選擇閾值

大津法是較通用的方法,但是它對兩群物體在灰度不明顯的情況下會丟失一些整體資訊。因此為了解決這種現象採用灰度拉伸的增強大津法。在大津法的思想上增加灰度的級數來增強前兩群物體的灰度差。對於原來的灰度級乘上同一個係數,從而擴大了影象灰度的級數。試驗結果表明不同的拉伸係數,分割效果差別比較大。

B、區域的分割

區域生長、區域分離與合併

 區域生長演算法


C、基於形態學分水嶺的分割

分水嶺分割演算法


影象特徵提取與匹配

常用的影象特徵有顏色特徵、紋理特徵、形狀特徵、空間關係特徵。

A 顏色特徵

特點:顏色特徵是一種全域性特徵,描述了影象或影象區域所對應的景物的表面性質。一般顏色特徵是基於畫素點的特徵,此時所有屬於影象或影象區域的畫素都有各自的貢獻。由於顏色對影象或影象區域的方向、大小等變化不敏感,所以顏色特徵不能很好地捕捉影象中物件的區域性特徵。

常用的特徵提取與匹配方法:

顏色直方圖

其優點在於:它能簡單描述一幅影象中顏色的全域性分佈,即不同色彩在整幅影象中所佔的比例,特別適用於描述那些難以自動分割的影象和不需要考慮物體空間位置的影象。其缺點在於:它無法描述影象中顏色的區域性分佈及每種色彩所處的空間位置,即無法描述影象中的某一具體的物件或物體。

顏色直方圖特徵匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累加顏色直方圖法。

B 紋理特徵

紋理特徵的提取方法比較簡單,它是用一個活動的視窗在影象上連續滑動,分別計算出視窗中的方差、均值、最大值、最小值及二者之差和資訊熵等,

形成相應的紋理影象,當目標的光譜特性比較接近時,紋理特徵對於區分目標可以起到積極的作用。選取適當的資料動態變化範圍,進行紋理特徵提取後,使影像的紋理特徵得到突出,有利於提取構造資訊。

特點:紋理特徵也是一種全域性特徵,它也描述了影象或影象區域所對應景物的表面性質。但由於紋理只是一種物體表面的特性,並不能完全反映出物體的本質屬性,所以僅僅利用紋理特徵是無法獲得高層次影象內容的。與顏色特徵不同,紋理特徵不是基於畫素點的特徵,它需要在包含多個畫素點的區域中進行統計計算。在模式匹配中,這種區域性的特徵具有較大的優越性,不會由於區域性的偏差而無法匹配成功。作為一種統計特徵,紋理特徵常具有旋轉不變性,並且對於噪聲有較強的抵抗能力。但是,紋理特徵也有其缺點,一個很明顯的缺點是當影象的解析度變化的時候,所計算出來的紋理可能會有較大偏差。另外,由於有可能受到光照、反射情況的影響,從2-D影象中反映出來的紋理不一定是3-D物體表面真實的紋理。

常用的特徵提取與匹配方法:

紋理特徵描述方法分類

(1)統計方法統計方法的典型代表是一種稱為灰度共生矩陣的紋理特徵分析方法Gotlieb 和 Kreyszig等人在研究共生矩陣中各種統計特徵基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特徵:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從影象的自相關函式(即影象的能量譜函式)提取紋理特徵,即通過對影象的能量譜函式的計算,提取紋理的粗細度及方向性等特徵引數

(2)幾何法

所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特徵分析方法。紋理基元理論認為,複雜的紋理可以由若干簡單的紋理基元以一定的有規律的形式重複排列構成。在幾何法中,比較有影響的演算法有兩種:Voronio 棋盤格特徵法和結構法。

(3)模型法

模型法以影象的構造模型為基礎,採用模型的引數作為紋理特徵。典型的方法是隨機場模型法,如馬爾可夫(Markov)隨機場(MRF)模型法和 Gibbs 隨機場模型法

(4)訊號處理法

紋理特徵的提取與匹配主要有:灰度共生矩陣、Tamura 紋理特徵、自迴歸紋理模型、小波變換等。

灰度共生矩陣特徵提取與匹配主要依賴於能量、慣量、熵和相關性四個引數。Tamura 紋理特徵基於人類對紋理的視覺感知心理學研究,提出6種屬性,即

:粗糙度、對比度、方向度、線像度、規整度和粗略度。自迴歸紋理模型(simultaneous auto-regressive, SAR)是馬爾可夫隨機場(MRF)模型的一種應用例項。

C形狀特徵

特點:各種基於形狀特徵的檢索方法都可以比較有效地利用影象中感興趣的目標來進行檢索,但它們也有一些共同的問題,

常用的特徵提取與匹配方法:

通常情況下,形狀特徵有兩類表示方法,一類是輪廓特徵,另一類是區域特徵。影象的輪廓特徵主要針對物體的外邊界,而影象的區域特徵則關係到整個形狀區域。

幾種典型的形狀特徵描述方法:

(1)邊界特徵法該方法通過對邊界特徵的描述來獲取影象的形狀引數。其中Hough 變換檢測平行直線方法和邊界方向直方圖方法是經典方法。Hough 變換是利用影象全域性特性而將邊緣畫素連線起來組成區域封閉邊界的一種方法,其基本思想是點—線的對偶性;邊界方向直方圖法首先微分影象求得影象邊緣,然後,做出關於邊緣大小和方向的直方圖,通常的方法是構造影象灰度梯度方向矩陣。

(2)傅立葉形狀描述符法

傅立葉形狀描述符(Fourier shape descriptors)基本思想是用物體邊界的傅立葉變換作為形狀描述,利用區域邊界的封閉性和週期性,將二維問題轉化為一維問題。

由邊界點匯出三種形狀表達,分別是曲率函式、質心距離、復座標函式。

(3)幾何引數法

形狀的表達和匹配採用更為簡單的區域特徵描述方法,例如採用有關形狀定量測度(如矩、面積、周長等)的形狀引數法(shape factor)。在 QBIC 系統中,便是利用圓度、偏心率、主軸方向和代數不變矩等幾何引數,進行基於形狀特徵的影象檢索。

D空間關係特徵

特點:所謂空間關係,是指影象中分割出來的多個目標之間的相互的空間位置或相對方向關係,這些關係也可分為連線/鄰接關係、交疊/重疊關係和包含/包容關係等。通常空間位置資訊可以分為兩類:相對空間位置資訊和絕對空間位置資訊。前一種關係強調的是目標之間的相對情況,如上下左右關係等,後一種關係強調的是目標之間的距離大小以及方位。顯而易見,由絕對空間位置可推出相對空間位置,但表達相對空間位置資訊常比較簡單。
空間關係特徵的使用可加強對影象內容的描述區分能力,但空間關係特徵常對影象或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間資訊往往是不夠的,不能有效準確地表達場景資訊。為了檢索,除使用空間關係特徵外,還需要其它特徵來配合。

常用的特徵提取與匹配方法:

提取影象空間關係特徵可以有兩種方法:一種方法是首先對影象進行自動分割,劃分出影象中所包含的物件或顏色區域,然後根據這些區域提取影象特徵,並建立索引;另一種方法則簡單地將影象均勻地劃分為若干規則子塊,然後對每個影象子塊提取特徵,並建立索引。

模式識別

模式識別是一種從大量資訊和資料出發,在專家經驗和已有認識的基礎上,利用計算機和數學推理的方法對形狀、模式、曲線、數字、字元格式和圖形自動完成識別的過程。模式識別包括相互關聯的兩個階段,即學習階段和實現階段,前者是對樣本進行特徵選擇,尋找分類的規律,後者是根據分類規律對未知樣本集進行分類和識別。廣義的模式識別屬電腦科學中智慧模擬的研究範疇,內容非常廣泛,包括聲音和語言識別、文字識別、指紋識別、聲納訊號和地震訊號分析、照片圖片分析、化學模式識別等等。計算機模式識別實現了部分腦力勞動自動化。

模式識別--對錶徵事物或現象的各種形式的(數值的,文字的和邏輯關係的)資訊進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是資訊科學和人工智慧的重要組成部分。

模式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等,屬於概念識別研究的範疇,是人工智慧的另一研究分支。我們所指的模式識別主要是對語音波形、地震波、心電圖、腦電圖、圖片、文字、符號、三位物體和景物以及各種可以用物理的、化學的、生物的感測器對物件進行測量的具體模式進行分類和辨識。

模式識別問題指的是對一系列過程或事件的分類與描述,具有某些相類似的性質的過程或事件就分為一類。模式識別問題一般可以應用以下4種方法進行分析處理。

模版比對:

統計模式識別方法:統計模式識別方法是受數學中的決策理論的啟發而產生的一種識別方法,它一般假定被識別的物件或經過特徵提取向量是符合一定分佈規律的隨機變數。其基本思想是將特徵提取階段得到的特徵向量定義在一個特徵空間中,這個空間包含了所有的特徵向量,不同的特徵向量,或者說不同類別的物件都對應於空間中的一點。在分類階段,則利用統計決策的原理對特徵空間進行劃分,從而達到識別不同特徵的物件的目的。統計模式識別中個應用的統計決策分類理論相對比較成熟,研究的重點是特徵提取。統計模式識別的基本原理是:有相似性的樣本在模式空間中互相接近,並形成“集團”,即“物以類聚”。其分析方法是根據模式所測得的特徵向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N),將一個給定的模式歸入C個類ω1,ω2,…,ωc中,然後根據模式之間的距離函式來判別分類。其中,T表示轉置;N為樣本點數;d為樣本特徵數。

統計模式識別的主要方法有:判別函式法,k近鄰分類法,非線性對映法,特徵分析法,主因子分析法等。

在統計模式識別中,貝葉斯決策規則從理論上解決了最優分類器的設計問題,但其實施卻必須首先解決更困難的概率密度估計問題。BP神經網路直接從觀測資料(訓練樣本)學習,是更簡便有效的方法,因而獲得了廣泛的應用,但它是一種啟發式技術,缺乏指定工程實踐的堅實理論基礎。統計推斷理論研究所取得的突破性成果導致現代統計學習理論——VC理論的建立,該理論不僅在嚴格的數學基礎上圓滿地回答了人工神經網路中出現的理論問題,而且匯出了一種新的學習方法——支撐向量機。

人工神經網路模式識別:人工神經網路的研究起源於對生物神經系統的研究。人工神經網路區別於其他識別方法的最大特點是它對待識別的物件不要求有太多的分析與瞭解,具有一定的智慧化處理的特點。

句法結構模式識別:又稱結構方法或語言學方法。其基本思想是把一個模式描述為較簡單的子模式的組合,子模式又可描述為更簡單的子模式的組合,最終得到一個樹形的結構描述,在底層的最簡單的子模式稱為模式基元。在句法方法中選取基元的問題相當於在決策理論方法中選取特徵的問題。通常要求所選的基元能對模式提供一個緊湊的反映其結構關係的描述,又要易於用非句法方法加以抽取。顯然,基元本身不應該含有重要的結構資訊。模式以一組基元和它們的組合關係來描述,稱為模式描述語句,這相當於在語言中,句子和短語用詞組合,詞用字元組合一樣。基元組合成模式的規則,由所謂語法來指定。一旦基元被鑑別,識別過程可通過句法分析進行,即分析給定的模式語句是否符合指定的語法,滿足某類語法的即被分入該類。

在幾種演算法中,統計模式識別是最經典的分類識別方法,在影象模式識別中有著非常廣泛的應用。