特徵圖像(image features)主要有圖像的顏色特徵、紋理特徵、形狀特徵和空間關係特徵。
基本介紹
- 中文名:特徵圖像
- 外文名:image features
- 包含:顏色、紋理、形狀和空間關係
- 相關:特徵提取
- 套用領域:計算機視覺
- 歸屬學科:數字圖像處理
定義
顏色特徵
顏色直方圖特徵匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累加顏色直方圖法。
紋理特徵
在檢索具有粗細、疏密等方面較大差別的紋理圖像時,利用紋理特徵是一種有效的方法。但當紋理之間的粗細、疏密等易於分辨的信息之間相差不大的時候,通常的紋理特徵很難準確地反映出人的視覺感覺不同的紋理之間的差別。
統計方法的典型代表是一種稱為灰度共生矩陣GLCM的紋理特徵分析方法Gotlieb 和 Kreyszig 等人在研究共生矩陣中各種統計特徵基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特徵:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從圖像的自相關函式(即圖像的能量譜函式)提取紋理特徵,即通過對圖像的能量譜函式的計算,提取紋理的粗細度及方向性等特徵參數
(2)幾何方法:
所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特徵分析方法。紋理基元理論認為,複雜的紋理可以由若干簡單的紋理基元以一定的有規律的形式重複排列構成。
在幾何法中,比較有影響的算法有兩種:Voronio 棋盤格特徵法和結構法。
(3)模型法:
模型法以圖像的構造模型為基礎,採用模型的參數作為紋理特徵。典型的方法是隨機場CRF模型法,如馬爾可夫(Markov)隨機場(MRF)模型法和 Gibbs 隨機場模型法。
(4)信號處理法
紋理特徵的提取與匹配主要有:灰度共生矩陣、Tamura 紋理特徵、自回歸紋理模型、小波變換等。
灰度共生矩陣特徵提取與匹配主要依賴於能量、慣量、熵和相關性四個參數。Tamura 紋理特徵基於人類對紋理的視覺感知心理學研究,提出6種屬性,即:粗糙度、對比度、方向度、線像度、規整度和粗略度。自回歸紋理模型(simultaneous auto-regressive, SAR)是馬爾可夫隨機場(MRF)模型的一種套用實例。
形狀特徵
②如果目標有變形時檢索結果往往不太可靠;
③許多形狀特徵僅描述了目標局部的性質,要全面描述目標常對計算時間和存儲量有較高的要求;
④許多形狀特徵所反映的目標形狀信息與人的直觀感覺不完全一致,或者說,特徵空間的相似性與人視覺系統感受到的相似性有差別。
另外,從 2-D 圖像中表現的 3-D 物體實際上只是物體在空間某一平面的投影,從 2-D 圖像中反映出來的形狀常不是 3-D 物體真實的形狀,由於視點的變化,可能會產生各種失真。
幾種典型的形狀特徵描述方法:
(1)邊界特徵法:
該方法通過對邊界特徵的描述來獲取圖像的形狀參數。其中Hough 變換檢測平行直線方法和邊界方向直方圖方法是經典方法。Hough 變換是利用圖像全局特性而將邊緣像素連線起來組成區域封閉邊界的一種方法,其基本思想是點—線的對偶性;邊界方向直方圖法首先微分圖像求得圖像邊緣,然後,做出關於邊緣大小和方向的直方圖,通常的方法是構造圖像灰度梯度方向矩陣。
(2)傅立葉形狀描述符法:
傅立葉形狀描述符(Fourier shape deors)基本思想是用物體邊界的傅立葉變換作為形狀描述,利用區域邊界的封閉性和周期性,將二維問題轉化為一維問題。
由邊界點導出三種形狀表達,分別是曲率函式、質心距離、復坐標函式。
(3)幾何參數法:
形狀的表達和匹配採用更為簡單的區域特徵描述方法,例如採用有關形狀定量測度(如矩、面積、周長等)的形狀參數法(shape factor)。在 QBIC 系統中,便是利用圓度、偏心率、主軸方向和代數不變矩等幾何參數,進行基於形狀特徵的圖像檢索。
需要說明的是,形狀參數的提取,必須以圖像處理及圖像分割為前提,參數的準確性必然受到分割效果的影響,對分割效果很差的圖像,形狀參數甚至無法提取。
(4)形狀不變矩法:
利用目標所占區域的矩作為形狀描述參數。
(5)其它方法
近年來,在形狀的表示和匹配方面的工作還包括有限元法(Finite Element Method 或 FEM)、旋轉函式(Turning )和小波描述符(Wavelet Deor)等方法。
空間關係特徵
空間關係特徵的使用可加強對圖像內容的描述區分能力,但空間關係特徵常對圖像或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際套用中,僅僅利用空間信息往往是不夠的,不能有效準確地表達場景信息。為了檢索,除使用空間關係特徵外,還需要其它特徵來配合。
在不同領域用於姿態估計的感測器是不一樣的,在這裡主要講基於視覺的姿態估計。
基於視覺的姿態估計根據使用的攝像機數目又可分為單目視覺姿態估計和多目視覺姿態估計。根據算法的不同又可分為基於模型的姿態估計和基於學習的姿態估計。
(1)基於模型的姿態估計方法
基於模型的方法通常利用物體的幾何關係或者物體的特徵點來估計。其基本思想是利用某種幾何模型或結構來表示物體的結構和形狀,並通過提取某些物體特徵,在模型和圖像之間建立起對應關係,然後通過幾何或者其它方法實現物體空間姿態的估計。這裡所使用的模型既可能是簡單的幾何形體,如平面、圓柱,也可能是某種幾何結構,也可能是通過雷射掃描或其它方法獲得的三維模型。
基於模型的姿態估計方法是通過比對真實圖像和合成圖像,進行相似度計算更新物體姿態。目前基於模型的方法為了避免在全局狀態空間中進行最佳化搜尋,一般都將最佳化問題先降解成多個局部特徵的匹配問題,非常依賴於局部特徵的準確檢測。當噪聲較大無法提取準確的局部特徵的時候,該方法的魯棒性受到很大影響。
(2)基於學習的姿態估計方法
基於學習的方法藉助於機器學習(machine learning)方法,從事先獲取的不同姿態下的訓練樣本中學習二維觀測與三維姿態之間的對應關係,並將學習得到的決策規則或回歸函式套用於樣本,所得結果作為對樣本的姿態估計。基於學習的方法一般採用全局觀測特徵,不需檢測或識別物體的局部特徵,具有較好的魯棒性。其缺點是由於無法獲取在高維空間中進行連續估計所需要的密集採樣,因此無法保證姿態估計的精度與連續性。
基於學習的姿態估計方法源於姿態識別方法的思想。姿態識別需要預先定義多個姿態類別,每個類別包含了一定的姿態範圍;然後為每個姿態類別標註若干訓練樣本,通過模式分類的方法訓練姿態分類器以實現姿態識別。
這一類方法並不需要對物體進行建模,一般通過圖像的全局特徵進行匹配分析,可以有效的避免局部特徵方法在複雜姿態和遮擋關係情況下出現的特徵匹配歧義性問題。然而姿態識別方法只能將姿態劃分到事先定義的幾個姿態類別中,並不能對姿態進行連續的精確的估計。
基於學習的方法一般採用全局觀測特徵,可以保證算法具有較好的魯棒性。然而這一類方法的姿態估計精度很大程度依賴於訓練的充分程度。要想比較精確地得到二維觀測與三維姿態之間的對應關係,就必須獲取足夠密集的樣本來學習決策規則和回歸函式。而一般來說所需要樣本的數量是隨狀態空間的維度指數級增加的,對於高維狀態空間,事實上不可能獲取進行精確估計所需要的密集採樣。因此,無法得到密集採樣而難以保證估計的精度與連續性,是基於學習的姿態估計方法無法克服的根本困難。
和姿態識別等典型的模式分類問題不同的是,姿態估計輸出的是一個高維的姿態向量,而不是某個類別的類標。因此這一類方法需要學習的是一個從高維觀測向量到高維姿態向量的映射,目前這在機器學習領域中還是一個非常困難的問題。
特徵提取
特徵提取的主要目的是降維。特徵抽取的主要思想是將原始樣本投影到一個低維特徵空間,得到最能反應樣本本質或進行樣本區分的低維樣本特徵。
一般圖像特徵可以分為四類:直觀性特徵、灰度統計特徵、變換係數特徵與代數特徵。
直觀性特徵主要指幾何特徵,幾何特徵比較穩定,受人臉的姿態變化與光照條件等因素的影響小,但不易抽取,而且測量精度不高,與圖像處理技術密切相關。
代數特徵是基於統計學習方法抽取的特徵。代數特徵具有較高的識別精度,代數特徵抽取方法又可以分為兩類:一種是線性投影特徵抽取方法;另外一種是非線性特徵抽取方法。
習慣上,將基於主成分分析和Fisher線性鑑別分析所獲得的特徵抽取方法,統稱為線性投影分析。
線性投影分析法的主要缺點為:需要對大量的已有樣本進行學習,且對定位、光照與物體非線性形變敏感,因而採集條件對識別性能影響較大。
核投影方法的基本思想是將原樣本空間中的樣本通過某種形式的非線性映射,變換到一個高維甚至無窮維的空間,並藉助於核技巧在新的空間中套用線性的分析方法求解。由於新空間中的線性方向也對應原樣本空間的非線性方向,所以基於核的投影分析得出的投影方向也對應原樣本空間的非線性方向。
核投影方法也有一些缺點: