基本介紹
- 中文名:顏色共生矩陣
- 外文名:color co-occurrence matrix
- 學科:計算機
- 定義:共生矩陣整合顏色和紋理信息
- 有關術語:灰度共生矩陣
- 領域:人工智慧
簡介,有關研究,灰度共生矩陣,自動目標識別,經典的統計模式識別方法,基於知識的自動目標識別方法,基於模型的自動目標識別方法,基於多感測器信息融合的自動目標識別方法,
簡介
顏色、紋理和形狀是用以描述圖像屬性的最基本底層特徵,廣泛套用於目標識別任務。鑒於顏色對目標的尺度、旋轉和姿態變化魯棒,並能適應一定的視點變化,因此,與灰度圖像相比,彩色圖像的顏色特徵能提供更豐富且魯棒的鑑別信息。紋理是圖像的一種區域性特徵, 它在圖像上表現為灰度或顏色分布的某種規律性,通常被用來描述目標表面的粗糙程度和它的方向性的規律性。
顏色共生矩陣是利用共生矩陣方法整合圖像中顏色和紋理信息。從視覺識別技術的發展進程來看, 在一個識別系統中整合和利用不同類型特徵的互補信息已成為一種趨勢。新近的研究表明, 在各種形式的底層特徵融合方案中, 顏色和紋理特徵的融合通常具有高效率和強鑑別性。
有關研究
在基於內容的圖像檢索( Content-Based Image Retrieval, CBIR)系統中,顏色、紋理和形狀特徵是被廣泛套用的底層視覺特徵。其中,顏色和紋理特徵因其計算簡單、高效,成為在 CBIR 系統中構建圖像特徵資料庫首選特徵,其實,顏色與紋理是兩種具有互補性的視覺特徵。人們通常先通過顏色特徵發現感興趣的對象,然後根據它們的紋理特徵來進一步識別,將兩種特徵結合起來刻畫圖像已經成為研究者的共識。顏色與紋理描述符按照結合的緊密程度可分為:1) 鬆散結合。所謂鬆散結合是指用某種顏色和紋理描述符分別提取圖像的顏色和紋理特徵矢量,並將它們結合起來作為圖像特徵矢量。一種基於顏色和紋理融合特徵的描述符就屬於這一類。鬆散結合法可以直接利用現有各種成熟的顏色和紋理描述符,但它所獲得的特徵矢量總維數是顏色和紋理特徵矢量維數之和。與單獨使用顏色或者紋理特徵相比,特徵矢量維數增加了不少,這將降低其在圖像檢索時的查詢效率。2)緊湊結合。所謂緊湊結合是指將顏色和紋理特徵的提取過程進行緊密整合,以試圖降低描述符特徵矢量的總維數。Color Cor-relograms 描述符在顏色直方圖的基礎上將像素點之間空間關係引入到描述符中。它具有同時描述圖像顏色和紋理特徵的能力,但是特徵矢量所需的維數比較大,是圖像量化顏色數的平方。相鄰像素點之間的距離差定義 7 種遊歷模式,然後通過建立 Motifs 共生矩陣對圖像紋理特徵進行描述,該描述符特徵矢量的維數為 49 維。
灰度共生矩陣
灰度共生矩陣,指的是一種通過研究灰度的空間相關特性來描述紋理的常用方法。1973年Haralick等人提出了用灰度共生矩陣來描述紋理特徵。由於紋理是由灰度分布在空間位置上反覆出現而形成的,因而在圖像空間中相隔某距離的兩像素之間會存在一定的灰度關係,即圖像中灰度的空間相關特性。灰度直方圖是對圖像上單個像素具有某個灰度進行統計的結果,而灰度共生矩陣是對圖像上保持某距離的兩像素分別具有某灰度的狀況進行統計得到的。取圖像(N×N)中任意一點 (x,y)及偏離它的另一點 (x+a,y+b),設該點對的灰度值為 (g1,g2)。令點(x,y) 在整個畫面上移動,則會得到各種 (g1,g2)值,設灰度值的級數為 k,則(g1,g2) 的組合共有 k 的平方種。對於整個畫面,統計出每一種 (g1,g2)值出現的次數,然後排列成一個方陣,再用(g1,g2) 出現的總次數將它們歸一化為出現的機率P(g1,g2) ,這樣的方陣稱為灰度共生矩陣。距離差分值(a,b) 取不同的數值組合,可以得到不同情況下的聯合機率矩陣。(a,b) 取值要根據紋理周期分布的特性來選擇,對於較細的紋理,選取(1,0)、(1,1)、(2,0)等小的差分值。
當 a=1,b=0時,像素對是水平的,即0度掃描;當a=0,b=1 時,像素對是垂直的,即90度掃描;當 a=1,b=1時,像素對是右對角線的,即45度掃描;當 a=-1,b=1時,像素對是左對角線,即135度掃描。
這樣,兩個象素灰度級同時發生的機率,就將 (x,y)的空間坐標轉化為“灰度對” (g1,g2)的描述,形成了灰度共生矩陣。
自動目標識別
自動目標識別(英語:Automatic target recognition,縮寫ATR)是基於感測器獲取的數據識別目標或對象的算法或設備。目標識別最早是通過接收可聽信號來完成,經訓練的操作者將根據雷達照射目標所產生的聲音而分類目標。雖然訓練有素的操作員很成功,但自動化的方法也已開發,並繼續向更高的分類精度和速度發展。自動目標識別可用於識別人造物體,例如地面、飛行器以及生物目標(例如動物、人類和植物雜波)。這對於識別和濾除戰場上的大群鳥類在都卜勒天氣雷達上引起的干擾等是有用的。軍事套用則包括簡單的識別系統,例如IFF轉發器,以及無人航空載具和巡航飛彈等其他套用。在民用領域使用自動目標識別也有著越來越多的嘗試。例如使用自動目標識別確保邊界安全,使用安全系統識別捷運軌道等上的物體或人體等。
經典的統計模式識別方法
該方法主要是利用目標特性的統計分布,依靠目標識別系統的大量訓練和基於模式空間距離度量的特徵匹配分類技術,可在較窄的場景定義域內獲得較有效的識別。該方法是早期使用的方法,僅在很窄的場景定義域內,且在目標圖像和周圍背景變化不大的情況下才比較有效,難以解決姿態變化、目標污損變模糊、目標部分被遮蔽等問題。
基於知識的自動目標識別方法
20 世紀 70 年代末,人工智慧專家系統開始套用到 ATR 的研究,形成了基於知識的ATR,即知識基( Knowledge Based ,KB) 系統。基於知識的 ATR 算法在一定程度上克服了經典統計模式識別法的局限性和缺陷,該方法目前存在的主要問題是可供利用的知識源的辯識和知識的驗證很困難,同時難以在適應新場景中有效地組織知識。
基於模型的自動目標識別方法
模型基 (Model Based ,MB) 的方法首先是將複雜的目標識別的樣本空間模型化,這些模型提供了一種描述樣本空間各種重要變化特性的簡便途徑。典型的 MB 系統抽取一定的目標特性,並利用這些特性和一些輔助知識來標記目標的模型參數,從而選擇一些初始假設,實現目標特性的預測。一個 MB 系統的最終目標是匹配實際的特性和預測後面的特性,若標記準確,匹配過程則會成功和有效。MB 方法目前尚限於實驗室研究階段。
基於多感測器信息融合的自動目標識別方法
單一感測器的導引頭在有光、電干擾的複雜環境中 ,目標搜尋和知識識別的能力、抗干擾能力及其工作可靠性都將降低。20 世紀80 年代興起的基於多感測器信息融合 (Multi2sensor Information Fusion Based ,MIFB) 的 ATR 方法克服了單一感測器系統的缺陷,每個感測器將數據饋入各自的信號處理機,先分別進行目標檢測,得出有無目標的判決以及目標的位置信息或運動軌跡,然後將這些信息送入數據融合單元,對目標位置或運動軌跡進行關聯後再做進一步的判決。從輸入信息的形式來看,信息融合可在決策層、特徵層或像素層等各個層次進行。像素層融合是最低層次的屬性融合,即將各個圖像感測器數據直接融合,而後對融合的數據進行特徵提取。這一層次的信息融合能夠提供其他層次的融合所不具備的細節信息,採用的融合方法有邏輯濾波器、數學形態學、模擬退火、小波變換等。特徵層融合是中間層次的融合,它是先對各個感測器的觀測進行特徵提取,產生特徵矢量,再將這些特徵矢量融合,並作出基於聯合特徵矢量的屬性說明。該層次的融合是像素層融合和決策層融合的折中形式,兼有二者的優缺點,具有較大的靈活性,常用的方法有擴展 Kalman 濾波、約束高斯—馬爾可夫估計、分片統計等。決策層融合是最高層次的融合,這種方法是在感測器的觀測基礎上產生特徵矢量,對這些特徵矢量進行模式識別處理並作出相應的關於目標的屬性說明,再將各圖像感測器的屬性說明數據進行關聯和合成,得到該目標的一個聯合的屬性說明。常用方法有 Bayes 推理、D2S證據推理、模糊邏輯以及近年來湧現的人工神經網路和支撐向量機等。基於人工神經網路和專家系統的自動目標識別方法。專家系統是以邏輯推理為基礎,模擬人類思維的人工智慧方法。人工神經網路(ANN) 是以神經元連線結構為基礎,通過模擬人腦結構來模擬人類形象思維的一種非邏輯、非語言的人工智慧方法。ANN 自底向上的訓練和歸納判斷特性與專家系統的積累知識的自頂向下的利用特性,可以實現很好的互相補充結合,提供更強的處理信息能力。二者混合使用的結構形式有並接結構、串接結構和嵌入結構三種。並接結構系統可並列使用專家系統和神經網路;在串接結構中,各模組獨立工作,實現各自特定的功能串聯連線;嵌入結構是在專家系統內嵌入小型神經網路或者在 ANN 內嵌入小型專家系統以改善系統性能。ANN技術可以提供 ATR 算法固有的直覺學習能力,在目標分類處理中有許多算法都可由 ANN 有效地實現。