圖像處理運算元

圖像處理運算元是對圖像進行處理時所用到的運算元。包括全局特徵描述運算元和局部特徵描述運算元。

基本介紹

  • 中文名:圖像處理運算元
  • 外文名:Image processing operator
  • 類型:計算機科學
  • 學科:跨學科
  • 性質:運算元
  • 用途:圖像進行匹配,檢索
介紹,種類,基於分布統計的描述運算元,基於矩的描述運算元,基於濾波器的描述運算元,微分運算元,

介紹

目前計算機視覺領域的圖像內容表示方法分為基於全局特徵的圖像內容表示方法和基於局部特徵的圖像內容表示方法。為提高圖像內容表示的性能,研究者提出了大量的圖像區域描述算法,其中部分描述算法是為全局特徵設計的,部分是為局部特徵設計的。全局特徵和局部特徵描述運算元在本質上沒有明顯差別。
一種較好的圖像運算元應該具備:重複性、判別性、局部不變性、富含信息、量化描述以及精確高效等特性。

種類

基於分布統計的描述運算元

基於分布統計的描述運算元使用直方圖表現圖像的不同外觀或形狀特點下面,下面為幾種套用比較廣泛的基於分布統計的描述運算元。
1.SIFT描述運算元
可以用來描述任意的歸一化後的圖像區域,是一個3D梯度位置方向直方圖,位置被量化到4×4局部柵格,梯度角度分為8個方向,運算元為4×4×8=128維。
2.GLOH (Gradient location-orientation histogram)描述運算元
GLOH是SIFT描述子的一種延伸,為了增強其魯棒性和獨立性。以對數極坐標在半徑方向建立三個帶(6,11,15)和8個角度方向,形成17個位置帶,中心帶在半徑方向不分塊。梯度方向量化為16個帶,形成272維矢量,並利用PCA降維。
3.Shape context描述運算元
與SIFT描述運算元相似,但是基於邊緣 Shape context是一個邊緣點位置和方向的3D直方圖,以對數極坐標在半徑方向建立三個帶(6,11,15)和4個角度方向,生成36維描述子。
4.Geometric histogram描述運算元
在一個區域內描述邊緣分布直方圖。
5.PCA-SIFT描述運算元
以特徵點周圍39×39像素塊形成3024維矢量,用PCA降維36維。
6.Spin image描述運算元
是一個量化像素位置和強度的直方圖 ,在5個圓環中計算10個強度帶,生成50維運算元。
7.Steerable filters and differential invariants
是使用與高斯卷積後的導數。

基於矩的描述運算元

針對於一幅圖像,我們把像素的坐標看成是一個二維隨機變數(X,Y),那么一幅灰度圖像可以用二維灰度密度函式來表示,因此可以用矩來描述灰度圖像的特徵。矩和不變矩是一種常用的局部圖像運算元。矩特徵主要表征了圖像區域的幾何特徵,又稱為幾何矩, 由於其具有旋轉、平移、尺度等特性的不變特徵,所以又稱其為不變矩。它是一處高度濃縮的圖像特徵。

基於濾波器的描述運算元

Koenderink 和 VanDoorn 提出利用"local jet"建模人類視覺系統的感應域,後來該描述方法被Schmid和Mohr用來描述圖像區域。該描述算法基本思想是通過對待描述圖像區域與高斯函式的各階導數實施卷積運算而得到待描述區域的量化表示。Schaffalitzky和Zisserman利用複數濾波器進行圖像表示。該描述子首先對待描述圖像區域進行變換,以達到對光照和仿射具備一定的不變性,然後,在處理後的局部圖像區域上使用濾波器組濾波。除了上面提到的各濾波器,還有其他很多基於濾波器的圖像區域內容表示方法,如Schaffalitzky和Zisserman提出了複數濾波器圖像區域描述子。這些特徵對圖像內容的幾何形變以及一維仿射變換,都具有很好的魯棒性。

微分運算元

一階微分邊緣運算元,經典運算元比如:Roberts(羅伯特)、Prewitt(普魯伊特)、Sobel(索貝爾),Canny(坎尼)等,二階微分邊緣運算元,LOG邊緣檢測運算元。
其主要用於邊緣檢測,在技術上它是以離散型的差分運算元,用來運算圖像亮度函式的梯度的近似值,缺點是Sobel運算元並沒有將圖像的主題與背景嚴格地區分開來,換言之就是Sobel運算元並沒有基於圖像灰度進行處理,由於Sobel運算元並沒有嚴格地模擬人的視覺生理特徵,所以提取的圖像輪廓有時並不能令人滿意,算法具體實現很簡單,就是3*3的兩個不同方向上的模板運算,這裡不再寫出。
根據任一相互垂直方向上的差分都用來估計梯度,Robert運算元採用對角方向相鄰像素只差
該運算元與Sobel運算元類似,只是權值有所變化,但兩者實現起來功能還是有差距的,據經驗得知Sobel要比Prewitt更能準確檢測圖像邊緣。
該運算元功能比前面幾種都要好,但是它實現起來較為麻煩,Canny運算元是一個具有濾波,增強,檢測的多階段的最佳化運算元,在進行處理前,Canny運算元先利用高斯平滑濾波器來平滑圖像以除去噪聲,Canny分割算法採用一階偏導的有限差分來計算梯度幅值和方向,在處理過程中,Canny運算元還將經過一個非極大值抑制的過程,最後Canny運算元還採用兩個閾值來連線邊緣。
拉普拉斯運算元是一種二階微分運算元,若只考慮邊緣點的位置而不考慮周圍的灰度差時可用該運算元進行檢測。對於階躍狀邊緣,其二階導數在邊緣點出現零交叉,並且邊緣點兩旁的像素的二階導數異號。
6.LoG運算元
也就是 Laplace of Gaussian function(高斯拉普拉斯函式)。常用於數字圖像的邊緣提取二值化。LoG 運算元源於D.Marr計算視覺理論中提出的邊緣提取思想, 即首先對原始圖像進行最佳平滑處理, 最大程度地抑制噪聲, 再對平滑後的圖像求取邊緣。

相關詞條

熱門詞條

聯絡我們