興趣點檢測器

興趣點,又被稱作為點特徵,指的是圖像中具有特殊性質的像素點,是圖像的重要特徵。它具有旋轉不變性和不隨光照條件變化的優點。興趣點檢測器是一種找到能夠在其他圖像中穩定匹配的圖像位置(適合跟蹤的特徵)的一種技術或方法,廣泛套用計算機視覺領域中。

基本介紹

  • 中文名:興趣點檢測器
  • 外文名:Interest point detector 
  • 別稱:特徵檢測器
  • 歸屬學科:數字圖像處理
  • 相關書籍:計算機視覺—算法與套用
  • 套用領域:計算機視覺
興趣點,興趣點檢測器,自適應非最大抑制,衡量可重複性,尺度不變,旋轉不變和方向估計,

興趣點

興趣點,又被稱作為點特徵,指的是圖像中具有特殊性質的像素點,是圖像的重要特徵。它具有旋轉不變性和不隨光照條件變化的優點。一些圖像處理中利用點特徵進行處理既可以減少計算量又不會損失重要的灰度信息。經過對它們執行局部分析,如果能夠檢測到足夠多的這種點,同時它們區分度很高,並且可以精確定位穩定的特徵。這類點被大量用於解決物體識別,圖像匹配,視覺跟蹤,三維重建等問題。

興趣點檢測器

我們怎么樣才能找到能夠在其他圖像中穩定匹配的圖像位置?即什麼是適合跟蹤的特徵?
無明顯紋理結構的圖像塊幾乎不可能定位,而擁有較大對比度變化(梯度)的則比較容易定位,儘管一個單一方向的直線段存在著“孔徑問題”,也就是說,僅可能沿著邊緣方向的法線方向進行對齊。擁有至少兩個(明顯)不同方向梯度的圖像塊最容易定位。
用最簡單的可能匹配策略來比較兩個圖像塊,也就是,它們的(加權)差的平方和:
其中,
是兩幅需要比較的圖像,
是平移向量,
是空間上變化的權重(或視窗)函式,求和變數i 作用於塊中的全體圖像像素。
在進行特徵檢測時,我們不知道該特徵被匹配時會終止於哪些相對的其他圖像位置的匹配。因此,我們只能在一個小的位置變化區域
內,通過與原圖像塊進行比較來計算這個匹配結果的穩定度,這就是通常所說的“自相關函式”或自相關表面。
使用圖像函式
的泰勒展開式,我們將自相關表面近似為:
其中,A為自相關矩陣
矩陣A的逆矩陣給出了匹配塊所在位置不確定度的一個下界。這一點最初由Anandan指出。因而,對於哪一個塊可以穩定匹配,它是一個非常有用的指示器。為了可視化和分析這個不確定度,最簡單的方法是對自相關矩陣A進行特徵值分析,這就產生了兩個特徵值
,和兩個特徵向量方向。因為較大的不確定度取決於較小的特徵值,所以通過尋找較小的特徵值的最大值尋找好的特徵以便於跟蹤。
儘管 Anandan, Lucas and Kanade 是第一個分析自相關矩陣不確定性結構的,但是它們當時的背景是為光流測量確定性。Forstern 和 Harris and Stephens是第一個提出使用從自相關導出的旋轉不變測量的局部最大值來定位關鍵點以達到匹配稀疏特徵之目的。Schmid , Mohr and Bauckage ;Triggs等給出了更具體的關於特徵檢測算法的歷史回顧。這兩種方法都提出使用高斯權重視窗來替換方塊圖像塊,這使檢測的回響對於圖像平面內旋轉不敏感。
特徵值的最小值
不是唯一可以用來尋找關鍵點的量,另一個由Harris and Stephens 提出的更簡單的量是:
其中,a=0.05。
與特徵分析不同,這個量不要求使用平方根且仍能保持旋轉不變,同時降低了那些
的邊界類權重。
Triggs建議使用這個量:
它能夠減小1維的邊緣回響,但圖像失真錯誤有時會使較小的特徵值變大。他也指出了如何將基本的2×2 Hessian矩陣擴展到參數化運動中來,以檢測那些能夠在尺度和旋轉變化下可準確定位的點。
另一方面,Brown,Szeliski and Winder使用調和均值:
的區域,它是一個更加平滑的函式。

自適應非最大抑制

由於大多數特徵點檢測器只尋找興趣函式的局部最大值,所以這通常會導致圖像上特徵點的非均勻分布,比如,在對比度較大的區域,特徵點就會比較密集,為了緩解這個問題,Brown,Szeliski and Winder就只檢測那些同時是局部最大值且其回響明顯大於(10%)其周圍半徑r區域內的回響的特徵。他們設計了一種高效的為所有局部最大值關聯一個抑制半徑的方法,這種方法首先根據特徵點的回響強度對其進行排序,然後通過不斷減小抑制半徑大小來建立第二個排序列表。

衡量可重複性

計算機視覺領域中開發有各種各樣的特徵檢測器,我們如何決定使用哪一個呢?
Schmid,Mohr and Bauckhage第一個提出了衡量特徵檢測器的可重複性思想,他們將可重複性定義在一幅圖像中檢測到的關鍵點在另一幅變換過的圖像中的對應位置的
個像素範圍內找到的頻率。在他們的論文中,他們對平面圖像進行各種變換,包括旋轉、尺度變換、光照變化、視角變化以及增加噪聲。他們同時也衡量了檢測到的每一個特徵點的“可用信息量”,這個信息量被定義為一個旋轉不變的局部灰度描述子集合的熵。

尺度不變

在很多情況下,在最精細的穩定尺度上檢測特徵點可能不是很合適。比如,在匹配那些缺乏高頻細節的圖像時,精細尺度的特徵可能不存在。
這個問題的一種解決方法時在不同的尺度上提取特徵點,比如,通過在圖像金字塔的多個解析度上都進行這樣的操作,然後在同一個水平上進行特徵匹配。這種方法對於待匹配的圖像無較大尺度變化時比較合適,比如,匹配從飛機上拍攝到的鳥瞰圖序列時或者在做又固定焦距攝像機拍攝的全景圖拼接時。

旋轉不變和方向估計

除了處理尺度變化,大多數圖像匹配和物體識別算法需處理(至少)平面內圖像旋轉。處理這個問題的一種途徑是設計出旋轉不變的描述子,但是這些描述子區分性較弱,也就是說,對於同一個描述子,它們映射出不同的塊。
一個較好的方法是在檢測到的每一個關鍵點估計一個“主導方向”。一旦估計出一個關鍵點的局部方向和尺度,就可以在檢測出的關鍵點附近提取出一個特定尺度和方向的圖像塊。

相關詞條

熱門詞條

聯絡我們