視覺顯著性檢測

視覺顯著性檢測簡介

人類視覺系統在面對自然場景時具有快速搜尋和定位感興趣目標的能力，這種視覺注意機制是人們日常生活中處理視覺信息的重要機制。隨著網際網路帶來的大數據量的傳播，如何從海量的圖像和視頻數據中快速地獲取重要信息，已經成為計算機視覺領域一個關鍵的問題。通過在計算機視覺任務中引入這種視覺注意機制，即視覺顯著性，可以為視覺信息處理任務帶來一系列重大的幫助和改善。引入視覺顯著性的優勢主要表現在兩個方面，第一，它可將有限的計算資源分配給圖像視頻中更重要的信息，第二，引入視覺顯著性的結果更符合人的視覺認知需求。視覺顯著性檢測在目標識別，圖像視頻壓縮，圖像檢索，圖像重定向等中有著重要的套用價值。視覺顯著性檢測模型是通過計算機視覺算法去預測圖像或視頻中的哪些信息更受到視覺注意的過程。

視覺顯著性（Visual Attention Mechanism，VA，即視覺注意機制）是指面對一個場景時，人類自動地對感興趣區域進行處理而選擇性地忽略不感興趣區域，這些人們感興趣區域被稱之為顯著性區域。如圖1所示，當看到這幅圖像時，圖中的四個人最能引起人的注意。

視覺顯著性包括從下而上和從上往下兩種機制。從下而上也可以認為是數據驅動，即圖像本身對人的吸引，從上而下則是在人意識控制下對圖像進行注意。計算機視覺領域主要做的是從下而上的視覺顯著性，而從上而下的視覺顯著性由於對人的大腦結構作用不夠了解，無法深刻的揭示作用原理，在計算機視覺領域的研究也相應很少。

自底而上基於數據驅動的注意機制

僅受感知數據的驅動,將人的視點指導到場景中的顯著區域；通常與周圍具有較強對比度或與周圍有明顯不同的區域吸引自下而上的注意。利用圖像的顏色、亮度、邊緣等特徵表示，判斷目標區域和它周圍像素的差異，進而計算圖像區域的顯著性。圖1為自下而上的注意,第5列紅色條和第 4 列的豎直擺放的條形能立即引起人的注意。

自上而下基於任務驅動的目標的注意機制

由人的“認知因素” 決定, 比如知識、預期和當前的目標.對圖像的特定特徵來計算圖像區域的顯著性。圖2為自上而下的注意, 監控任務下, 場景中的人體能引起注意。