視覺注意的計算模型及其套用

《視覺注意的計算模型及其套用》是依託北京大學,由王亦洲擔任負責人的面上項目。

基本介紹

  • 中文名:視覺注意的計算模型及其套用
  • 項目負責人:王亦洲
  • 項目類別:面上項目
  • 依託單位:北京大學
項目摘要,結題摘要,

項目摘要

選擇性注意是一個非常複雜的感知、認知過程,它時時刻刻影響著大腦的信息加工過程。對選擇性注意的研究自上個世紀八十年代以來一直是認知科學的熱點領域。我們在本項目中的研究目標是借鑑神經科學、心理物理學和認知科學的研究成果,針對視覺注意的兩大任務- - 不帶任務的自由掃視和任務驅動的目標搜尋,提出一套提出具有創新意義的計算理論、模型和方法,模擬大腦對(視覺)信息的選擇這一重要功能,通過計眼動實驗,在一般自然環境下驗證、比較模型的準確性。同時,將研究成果套用於圖像和視頻的復用(retargeting)、(前景)物體的檢測與分割、以及形狀分析等實際問題中,以提高它們的效果。

結題摘要

借鑑神經科學、心理物理學和認知科學的研究成果,深入研究了不帶任務的自由掃視和任務驅動的目標搜尋下圖像結構對注意過程的影響,提出了具有創新意義的計算模型與方法。代表成果包括:針對無任務自由掃視行為,(1) 提出了視覺顯著圖的心理物理學測量方法,揭示了顯著圖產生的神經機制。針對任務驅動的目標搜尋行為,研究了無上下文目標檢測的算法和利用上下文線索的目標檢測算法。對於前者,(2) 基於格式塔心理學,提出了結構稀疏的表示和貝葉斯非凸最佳化等方法,能夠高效地獲得的圖像結構,揭示了連續最佳化與離散最佳化的內在聯繫,克服了壓縮感知理論依賴隨機觀測矩陣的局限性,並給出了理論證明;(3) 提出了基於感知規則的物體語義結構分解、部件感知重要性度量(即注意在物體結構上分布)的方法,通過心理學實驗,驗證了度量的準確性,提高了嚴重遮擋情況下的物體檢測精度。對於後者,針對空間上下文,(4) 提出了融合多感知線索的三維場景重構方法和 (5) 一種基於弱監督學習的場景語義結構解析方法,建立了場景語義上下文模型,為目標搜尋提供了富有信息量的上下文線索;針對時間上下文,(6) 提出了預測編碼模型對時間上下文建模,能夠準確地預測時序視覺事件;(7) 提出了獲取與任務相關的關鍵幀(即注意在時間上的分布)的算法,提高了與任務相關的視覺事件的檢測與識別的精度。總之,本項目研究成果不僅為揭示視覺注意的神經/心理學基礎提供了依據,而且為注意在計算機視覺中的套用提供了有效的計算模型與方法。得到項目支撐的發表論文23篇,其中 17篇為CCF推薦的A類或5YIF>3論文。

相關詞條

熱門詞條

聯絡我們