基於相似性的圖像特徵逆向學習算法與套用

基於相似性的圖像特徵逆向學習算法與套用

《基於相似性的圖像特徵逆向學習算法與套用》是依託北京交通大學,由劉一擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於相似性的圖像特徵逆向學習算法與套用
  • 項目類別:青年科學基金項目
  • 項目負責人:劉一
  • 依託單位:北京交通大學
項目摘要,結題摘要,

項目摘要

設計圖像特徵是計算機視覺領域內的最基本研究內容之一,優秀的圖像特徵能夠有效地提高圖像分類、識別與檢索等相關算法的性能。常見的圖像特徵分為全局和局部特徵兩大類,通常,這些特徵都是利用圖像中像素點的信息計算得到。然而,人為設計的圖像特徵之間的差異往往不能足夠理想地反映圖像塊的相似性,因此這些正向設計的特徵往往在某個圖像處理任務上有較好的性能,但不能保證較好的通用性。本研究的核心是從圖像中的圖像塊間相似性度量出發,逆向生成圖像塊的特徵。這種特徵構造方法是傳統上由特徵計算相似性的逆過程,其優點是圖像塊之間的特徵差異能夠理想地反映圖像塊之間的相似性並易於分類器設計。本項目主要研究內容包括:圖像塊之間的相似性度量;根據該相似性度量設計自動的特徵提取算法以及圖像間相似性度量的構造。其最核心的問題是如何逆向構造圖像特徵,我們將設計基於矩陣不完整Cholesky分解的算法完成這個關鍵的步驟,並證明其有效性。

結題摘要

在眾多計算機視覺任務中,一個本質的難題是得出具有良好判別能力的圖像特徵表示。由於優秀的圖像特徵不僅應對類內變化有較好的不變性,還應對類間差異具有足夠的判別能力,因此設計優秀的圖像特徵是一項極具挑戰性的工作。本項目主要研究從圖像塊之間的相似性逆向構造圖像塊以及圖像特徵表示的新算法,在避免人工設計圖像特徵的基礎上,提高算法對物體、場景識別的正確率。為此,我們提出一種基於矩陣不完整Cholesky分解的新算法——高效核描述子(Efficient Kernel Descriptor-EKD),它能從圖像塊兩兩之間的相似性出發,自動提取圖像塊特徵並進而獲得整個圖像的特徵表示。在此基礎上,我們還進一步提出了結合圖像類標的不完整Cholesky分解算法——基於監督學習的高效核描述子(Supervised Efficient Kernel Descriptor-SEKD),它能夠有效地利用已知的圖像類別信息,通過監督學習,得出具有更強區分能力的圖像塊特徵表示。我們還研究了圖像邊界提取與自然場景分類中的其它特徵學習算法。在Scene-15和Caltech-101兩個標準圖像資料庫上的實驗表明,我們提出的SEKD算法分別取得了89.2%和79.3%的正確率,其性能優於核描述子(Kernel Descriptor),監督核描述子(Supervised Kernel Descriptor)等已有的圖像特徵學習算法,並在相似規模訓練樣本的基礎上取得了和Places-CNN,ImageNet-CNN等基於深度學習的圖像分類算法較接近的正確率。綜上,本項目提出的一系列圖像塊、圖像特徵的自動學習算法,不僅克服了傳統圖像分類算法需要針對特定的任務人工設計圖像特徵的局限性,還在物體識別/場景分類套用中取得了相對優秀的性能。這些算法一方面提升了經典的圖像字袋模型表示的判別能力,另一方面,它們生成的高質量底層圖像特徵也可大大降低深度學習算法直接從像素特徵進行學習的複雜度。本項目的成果對進一步深入研究圖像的特徵學習方法,融合傳統的圖像特徵表示與基於深度學習的圖像分類算法具有重要意義。

相關詞條

熱門詞條

聯絡我們