基於深度圖像特徵圖譜的多標籤圖像識別技術研究

基於深度圖像特徵圖譜的多標籤圖像識別技術研究

《基於深度圖像特徵圖譜的多標籤圖像識別技術研究》是依託華中科技大學,由王天江擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於深度圖像特徵圖譜的多標籤圖像識別技術研究
  • 項目類別:面上項目
  • 項目負責人:王天江
  • 依託單位:華中科技大學
中文摘要,結題摘要,

中文摘要

多標籤圖像包含多個尺度、位置、姿態、類別各不相同的視覺語義對象,對其進行識別是一個重要的研究方向。目前領先的深度學習算法只適用於單標籤圖像識別,最近有論文將傳統的對象區域提取方法串聯深度學習過程,用於多標籤圖像識別,但其沒有利用深度學習過程中內在的特徵圖譜,識別效率低、效果不夠好。因此,本課題將基於深度圖像特徵圖譜,研究多標籤圖像識別技術,獲得一體化的多標籤圖像分類模型,在一個框架下統一完成多標籤特徵圖譜學習、分析和分類任務,無需額外的對象預提取過程。首先,對深度學習中內在多尺度特徵圖譜進行視覺顯著性分析,得到多個顯著性區域;然後,基於區域局部特徵圖譜與空間金字塔編碼進行綜合語義重構;最後進行深度學習分類。同時在深度特徵圖譜分析和深度學習分類過程中,還採用多損失函式分別進行約束與最佳化,實現深度神經網路規則化學習。本課題研究成果不僅具有重要的理論意義,在計算機視覺相關領域也具有廣泛的套用前景

結題摘要

本項目基於深度學習框架,利用其很好的單標籤圖像分類特性,提出新的多標籤圖像識別模型。本項目首先基於多尺度深度圖像特徵圖譜進行顯著性分析,得到多目標顯著性區域,從而把顯著性檢測方法用於多標籤圖像分類任務上。相對於一般對象檢測方法得到大量的候選區域,基於特徵圖譜進行多尺度的顯著性檢測能夠極大地避免基於整幅圖像的稠密對象檢測,提高算法的運行效率。同時,在獲得顯著性區域後,本項目將利用空間金字塔編碼模式進行進一步綜合語義重構,對圖像內容進行更加全面、綜合地表征。而後,我們提出最小化多個損失函式來共同最佳化深度卷積神經網路的共有部分。基於多任務的深度學習,一方面能夠高效最佳化卷積神經網路參數,防止因為擬合一種圖像屬性而引起的過擬合現象,另一方面僅利用一個神經網路流程,就可以同時得到多個圖像屬性,可以有效的從多個方面進行多標籤圖像識別。

相關詞條

熱門詞條

聯絡我們