基於有監督學習的自然圖像中骨架提取和物體識別研究

《基於有監督學習的自然圖像中骨架提取和物體識別研究》是依託上海大學,由沈為擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於有監督學習的自然圖像中骨架提取和物體識別研究
  • 項目類別:青年科學基金項目
  • 項目負責人:沈為
  • 依託單位:上海大學
中文摘要,結題摘要,

中文摘要

在自然圖像中實現物體的表示與識別是計算機視覺領域的難點問題。本項目研究基於有監督學習的自然圖像中骨架提取和基於所提取骨架的圖像中物體識別。研究內容包括:研究基於學習的自然圖像中骨架檢測算法,主要解決對稱區域特徵描述符的構造問題;研究如何根據檢測得到的骨架重建準確的區域邊界並同時對骨架位置進行求精,解決該協同求精中涉及的多變數方程疊代最佳化問題;研究如何根據重建區域特徵對骨架進行去噪,解決噪聲骨架的區分性特徵的設計問題;在根據骨架段的幾何一致性進行骨架段連線後,研究基於提取骨架結合表象模型的圖像中物體定位識別算法,解決定位中涉及的骨架重建區域融合的組合最佳化問題。最後,以本項目方法模型和理論算法為基礎,研究其他相關套用問題,如文本檢測與識別和行人檢測等。

結題摘要

基於骨架的物體表示與識別是計算機視覺領域的一個基礎且重要的問題。然而當前大多數骨架提取方法只能用於已分割好的圖像。這嚴重地制約了骨架在計算機視覺主流問題中的套用,如自然圖像中物體檢測與識別。在這個項目中,我們研究如何直接從自然圖像中通過有監督的學習提取物體骨架以及如何利用提取的骨架去檢測和識別物體。我們的研究內容包括:基於多示例子空間學習的骨架檢測方法、基於深度學習的邊緣/骨架檢測方法、基於骨架的人體姿勢識別方法、結合物體輪廓和骨架的物體識別方法以及基於骨架的自然圖像中文本檢測方法。在本項目的研究過程中所提出的方法,在多個上述任務的標準數據集上取得了令人滿意的結果:在邊緣檢測標準數據集BSDS500上取得了0.76 f-measure,在對稱檢測標準數據集SYMMAX300上取得了0.454 f-measure,在骨架檢測數據集Weizmann Horse上取得了0.769 f-measure,在形狀分類標準數據集MPEG-7和Animal上分別取得了98.41%和89.04%的分類準確度以及在文本檢測標準數據集ICDAR2013上取得了0.80 f-measure。這些結果無一不是當時最好的結果(發表當時),這說明了基於骨架的物體表示與識別方法是計算機視覺領域中的一個非常有前景的研究方向。在該方向上的突破可推動整個領域的快速發展。

相關詞條

熱門詞條

聯絡我們