噪聲環境下基於深度學習的圖像自動標註方法研究

《噪聲環境下基於深度學習的圖像自動標註方法研究》是依託福州大學,由柯逍擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:噪聲環境下基於深度學習的圖像自動標註方法研究
  • 依託單位:福州大學
  • 項目類別:青年科學基金項目
  • 項目負責人:柯逍
項目摘要,結題摘要,

項目摘要

圖像自動標註是模式識別與計算機視覺等領域的前沿課題。目前,真實圖像標註環境大多含有各類噪聲,而現有幾乎還未出現圍繞噪聲環境的圖像標註研究,因此,本課題針對噪聲環境下的圖像自動標註,開展以下三方面研究:(1)考慮到傳統淺層學習方法對複雜問題的建模與泛化能力不足,提出基於原型的稀疏降噪自動編碼機統一圖像自動標註框架,該框架基於深度學習,通過構建深度網路達到逐層降低噪聲與提升標註泛化能力,同時該框架不依賴於具體某類標註方法,能夠在噪聲環境下學習目標的本質特徵;(2)針對不斷出現的大規模新領域圖像,提出具有遷移能力的互聚類圖像自動標註算法,該方法通過少量新領域標註圖像與大量輔助訓練數據將標註信息有效遷移到大規模新領域圖像庫中;(3)利用基於群組的視覺上下文圖像標註改善模型對標註結果進行改善。本課題針對噪聲環境下的圖像自動標註提出有效解決方案,提升真實環境下圖像標註的性能,具有重要理論意義和實際套用價值。

結題摘要

圖像自動標註是模式識別與計算機視覺等領域的前沿課題。目前,真實圖像標註環境大多含有各類噪聲,本課題針對噪聲環境下的圖像自動標註,開展的主要研究工作包括:提出了基於線性棧式自動編碼器(L-SAE)的自動圖像標註模型,並在此模型基礎上提出一種分組強化訓練L-BSAE子模型的線性魯棒平衡棧式自動編碼器算法(L-RBSAE),解決了SAE模型訓練中小型數據速度上的不足;提出了基於非線性棧式自動編碼器(NL-SAE)的自動圖像標註模型,從一定程度上解決了傳統淺層機器學習算法在處理複雜分類問題時存在泛化能力不足的問題;提出一種增強訓練中低頻標籤的非線性平衡棧式自動編碼器(NL-BSAE),並在此模型基礎上提出一種分組強化訓練NL-BSAE子模型的非線性魯棒平衡棧式自動編碼器算法(NL-RBSAE),提升了圖像自動標註模型處理不平衡數據的能力;提出了融合深度特徵和語義鄰域的自動圖像標註方法,解決了傳統標籤傳播算法忽視語義近鄰而影響標註效果等問題。提出了多尺度特徵融合提取方法,該方法結合圖像的全局特徵信息和局部特徵信息,對圖像的曝光,障礙物遮擋,以及放大和縮小等問題均具有較強的魯棒性。提出了魯棒性增量極限學習機圖像自動標註方法,該方法結合了特徵抑制和增量反饋的思想,能夠在一定程度上提高標註的速度。提出了基於低秩表示的上下文正則化的運動目標檢測模型,解決了傳統方法需要針對每一場景逐一進行參數訓練等問題;提出基於稀疏模型的多場景串流視頻檢測模型,將運動目標檢測問題轉化為低秩表示下的連續性離群點檢測問題,提高了多場景串流視頻的檢測準確率,有效解決了傳統檢測算法無法適用於多場景串流視頻檢測的問題;提出了魯棒均衡策略的區域全卷積網路(BRR-FCN),通過不同框架和模型相融合的方式進一步提升模型的效果。本項目的理論研究還套用於人臉檢測與識別、行人檢測與識別、人體姿態估計與屬性識別、交通要素檢測與目標跟蹤等實際場景。

相關詞條

熱門詞條

聯絡我們