結合前饋和反饋機制的自然場景文本識別技術

《結合前饋和反饋機制的自然場景文本識別技術》是依託北京科技大學,由殷緒成擔任項目負責人的面上項目。

基本介紹

  • 中文名:結合前饋和反饋機制的自然場景文本識別技術
  • 依託單位:北京科技大學
  • 項目負責人:殷緒成
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

自然場景文本識別(end-to-end scene text recognition),是人機互動、圖像理解、視頻檢索等套用的重要技術手段。當前技術主要把文本檢測、分割和識別等過程分離開來進行研究,而且具有非常有限的整體識別性能。本課題研究創新性結合前饋和反饋機制的端到端場景文本識別技術。首先,提出融合特徵集成的深度神經網路架構,研究高效的場景字元分類器及詞識別技術;其次,提出基於圖像特徵和識別輸出綜合學習的反饋技術,研究有效的場景文本識別信息反饋方法;第三,引入網路基序正反饋環前饋模式,提出全新的端到端場景文本識別信息前饋與反饋整體機制;最後,基於我們世界領先的自然場景文本檢測與分割技術,並結合前述創新方法,構建世界領先水平的端到端場景文本識別技術。本課題的研究成果在文字識別、模式識別、機器學習、圖像檢索等方面具有較大的理論意義和重要的實用價值。

結題摘要

自然場景文本識別(end-to-end scene text recognition),是人機互動、圖像理解、視頻檢索等套用的重要技術手段。當前技術主要把文本檢測和識別等過程分離開來進行研究,而且具有非常有限的整體識別性能。本課題研究創新性結合前饋和反饋機制的端到端場景文本識別技術。首先,提出了融合特徵集成的深度神經網路架構,構建了高效的場景字元分類器及詞識別技術;其次,提出了基於圖像特徵和識別輸出綜合學習的反饋技術,設計了有效的場景文本識別信息反饋方法;第三,提出了的端到端場景文本識別信息前饋與反饋整體機制,構建了基於跟蹤的視頻文本檢測與識別框架;最後,基於我們世界領先的自然場景文本檢測與分割技術,並結合前述創新方法,構建世界領先水平的端到端場景文本識別技術。 在本項目的資助下,項目組成員共發表18篇SCI/EI檢索期刊/會議學術論文,其中SCI論文10篇(含2篇IEEE Trans. Pattern Analysis and Machine Intelligence論文和2篇IEEE Trans. Image Processing論文)。特別的,項目組研究團隊在2015年國際文檔分析與識別大會Robust Reading Competition競賽中,榮獲“端到端自然場景文本識別(Generic)”、“端到端網路圖片文本識別(Generic)”等四項冠軍;在2017年國際文檔分析與識別大會Robust Reading Competition競賽中,又再次榮獲“大規模真實場景端到端文本識別”(Challenge on COCO-Text)冠軍。

相關詞條

熱門詞條

聯絡我們