基於深度信息的複雜場景文字識別研究

項目摘要

複雜場景的文字識別是目前文字識別領域的研究熱點之一。現階段制約場景文字識別準確性的瓶頸因素之一在於深度信息的缺乏。由於現有的場景文字圖像數據基本均不包含深度信息，幾乎所有的場景文字識別方法都局限在二維場景空間進行，文字識別的準確性不高。本課題擬利用深度信息，對二維空間、以及三維空間的複雜場景文字識別問題展開研究。具體的研究內容如下：（1）採集具有深度信息的三維場景文字圖像，利用場景深度信息設計三維場景文字識別方法；（2）通過基於樣本學習的方法，利用已知的三維場景深度對二維場景進行深度估計；（3）結合場景深度，將二維場景中的字元恢復三維軌跡，以實現字元的變形糾正及識別。本課題探索基於深度信息的三維場景文字識別方法，驗證深度信息對於二維場景文字識別的有效性。該課題的研究對於文字識別、機器視覺等領域的發展有著重要意義。目前申請人已在文字識別相關領域發表SCI/EI論文7篇，積累了良好的研究基礎。

結題摘要

本項目以複雜場景下的文字定位和文字識別為對象進行研究。複雜場景下文字特徵的提取易受干擾且不穩定，不利於文字區域的定位和識別。本項目的研究內容包括：1、利用文本區域的周期性，提取有效特徵來描述場景圖像的文字區域，以更好地進行文字定位。2、利用子空間平滑的方法變換文字特徵，以提高文字識別的準確性。3、利用生成模型和有限樣本模擬文字特徵的機率分布，並用辨別模型產生文字類別的特徵，以降低文字識別中的類間干擾和類內干擾。以上研究的成果已發表SCI論文3篇，授權專利1項。

基於深度信息的複雜場景文字識別研究

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條