模糊和畸變場景圖像中的文字識別研究

項目摘要

在文字識別理論和技術研究中，場景圖像文字識別是圖像文字信息理解的關鍵技術。在圖像模糊和畸變條件下，場景圖像中的文字幾乎無法識別，後續的圖像理解、檢索更無從談起。該問題是進一步發展高性能文字識別技術亟待解決的關鍵問題。本項目以場景圖像文字識別系統為研究平台，深入分析模糊、畸變、缺損對場景圖像文字識別性能的影響，重點研究退化場景圖像中高性能文字識別理論和方法。具體的研究內容包括模糊圖像自動復原、文本圖像畸變校正方法、具有模糊和畸變魯棒性的高性能文字識別方法、缺損字元圖像特徵提取及識別理論和方法。在以上理論和關鍵技術研究的基礎上，研製成實用的場景圖像文字識別系統。該項目的研究涉及圖像處理、模式識別、人工智慧等多個學科，具有重要的理論研究意義。研究的成果可以推廣至基於內容的圖像搜尋、網路圖像信息監控等領域。

結題摘要

在文字識別理論和技術研究中，自然場景圖像文字識別是圖像文字信息理解的關鍵技術。圖像模糊和畸變是實際成像過程中常有的問題，此時的文字幾乎無法識別，後續的圖像理解、檢索更無從談起。該問題是進一步發展高性能文字識別技術亟待解決的關鍵問題。本項目主要包括三方面研究內容： 1.研究圖像盲恢復算法解決圖像模糊問題。首先提出了基於圖像邊緣選擇的模糊圖像盲恢復算法。研究過程中發現在原始圖像解析度條件下做復原無法達到像素級別的清晰度，於是我們探索了基於超解析度分析和模糊圖像盲恢復相結合的算法，一定程度上克服了該問題。 2.研究文字圖像的畸變矯正算法。針對自然場景中標牌等字元少、背景複雜情況，提出了一種基於J-Linkage聚類的消失點檢測的校正方法；針對文檔圖像透視畸變，提出了基於文字行消失點的校正方法；針對文檔圖像任意彎曲表面造成的畸變，提出了一種基於連通域聚類的行切分算法與基於插值的恢復算法。這些方法能夠有效解決常見的文字變形畸變問題，並在我們的THOCR軟體中得到套用和推廣。 3.針對視頻圖像和文字識別問題，提出了針對序列圖像的特徵變換降維方法，將傳統的LDA等降維方法擴展到時間維上，利用前後幀圖像上的信息共同計算特徵降維，有效提高了特徵的鑑別能力，從而提高識別率。另外，本項目對作為工具的深度卷積神經網路CNN的學習方法和壓縮方法等進行了研究。本項目的研究涉及圖像處理、模式識別、人工智慧等多個學科，具有重要的理論研究意義和實用價值。研究的成果可以推廣至基於內容的圖像搜尋、網路圖像信息監控等領域。項目發表論文12篇，其中包括SCI索引3篇，EI索引12篇。申請發明專利2項。

模糊和畸變場景圖像中的文字識別研究

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條