《基於深度學習的漢字書寫風格建模與重建方法研究》是依託北京大學,由肖建國擔任負責人的面上項目。
基本介紹
- 中文名:基於深度學習的漢字書寫風格建模與重建方法研究
- 項目負責人:肖建國
- 項目類別:面上項目
- 依託單位:北京大學
項目摘要,結題摘要,
項目摘要
近年來,漢字書寫危機引起國人的廣泛關注與警覺,隨著計算機與智慧型移動設備的使用和普及,人們的漢字書寫能力顯著下降。主要原因之一是,當前除了手寫輸入外其他面向漢字書寫的各種套用的研究與開發還不成熟,在信息技術帶來的無紙化趨勢的衝擊下,需要手寫漢字的場合越來越少。本項目擬通過對漢字書寫風格建模與重建機理的深入研究,解決包括海量手寫漢字數據挖掘、漢字書寫軌跡精確匹配、漢字書寫風格特徵提取等關鍵技術,提出適用於漢字書寫風格建模的深度人工神經網路的構建與訓練方法,結合最優形狀插值等技術來實現漢字書寫風格的精確重建,並使用該風格建模與重建方法來顯著提升面向漢字的筆跡鑑定、數字墨水和手寫體字型檔自動生成系統的套用效果。本項目的研究一方面有望解決採用現有方法難以處理的漢字書寫風格的建模與重建難題;另一方面將推動漢字書寫在計算機與移動終端上的使用與流行,具有重要的理論和套用價值,預期將產生顯著的社會與經濟效益。
結題摘要
隨著計算機與智慧型移動設備的使用和普及,人們的漢字書寫能力顯著下降。主要原因之一是,當前除了手寫輸入外其他面向漢字書寫的各種套用的研究與開發還不成熟,在信息技術帶來的無紙化趨勢的衝擊下,需要手寫漢字的場合越來越少。 本項目通過對漢字書寫風格建模與重建機理的深入研究,解決包括海量手寫漢字數據挖掘、漢字書寫軌跡精確匹配、漢字書寫風格特徵提取等關鍵技術,提出適用於漢字書寫風格建模的深度人工神經網路的構建與訓練方法,結合最優形狀插值等技術來實現漢字書寫風格的精確重建,並使用該風格建模與重建方法來顯著提升面向漢字的字型識別、數字墨水和手寫體字型檔自動生成系統的套用效果。 主要研究成果有:(1)提出了若干面向漢字的字型風格描述與特徵表達方法,較好地解決了乾淨/複雜背景下的漢字字型識別問題和漢字字形美觀度評價難題;(2)提出了一種面向漢字的結構信息保持的字形圖片縮放算法,並將其套用在基於部件拼接的高質量中文字型檔自動生成上;(3)提出了一種基於風格學習的大規模手寫體中文字型檔自動生成系統,使得普通用戶擁有自己的手寫體中文字型檔的夢想成為可能;(4)提出了一種基於深度神經網路的中文字型檔端對端自動生成系統;(5)提出了一種基於深度堆疊網路的結構信息指導的中文字型檔生成方法。 基於上述研究成果,在本項目的資助下,課題組共發表學術論文22篇,包括相關領域頂級(CCF A類)會議和雜誌論文12篇(其中SCI雜誌長文2篇,會議長文5篇、會議短文5篇)。申請國家發明專利7項。字型檔自動生成方面的研究成果已經投入實用,與方正手跡公司合作開發的個人字型檔快速製作與自動生成系統(手跡造字APP)已有近百萬註冊用戶,自動生成了10多萬套完整中文字型檔。 本項目的研究一方面解決了採用現有方法難以處理的漢字書寫風格的建模與重建難題;另一方面推動了漢字書寫在計算機與移動終端上的使用與流行,具有重要的理論和套用價值,已經產生良好的社會與經濟效益。