中國書法字識別算法研究

中國書法字識別算法研究

《中國書法字識別算法研究》是依託浙江大學,由吳江琴擔任項目負責人的面上項目。

基本介紹

  • 中文名:中國書法字識別算法研究
  • 依託單位:浙江大學
  • 項目負責人:吳江琴
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

數位化技術使歷史書法作品得以長久保存,用戶可隨時、隨地、隨意地瀏覽和欣賞。然而由於書法字字形複雜並有些變形,現有OCR方法無法進行準確識別。針對上述問題,本申請項目擬以識別中國書法字圖像、構建書法字識別工具和書法字字典為目的,針對書法字單元分割、書法字圖像形狀表達和匹配、大數據量書法字圖像的索引和快速檢索以及書法字圖像識別等關鍵科學問題,研究與書法字識別相關的算法和技術,重點研究書法字單元切割算法、書法字形狀表達和匹配算法、大數據量書法字圖像的索引和快速檢索算法以及基於檢索的書法字識別算法等,構建書法字識別工具和書法字語義標註平台,用於算法驗證和實際套用。本項目研究將賦予計算機識別書法字的認知能力,幫助用戶快速認識歷史書法作品的內容,考證和發現歷史事件、歷史文化、地理變遷等相關內容,是計算機智慧型認知和大數據技術在計算機書法套用中的一次探索,是傳統文化與大數據和信息技術的緊密結合。

結題摘要

中國書法是中國傳統文化的一塊瑰寶,以其優雅的藝術美感吸引了眾多的書法愛好者。一直以來,數字書法知識服務系統作為大學數字圖書館國際合作計畫(China Academic Digital Associative Library,CADAL)的特色子系統面向廣大的書法愛好者提供服務。但是傳統的基於元數據的瀏覽和檢索越來越不能滿足用戶的文化審美需求,本項目從書法字圖像表示、書法字圖像和書法字風格識別、漢字識別和書法字合成等方面進行研究,取得的以下成果: (1) 在書法字圖像表示方面,綜合考慮SC描述子和書法字特徵點的梯度信息,提出了OSC描述子,用以描述書法字圖像。 (2) 在書法字圖像檢索方面,提出了基於OSC-SIFT的書法字相似形快速檢索方法,通過生成近鄰集和在近鄰集精確匹配,實現對書法字快速檢索。 (3) 在書法字圖像識別方面,提出了基於檢索和基於SH-MQDF的兩種書法字圖像識別算法。 (4) 在書法字風格識別方面,提出了基於CNN-MQDF的書法字風格識別算法。用以識別區分五種不同風格書體書法字。 (5) 在漢字識別方面,提出了基於GIST-SIFT-SSC的漢字識別算法。通過使用高維度哈希索引算法減小存儲空間,加快計算速度。通過分別對GIST和SIFT特徵點進行匹配,提高檢索準確度。 (6) 在書法字合成方面,提出基於相關反饋和樸素貝葉斯的書法字合成算法,通過同時考慮待合成書法字風格和用戶偏好,合成特定風格的書法字。 基於研究成果,構建了書法字檢索、標註平台,並在CADAL(China America Digital Academic Library )門戶中得到套用;分別構建了基於Andriod和Windows平台的漢字識別套用,以此驗證了算法的有效性。

相關詞條

熱門詞條

聯絡我們