手寫識別

手寫識別

手寫識別(HandWriting Recognition)是指將在手寫設備上書寫時產生的有序軌跡信息化轉化為文字的過程。

基本介紹

  • 中文名:手寫識別
  • 外文名:HandWriting Recognition
  • 釋義:有序軌跡信息化轉化為漢字內碼
  • 性質:人機互動的有效手段
  • 一般過程:預處理;特徵的提取;分離出字元
  • 實質:映射過程
識別技術,結構特點,脫機手寫識別,線上手寫識別,支持環境,

識別技術

手寫套用手寫套用
手寫識別(HandWriting Recognition)是指將在手寫設備上書寫時產生的有序軌跡信息化轉化為漢字內碼的過程,實際上是手寫軌跡的坐標序列到漢字的內碼的一個映射過程,是人機互動最自然、最方便的手段之一。
隨著智慧型手機、掌上電腦等移動信息工具的普及,手寫識別技術也進入了規模套用時代。
手寫識別能夠使用戶按照最自然、最方便的輸入方式進行文字輸入,易學易用,可取代鍵盤或者滑鼠。用於手寫輸入的設備有許多種,比如電磁感應手寫板、壓感式手寫板、觸控螢幕、觸控板、超音波筆等。
手寫識別屬於文字識別模式識別範疇,文字識別從識別過程來說分成脫機識別(off-line)和在線上識別(on-line)兩大類,從識別對象來說又分成手寫體識別和印刷體識別兩大類,我們常說的手寫識別是指在線上手寫體識別。

結構特點

jHWR手寫識別系統以先進的大容量字典技術為基礎,是一種能夠在任何時間、任何地點,向任何人實時、準確的提供手寫識別服務的高效便捷手段,非常符合資訊時代動態更新和個性化查詢的需求。
JHWR體系結構
在線上手寫識別是指將在手寫設備上書寫時產生的有序軌跡信息轉化為漢字內碼的過程,實際上是手寫軌跡的坐標序列到漢字內碼的一個映射過程。 下圖為eJHWR的體系結構展示:
jHWR引擎特點
1.中文識別範圍
2. 多個識別字典可供選擇
3. 多語種識別
4. 更高的識別效果
5. 出色的識別引擎性能
6. 完善的識別功能庫
7. 多樣化的輸出結果
eJHWR體系結構eJHWR體系結構
jHWR的識別產品圖
JHWR的識別產品圖JHWR的識別產品圖
jHWR的識別流程
jHWR識別流程jHWR識別流程

脫機手寫識別

離線手寫識別涉及到將圖像中的文本自動轉換成是計算機可以使用的字元代碼。離線手寫識別是比較困難的,因為不同的人有不同的書寫風格。離線手寫識別主要套用在列印出來的文字識別上。
減少識別錯誤的技術
常常使用縮小識別範圍,例如郵政編碼只包含1~9的數字,識別這種數字可以減少錯誤的可能。
主要的技術:
指定特定的字元範圍;
利用字元的專有特點。
字元的提取
離線字元識別往往涉及掃描過去寫的表格或文檔。這意味著該設備或軟體需要將掃描的圖像中所包含的單個字元提取出來。然而,在這一步中有幾種常見的缺陷。其中最常見的是將多個相連的字元當作為單個字元分離出來。這增加了識別的難度,但現在許多軟體已經開始適應這種問題。
字元的識別
當單個字元的提取出來後,識別引擎開始計算其對應的計算機字元。現在有幾種不同的識別技術。
特徵的提取
除了人工神經網路外,程式設計師有時必須手動確定他們感覺很重要的屬性。
這些屬性可能是:
寬高比;
水平方向上的像素百分比;
豎直方向上的像素百分比;
筆畫數;
字元到圖像中心的平均距離;
這種方法可以提高識別的準確性,但需要花費更多的研發時間。

線上手寫識別

一般過程
線上手寫識別可以分解為幾個通用的步驟:
預處理;
特徵的提取;
分離出字元。
預處理的目的是摒棄無關的輸入數據,可以減少負面的影響。這涉及到速度和準確性。通常由圖像二值化、 正常化、 採樣、 平滑、去噪預處理等組成。

支持環境

(一)eJHWR技術,運用句法結構自學習算法和基於特徵統計算法的多核心融和技術。具有如下特點:
1.識別率高。
2.識別速度快。
3.無筆順限制。
4.數據字典大小可縮擴。
(二)eJHWR支持環境
OS: WinCE , Nucleus, Embedded Linux , Symbian, Palm Os, HOPEN, pSOS, UCOS
CPU: DragonBall(Motorola 68000) EZ(16M) 和VZ(33M),MIPS, SH3, SH4, ARM7, StrongARM, ARM9, Xscale等
(三)eJHWR可以帶來如下主要功能:
1.文本輸入— 取代鍵盤輸入的頻繁按鍵,文字元號夾雜時免去頻繁的輸入方式切換,遇到不確定讀音的文字也可照常書寫。
2.快速定位— 用手寫筆擔當滑鼠,快速定位,比鍵盤操作自如得多。
3.快速查詢— 當選單層級太深或者不知道該查詢信息的準確分類時,調用手寫輸入,免除頻繁而茫然的鍵盤操作實現快速查詢。

相關詞條

熱門詞條

聯絡我們