印刷體漢字識別(printed Chinese character recognition)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。
基本介紹
- 中文名:印刷體漢字識別
- 外文名:printed Chinese character recognition
- 所屬學科:計算機科學技術
- 公布時間:2018年
印刷體漢字識別(printed Chinese character recognition)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。
印刷體漢字識別(printed Chinese character recognition)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。定義一種漢字識別技術,把印刷...
1)單體印刷體漢字識別(primed character recognition):僅識別某種單一印刷體字型或者某種印表機、照排機輸出的文字。2)多體印刷體漢字識別(multi-font printed character recognition):能識別出印刷出的多種字型文字,如黑體,宋體,楷體...
漢字識別(Chinese character recognition) 套用計算機自動識別漢字,是把漢字輸入計算機的主要方式之一。定義 按書寫方式區分,漢字識別可分為手寫漢字識別和印刷體漢字識別兩大類。按工作方式區分,則可分為在線上漢字識別和脫機漢字識別兩種方式...
而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發表了第一篇關於漢字識別的文章,採用了模板匹配法識別了1000個印刷體漢字。早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主...
《中文印刷體文檔識別技術》是2010年8月1日科學出版社出版的圖書,作者是王科俊、馮偉興。內容簡介 中文印刷體文檔識別的原理、方法和系統組成,依據中文印刷體文檔的特點,分別介紹了文檔圖像預處理、版面分析、漢字識別、公式的定位與提取...
漢字圖形識別技術用於漢字輸入的裝置是光學字元識別裝置 (OCR)。人們分別就印刷體、手寫印刷體和手寫體 3種類型的識別對象進行試驗研究。從目前所得到的結果看,印刷體漢字識別無論在識別率及識別速度方面都取得了較好的結果,並已有產品...
宋體,是為適應印刷術而出現的一種漢字字型。筆畫有粗細變化,而且一般是橫細豎粗,末端有裝飾部分(即“字腳”或“襯線”),點、撇、捺、鉤等筆畫有尖端,屬於襯線字型(serif),常用於書籍、雜誌、報紙印刷的正文排版。宋朝文化...
機器印刷術的歷史產物。至少已有一百年的時間,黑體漢字抹掉了漢字手書體的一切人為印跡及其造字淵源,沒有手書的起始和收筆;它以幾何學的方式確立漢字的基本結構(它是構建性的,而非書寫性的),其均勻的筆畫寬度和平滑的筆畫弧度表現...
OCR產品已由早期的只能識別指定的印刷體數字、英文字母和部分符號,發展成為可以自動進行版面分析、表格識別,實現混合文字、多字型、多字號、橫豎混排識別的強大的計算機信息快速錄入工具。對印刷體漢字的識別率達到98%以上,即使對印刷質量...
在線上手寫識別是指將在手寫設備上書寫時產生的有序軌跡信息轉化為漢字內碼的過程,實際上是手寫軌跡的坐標序列到漢字內碼的一個映射過程。如圖《eJHWR體系結構》所示 jHWR引擎特點 1.中文識別範圍 2. 多個識別字典可供選擇 3. 多語種...
《少數民族文字識別的理論和方法的研究》是依託清華大學,由丁曉青擔任項目負責人的專項基金項目。項目摘要 在漢字識別已取得重大研究成果的基礎上,少數民族文字識別不僅是文字識別領域的重要開拓性研究,而且成為提高各民族地區信息化水平的...
若採用抽取漢字圖像中關鍵特徵點來描述漢字,則特徵點的抽取易受噪聲點、筆畫的粘連與斷裂等影響,總之,單純採用結構模式識別方法的印刷體漢字識別系統的識別率是很低的。識別系統 一個結構摸式識別系統可認為由三個主要部分組成,它們...
135討論(303)第14章模式識別在語音信號數字處理中的套用舉例(305)141說話人識別概述(305)142語音信號及其幾個特性(306)143短時基音周期的估計(310)144一個說話人識別系統舉例(312)145討論(314)第15章印刷體漢字識...
60年代後期,出現了多種字型和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用於信函分揀的手寫體數字識別機和印刷體英文數字識別機。70年代主要研究文字識別的基本理論和研製高性能的文字識別機,並著重於漢字識別的研究...
機器根據所選漢字在盤面上的位置將其對應編碼送入計算機。如今,通過語音和圖像識別技術,計算機能直接將漢語和漢字文本轉換為機器碼,已經有多種語音識別系統和多種手寫體、印刷體的漢字識別系統面世,相信還有更完美的產品推出。
簡繁字集:除了簡體漢字外,還可以混識台灣繁體字5400多個以及香港繁體字和GBK漢字。識別字型種類:能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字型,並支持多種字型混排。識別字號:初號 小六號字型。表格識別:可以自動...
智慧型圖文信息處理方向主要從事模式識別與圖象處理、中文信息處理及相關的研究。該研究方向在模式識別與圖象處理方面側重於對版式識別、漢字識別技術的研究。它們作為新一代計算機智慧型接口的重要組成部分,是印刷文檔自動、高速輸入計算機及實現"...
清華大學智慧型圖文信息處理研究室於1984年開始了文字識別研究領域的探索。1989年開創我國第一套“多字型多字號印刷漢字識別系統”,以THOCR品牌推向產品化,獲得1991年國家教委科學技術進步一等獎和1992年國家科技進步三等獎。1994年完成我國...
(3)漢語語言文字處理。語料庫語言學和計算辭彙學;機器翻譯;語音識別與合成技術;手寫體、印刷體漢字識別技術等。(4)智慧型機器人技術與系統。感測信息處理與可視化;智慧型控制理論與技術;空間機器人技術;移動機器人技術與系統。(5)...
目前在線上手寫單字手寫識別率已經很高,但是由於自由手寫體的切分難度大,使得手寫輸入的識別還有待提高,因此,解決自由手寫體切分顯得十分重要。漢字是方塊字,因此,在切分的時候手寫字元的外框線反應了重要的切分信息。對於不同的位置關係,...