智慧型文檔處理

智慧型文檔處理

計算機在理解文檔的基礎上,對文檔進行自動處理。常見的典型形式包括:

文檔的自動或半自動生成、文檔的自動理解、文檔的一致性分析、文檔的自動糾錯、文檔與業務流程的整合、文檔的語義檢索、複合出版、文檔的協同、文檔的自動評價、文檔的審計等等。

基本介紹

  • 中文名:智慧型文檔處理
  • 外文名:intelligent document processing
  • 所屬學科:文檔信息處理
定義,套用,

定義

計算機在理解文檔的基礎上,對文檔進行自動處理。

套用

智慧型文檔常見的典型套用包括:
(1)文檔的自動或半自動生成
計算機系統能夠從不同的渠道採集數據,然後按照特定的文檔寫作風格自動形成新聞報導或研究報告等,或者進行計算機詩詞創作。還有一種半自動化形式,即計算機的輔助文檔寫作,包括提供素材,檢驗內容的一致性等等。
(2)文檔的自動理解
較低的層次上包括文檔中文字、圖片、表格、公式等的識別;較高的層次上,通過自然語言篇章理解等方式,理解文檔表達的主題、修辭、知識等,在更高級的層次上還可以形成推理能力,為文檔的後續處理奠定基礎。
(3)文檔的一致性分析
發現文檔的主題、觀點、情感是否一致,以及對某些事物的態度和傾向性等等。
(4)文檔的自動糾錯
計算機自動發現文檔中的各類錯誤,包活語義和語法的錯誤,政治敏感性錯誤以及錯字等等,甚至計算機進行自動更正。
(5)文檔與業務流程的整合
可以從業務流中自動形成文檔(如發票、工單等等),也可從文檔中提取相關信息提供給業務流。
(6)文檔的語義檢索
可以通過相近的語義獲得所需的文檔或內容。能夠發現同類的文檔,並進行相似度分析。近年套用較廣的文檔自動推薦也屬於這個範疇。
(7)複合出版
文檔根據不同的需要、不同的讀者、不同的閱讀環境,呈現出最適宜的顯現形式。包括文檔的自動排版、自動翻譯以及語音合成等等。
(8)文檔的協同
多人、多機構共同編寫文檔、更新和閱讀文檔,保證其實時性和同步。
(9)文檔的自動評價
對文檔的寫作質量等方面進行自動評價,例如自動批改作業、自動閱卷,也包括對文檔作者的分析、文檔內容的審核與過濾等等。
(10)文檔的審計
對文檔進行溯源、真偽辨別以及防止對文檔的非法使用等等。

相關詞條

熱門詞條

聯絡我們