《中文信息抽取原理及套用》是2010年科學出版社出版的圖書,本書作者是程顯毅、朱倩、王進。
基本介紹
- 書名:中文信息抽取 原理及套用
- 作者:程顯毅,朱倩,王進
- ISBN:9787030266231
- 定價:58.00元
- 出版社:科學出版社
- 出版時間:2010-2-1
- 開本:16
內容簡介,圖書目錄,
內容簡介
由於網上的信息載體主要是文本,所以信息抽取技術對於那些把網際網路當成是知識來源的人來說是至關重要的。信息抽取系統可以看成是把信息從不同文檔中轉換成結構化數據系統。因此,成功的信息抽取系統將把網際網路變成巨大的資料庫。信息抽取技術是近十年來發展起來的新領域,遇到許多新的機遇和挑戰。
全書分兩篇(原理篇共11章、套用篇共7章)。原理篇主要討論了信息抽取(IE)概念、任務、挑戰和評測方法;基於NLP、統計、認知的信息抽取方法;命名實體識別、共指消解、模板填充、Web信息抽取等。套用篇介紹了兩個開發工具(GATE和WHISK),分析了IE在人機接口、電子交易、智慧型交通、競爭情報、問答系統、自動文摘等領域的套用。
本書可作為本科高年級數據挖掘課程的參考書或研究生自然語言處理課程的教材,也可作為智慧型套用系統開發的參考資料。
圖書目錄
前言
原理篇
第1章 緒論
第2章 信息抽取評估
第3章 信息抽取原理
套用篇
參考文獻
結束語