中文文本自動分詞和標註

中文文本自動分詞和標註

《中文文本自動分詞和標註》是2000年商務印書館出版的一本圖書,作者是劉開瑛。該書主要介紹了信息處理用現代漢語分詞詞表的收詞原則和方法。

基本介紹

  • 書名:中文文本自動分詞和標註
  • 作者:劉開瑛 著
  • 出版社:商務印書館
  • 出版時間:2000-5-1
基本信息,圖書簡介,本書目錄,

基本信息

叢編項】:語言與計算機叢書 【作者】:劉開瑛 著
出版社】:商務印書館
出版日期】:2000-5-1
ISBN】:7100030684

圖書簡介

本書介紹了信息處理用現代漢語分詞詞表的收詞原則和方法,《信息處理用現代漢語分詞規範》設計原則及規範內容,中文文本歧義切分技術等內容。

本書目錄

第1章 自動分詞是中文信息處理的基礎工程
第一節 分詞的重要性及其主要目標
第二節 自動分詞中存在的主要問題
第2章 《信息處理用現代漢語分詞規範》設計原則及規範內容
第一節 國際《分詞規範》的簡介與評述
第二節 《資訊處理用中文分詞規範》的基本架色
第3章 信息處理用現代漢語分詞詞表的收詞原則和方法
第一節 研製《分詞詞表》的原則和有關問題
第二節 分詞詞表的選詞方法
第4章 中文文本歧義欄位切分技術
第一節 歧義欄位的類別和採集方法
第二節 交集型歧義欄位處理技術
第三節 多義型歧義欄位分類及其處理技術
第5章 中國姓名和未登錄新詞語的自動辨識
第一節 中國姓名的自動識別技術
第二節 未登錄新詞語的自動識別技術
第6章 中國地名、組織機構名稱和英譯名的自動辨識
第一節 中國地名自動識別技術
第二節 中文機構名稱的識別與分析
第三節 英語譯名的自動辨識
第7章 漢語詞性自動標註技術
第一節 詞性標註的意義和主要難點
第二節 信息處理用現代漢語詞類及標記集
第三節 語料庫詞類自動標註算法研究
第四節 基於規則的詞性標註方法
第8章 漢語詞義自動標註技術
第9章 漢語自動分詞軟體系統
附錄1 信息處理用現代漢語分詞規範(GB13715)
附錄2 信息處理用現代漢語詞類及標記集
參考文獻

相關詞條

熱門詞條

聯絡我們