《基於HNC的現代漢語句子級語義標註語料庫的研究和建立》是2015年中國社會科學出版社出版的圖書,作者是劉智穎。
基本介紹
- 中文名:基於HNC的現代漢語句子級語義標註語料庫的研究和建立
- 作者:劉智穎
- 出版社:中國社會科學出版社
- 出版時間:2015年02月
- 頁數:182 頁
- 開本:16 開
- 裝幀:平裝
- ISBN:9787516155769
- 紙張:膠版紙
內容簡介,作者簡介,圖書目錄,
內容簡介
本書針對自然語言處理資源建設方面的需求,從語義的角度、句子的層面研究建立句子級語義標註語料庫。以HNC(概念層次網路)理論句類體系為基礎,探討了句子級語義標註語料庫的標註內容、標註方法和標註難點,確定了XML的標註規範,設計了語料庫的查詢工具。本書是HNC理論在資源建設方面的研究與發展。該語料庫的建設與研究不僅對於計算機理解語義具有重要意義,而且對語言學工作者也具有一定的參考價值。
作者簡介
劉智穎,2010年畢業於北京師範大學語言學及套用語言學專業,獲博士學位。現任北京師範大學中文信息處理研究所講師,碩士生導師。主要研究方向為中文信息處理。在國內學術期刊及自然語言處理的國際會議發表論文20餘篇,參編信息處理用詞典一部。曾主持國家“865”項目“中文信息處理套用基礎研究”的“句子級語義標註的現代漢語語料庫”課題,並作為主要研究人員參與了多項國家865課題和國家科技支撐計畫課題的研究。
圖書目錄
第一章 緒論
第一節 中文信息處理的研究熱點
第二節 基於HNC的現代漢語句子級語義標註語料庫
第三節 本書的研究內容
一 標註項
二 標註方式
三 管理工具功能設計
第四節 已有的研究
一 現代漢語詞義標註語料庫
二 漢語框架語義標註語料庫
三 語義結構標註語料庫
第五節 本書的結構安排
第二章 HNC理論及其句類思想
第一節 HNC理論簡介
第二節 HNC的句類思想
第三節 句類及句類知識
一 基本句類
二 混合句類
三 複合句類
第三章 HNC語義標註語料庫的設計
第一節 語料的採集
第二節 語料的加工
一 標註規模
二 標註特點
三 標註形式
第四章 HNC語義標註語料庫的標註規範
第一節 XML語言介紹
一 XMlL的歷史
二 XML的內容
三 XML的特點和優點
第二節 HNC語義標註語料庫的XML標註規範
一 XML文檔
二 Schema模式
三 XSL轉換
第五章 HNC語義標註語料庫的標註
第一節 標註內容
一 篇頭信息
二 篇體信息
第二節 標註難點
一 語義塊核心要素的部分預設
二 包裝品與分離語
三 “的”字短語
四 “所”字結構
五 基於全句理解的句類
第六章 語料標註工具的設計與使用
第一節 TXTxML文檔的轉換
第二節 XMLspy標註工具的使用
一 XMLSpy工具介紹
二 語料的標註
三 檢查與驗證
第七章 HNC語義標註語料庫查詢工具
第一節 查詢工具的特點
一 快捷的查詢速度
二 友好的查詢界面
三 強大的查詢功能
第二節 查詢工具的功能設計
一 數據的存儲
二 資料庫的操作
三 語料查詢
第八章 HNC語義標註語料庫的套用
第一節 在語言本體研究方面的套用
第二節 在中文信息處理方面的套用
第三節 在語言教學方面的套用
第四節 結語
附錄
附錄1 HNC句子級語義標註語料庫的xML規範
附錄2 HNC句子級語義標註語料庫標註文檔示例
參考文獻
後記