漢語虛詞知識庫的建設

漢語虛詞知識庫的建設

基本介紹

  • 書名:漢語虛詞知識庫的建設
  • 出版社:華中師範大學出版社
  • 頁數:324頁
  • 開本:32
  • 品牌:華中師範大學出版社
  • 作者:劉雲 邢福義
  • 出版日期:2009年5月1日
  • 語種:簡體中文
  • ISBN:7562238855, 9787562238850
內容簡介,圖書目錄,文摘,後記,序言,

內容簡介

《漢語虛詞知識庫的建設》:華中語學論庫(第2輯),國家社會科學基金項目成果,霍英東教育基金會青年教師基金項目成果,華中師範大學出版基金全額資助,華中師範大學語言與語言教育研究中心成果。

圖書目錄


前言
第一章 面向信息處理的語言研究
第一節 中文信息處理的發展與成就
一、引言
二、中文信息處理的發展
三、中文信息處理的成就
第二節 漢語自動分析的難點
一、引言
二、詞法分析的難點
三、句法分析的難點
四、轉換過程的難點
五、小結
第三節 計算機背景下的漢語語法研究
一、研究對象的轉換
二、研究目的的轉換
三、研究手段的轉換
四、研究視角的轉換
五、小結
第四節 “句管控”與漢語信息處理
一、引言
二、詞語切分與詞性標註
三、句法與語義
四、理論與實踐
五、小結

第二章 虛詞知識庫的建設
第一節 虛詞與虛詞研究
一、虛詞概貌及其作用
二、虛詞在通用語料庫中的使用情況
三、虛詞研究
第二節 漢語虛詞知識庫的重要性
一、詞法分析中的作用
二、句法分析中的作用
三、具體套用中的作用
第三節 虛詞知識庫建設的難點
一、虛詞語法意義的概括
二、虛詞用法差異的揭示
第四節 虛詞知識庫的建設
一、引言
二、“三位一體”的虛詞知識庫建設
三、小結

第三章 虛詞詞典的內容
第一節 副詞機器詞典
一、副詞及其分類
二、副詞欄位的設立
三、副詞目錄
四、副詞機器詞典摘錄
第二節 連詞機器詞典
一、連詞及其研究
二、連詞欄位的設立
三、連詞目錄
四、連詞機器詞典摘錄
第三節 介詞機器詞典
一、介詞及其分類
二、介詞欄位的設立
三、介詞目錄
四、介詞機器詞典摘錄

第四章 複句層次和關係的自動分析
第一節 複句關係和層次自動分析的目標和意義
一、漢語複句自動分析的目標
二、複句自動分析的意義
第二節 漢語複句自動分析的難點與對策
一、複句自動分析的難點
二、複句自動分析的策略
三、單複句的確認對策
第三節 二重複句自動劃分研究
一、引言
二、複句關係詞語的包孕機制
三、小結
第四節 複句關係詞語離析度
一、引言
二、複句關係詞語的離析度
三、複句關係詞語離析能力差異分析
第五節 關係詞語驅動的複句關係和層次自動
判定
一、引言
二、複句關係詞語的作用
三、複句關係詞語的表現
四、複句自動分析的流程

第五章 結語
第一節 研究工作回眸
第二節 研究工作構想

附錄1 複句層次和關係標註語料庫樣例及說明
附錄2 複句層次和關係自動分析系統
後記

文摘

1991年,北京語言學院漢語水平考試中心組成研製小組,以國內影響較大的七個動態性頻度統計詞典、詞表和字表為主要依據,編制了《漢語水平辭彙與漢字等級大綱》。其編制總原則為:(1)多學科定量統計與群體性定性分析相結合;(2)語言學科學原財與對外漢語教學需要相結合。共得常用詞8822個,分成甲、乙、丙、丁四級,寫進《大綱》(修訂稿)。這是一次較為典型的把主、客觀標準有機結合起來選擇漢語常用詞的實踐。
由於20世紀90年代初期有多個常用字詞統計結果的推出,隨後常用字詞的統計相對沉寂了幾年。隨著網路等媒體的興盛,大規模字詞統計又開始復興。進入21世紀後,先後有兩次大規模的辭彙統計,分別是《中國語言生活狀況報告(2005)》和《中國語言生活狀況報告(2006)》。這兩次調查統計有三個重要的特點:一是規模大。《中國語言生活狀況報告(2005)》調查語料分為平面媒體、有聲媒體、網路媒體三種,總計892034個文本檔案,909429700字元次,其中漢字出現732143010字次。《中國語言生活狀況報告(2006)》調查的語料分為平面媒體、有聲媒體、網路媒體三種,總計1311749個文本檔案,1170367879字元次,其中漢字出現978994406字次,規模達10億次,這是迄今為止最大規模的漢語字詞統計。二是統計項目全面。兩次調查的主要對象是漢字和詞語,調查項目有“頻次、頻率、累加頻'率、出現文本數”等。三是成果豐碩。

後記

“漢語虛詞知識庫的建設”這個課題的研究始自2002年。2002年6月,我在華中師範大學漢語言文字學專業博士畢業,7月進入北京大學計算機科學與技術博士後流動站從事博士後研究。在北京大學博士後研究期間的選題就是“漢語虛詞知識庫的建設”,博士後期間的研究工作是在導師俞士汶先生的指導下進行的。由於邢福義先生和陸儉明先生的玉成,使我得以在博士研究生在讀期間的1999年以訪問學者的身份到北京大學計算語言學研究所進修一年。正是這一年的進修,使我得以進人中文信息處理領域。2002年從華中師範大學博士畢業後,隨即產生了到計算語言學研究所進行博士後研究的想法。在導師李宇明教授的積極鼓勵和俞士汶先生的熱情幫助下,我的心愿得以實現,使我又有兩年的學習機會。不管是訪問學者期間,還是博士後期間,俞士汶老師對我關懷備至,使我對計算語言學研究所有“家”的感覺。博士後期間的研究工作,從選題、論證到研究思路、報告撰寫,都融入了俞老師大量的心血。俞老師學識淵博、思維敏捷、治學嚴謹,對學生要求嚴格、精益求精,在這個浮躁的社會依然保持著一個學者的內斂和謙謹;言傳身教,不僅給了我學業上耐心細緻的指導,而且給了我深刻的人生啟迪,使我受益匪淺。師母朱學鋒老師慈祥和藹,給了我太多的幫助。

序言

隨著歷史的發展,社會的進步,科技的發達,語言學在整個世界範圍內越來越展示出強大的活力和能量。中國語言學是世界語言學的重要組成部分。為了對中國語言學事業有所推動,我們組織撰寫“華中語學論庫”。作為專用名稱,這裡的“語學”主要指漢語語言學,近期的15年時間裡以現代漢語語法專題研究為重點。“語學論庫”,這是漢語語言學研究的一個系統工程,如果將來主客觀條件具備,在研究範圍上可以不斷擴大,在研究時間上可以無限延展,在研究隊伍上可以輩輩交接,代代傳承。“華中”一詞,既跟研究隊伍的華中群體相關,又跟華中師範大學出版社的名稱相關。
漢語語言學源遠流長。千百年來,特別是《馬氏文通》出版以來,尤其是20世紀70年代之後,由於一代代學者的不懈努力,漢語語言學沿著“創業——拓新——發展”的軌道不斷推進。目前,漢語語言學所統括的漢語語法學、漢語語音學、漢語方言學、漢語辭彙學、漢語語用學等等學科,都已出現了初步繁榮的喜人局面。

相關詞條

熱門詞條

聯絡我們