語料庫語言學研究的理論、方法和工具

《語料庫語言學研究的理論、方法和工具》是依託清華大學,由黃昌寧擔任項目負責人的重點項目。

基本介紹

  • 中文名:語料庫語言學研究的理論、方法和工具
  • 依託單位:清華大學
  • 項目負責人:黃昌寧
  • 項目類別:重點項目
  • 批准號:69433010
  • 申請代碼:F0211
  • 負責人職稱:教授
  • 研究期限:1995-01-01 至 1998-12-31
  • 支持經費:50(萬元)
項目摘要
為實現大規模真實文本處理的戰略目標,語料庫語言學已成為當今自然語言處理的前沿課題。本項目在以下幾個方面進行了較深入、系統的研究;①面向非受限文本的漢語自動分詞及詞性標註;②基於機率型上下文無關語法的漢語句法分析;③基於轉換的漢語基本名詞短語識別及其結構分析模型;④基於結構語義空間的漢語詞義排歧模型;⑤從單語詞典中獲取定義原語方法及現代漢語定義原語的獲取;⑥漢語語義關聯網的構造,⑦信息處理用漢語文本分詞規範和詞性標準的制訂;⑧關於語料庫語文學的理論思考。並構造了相應的原型或實驗系統,取得了有特色的成果。建立了1億2千萬字質量可靠的漢語生語料庫及200萬字經過分詞和詞性標準的漢語平衡語料庫。

相關詞條

熱門詞條

聯絡我們