漢語詞法與句法結構的統一分析

漢語詞法與句法結構的統一分析

《漢語詞法與句法結構的統一分析》是依託蘇州大學,由李中國擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:漢語詞法與句法結構的統一分析
  • 項目類別:青年科學基金項目
  • 項目負責人:李中國
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

漢語中詞法與句法的界限比較模糊,導致在分詞、詞性標註及句法分析等漢語處理的基礎環節中均遇到性能瓶頸。本項目圍繞漢語這一特點,實現詞法與句法結構的統一分析,打破詞法與句法在漢語自動分析技術中的人為分界。為此,本項目將深入考察漢語構詞特點,研究詞的內部結構體系以及詞內部結構與短語結構的關係,制定完善的詞語結構標註規範,並據此在已有樹庫上標註規模為6至8萬詞的結構,得到詞法與句法結構一體化標註的樹庫。在此基礎上,從成分分析與依存分析角度設計詞法和句法結構的統一分析模型及相應分析算法,使得對於給定未分詞的漢語句子,系統輸出結果同時包含詞法與句法結構。本項目所研究的詞法與句法統一分析,不僅可以為中文信息處理系統提供便於使用、涵蓋各種語言粒度、高效準確的詞法和句法分析結果,而且還可以通過計算、建模手段,加深我們對漢語的理性認識,因此,實施本項目將具有工程實踐和科學探索兩方面的意義。

結題摘要

漢語中詞法與句法的界限比較模糊,導致在分詞、詞性標註及句法分析等漢語處理的基礎環節中均遇到性能瓶頸。本項目圍繞漢語這一特點,實現詞法與句法結構的統一分析,打破詞法與句法在漢語自動分析技術中的人為分界。為此,本項目深入考察了漢語構詞特點,通過研究詞的內部結構體系以及詞內部結構與短語結構的關係,制定了完善的詞語結構標註規範,並據此在已有樹庫上標註了規模為6萬多詞的結構,得到了詞法與句法結構一體化標註的樹庫。在此基礎上,從成分分析與依存分析角度設計了詞法和句法結構的統一分析模型及相應分析算法,使得對於給定未分詞的漢語句子,系統輸出結果同時包含詞法與句法結構。本項目所研究的詞法與句法統一分析,不僅可以為中文信息處理系統提供便於使用、涵蓋各種語言粒度、高效準確的詞法和句法分析結果,而且還可以通過計算、建模手段,加深我們對漢語的理性認識,因此,本項目具有工程實踐和科學探索兩方面的意義。

相關詞條

熱門詞條

聯絡我們