漸進式中文句法分析的關鍵技術研究

《漸進式中文句法分析的關鍵技術研究》是依託東北大學,由王會珍擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:漸進式中文句法分析的關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:王會珍
  • 依託單位:東北大學
中文摘要,結題摘要,

中文摘要

短語結構句法分析的核心思想是識別句子中的短語以及短語之間的句法關係。短語結構句法分析一直以來都是自然語言處理領域的核心問題之一。近年來,隨著大規模人工標註樹庫的出現,數據驅動的句法分析器在實際套用中起到重要作用。本申請課題在深入分析短語結構句法分析研究中存在的一些問題的基礎上,重點研究移進-歸約句法分析的一些關鍵問題和改進技術。主要研究內容包括:在移進-歸約算法框架下引入短語信息、子樹級移進-歸約算法、挖掘深層次的句法信息、利用預測信息指導移進-歸約方法的解碼技術、利用異構樹庫和不帶標數據、句法分析的領域適應性。最終集成這些關鍵技術,構建基於移進-歸約的中文句法分析共享支撐平台。

結題摘要

本課題研究漸進式中文句法分析的關鍵技術,設計並實現了中文語言分析器。為文本處理等其他套用提供了很好的技術支持。研究內容主要包括利用大規模數據辭彙依存關係改進移進-歸約成分句法分析、多維度等級評分模型最佳化技術、向上學習方法改進移進-歸約中文句法分析、easy-first中文詞性標註和依存句法分析、基於特徵方法的樹庫轉換技術、Niuparser開源語言分析技術平台構建等關鍵技術,最後集成所有關鍵技術構造一套中文句法語義分析系統NiuParser,目前已經公開發布,供學術界無償使用。本課題相關研究成果在國內外期刊雜誌和學術會議上發表了8篇學術論文,其中包括2篇國際期刊和3篇Acl/Coling頂級國際會議論文。

相關詞條

熱門詞條

聯絡我們