《漢語句法分析中的自動歧義識別和分類問題研究》是依託南京大學,由黃書劍擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:漢語句法分析中的自動歧義識別和分類問題研究
- 項目類別:青年科學基金項目
- 項目負責人:黃書劍
- 依託單位:南京大學
項目摘要,結題摘要,
項目摘要
高效的信息處理套用需要有效的文本的自動分析和理解方法,句法分析是文本分析體系中的重要環節。句法分析效果在實際套用中仍然難以讓人滿意,這主要是由於對句法結構歧義的處理錯誤導致的。句法結構歧義是指存在相同或相似的句子片段對應多個不同的句法結構的情況。以往的研究大多關注於部分歧義實例的消解、某個具體的歧義問題或特定的語義資源的使用,缺乏通用的歧義處理手段。本項目擬研究在自動句法分析中的歧義識別方法以及面向消解過程的歧義分類方法。首先採用不確定性分析的技術對句法分析中影響分析效果的關鍵性歧義自動識別;然後結合語言學的歧義理論,根據消解這些歧義所需要的不同上下文和語義知識來源對歧義進行分類,為自動的歧義消解提供依據。
結題摘要
句法分析建立在詞法分析的基礎上,為高層的語法語義分析提供基礎,是自然語言處理中的一項基本任務。句法分析中的歧義問題是指對給定的語言片段存在多個可能的句法標註的情況。在分析過程中,歧義往往是由於模型本身的建模的上下文信息不足等原因造成的。如果這些歧義不能被有效地識別和消解,句法分析性能將會受到影響。 圍繞自動句法分析中的歧義識別問題,本項目從給定句法分析模型下的歧義識別問題和給定任務場景下的歧義消解問題兩個方面展開了研究。第一方面,研究了基於統計和神經網路的句法分析表示和建模以及句法分析中的歧義表示、建模和搜尋的方法和技術。探索了在複雜的結構化預測問題中進行建模和搜尋的方法和手段,為進一步進行歧義的判別和消解奠定了基礎。第二方面,研究了句法分析中歧義判別和消解方法以及一些特殊歧義來源和特定任務中的歧義消解。探索了在複雜的自然語言處理任務需求和場景下的歧義分析、消解的方法和技術,為更好的研究更加通用的歧義分析消解方法打下了基礎。項目進行過程中研製了多個句法分析系統具有較好的分析精度,以及較高的分析效率,可以為文本分析理解等套用服務。