篇章級中文語義分析理論與方法

《篇章級中文語義分析理論與方法》是依託哈爾濱工業大學,由劉挺擔任項目負責人的重點項目。

基本介紹

  • 中文名:篇章級中文語義分析理論與方法
  • 依託單位:哈爾濱工業大學
  • 項目類別:重點項目
  • 項目負責人:劉挺
項目摘要,結題摘要,

項目摘要

本課題在總結和吸納國內外篇章語義分析方面現有成果的基礎上,面向開放域新聞語料,提出一套篇章語義表示形式篇章場景透視圖,篇章場景透視圖以層次結構圖的形式充分地刻畫篇章中實體與實體之間,事件與實體之間,事件與事件之間複雜的語義關係,以場景和核心事件鏈作為篇章語義的巨觀線索。為了自動地構建篇章場景透視圖,需要深入研究面向篇章的辭彙和句子級的語義處理,實體、關係和事件的挖掘與融合,場景劃分及核心事件鏈識別,並建設相應的語言知識資源,研製中文篇章語義分析實驗系統平台,同時以閱讀理解和多文檔自動文摘這兩項套用作為對篇章語義分析效果的驗證。句子級中文語義依存分析是篇章級語義分析的重要基礎,開放類實體關係的抽取與共指識別,事件挖掘、場景劃分及核心事件鏈的構造是本課題的研究重點。既能刻畫篇章巨觀結構,又能描寫微觀內容,既有篇章理解的深度,又不過分依賴於人工構建的知識資源,是本課題的顯著特點。

結題摘要

本課題在總結篇章語義研究國內外經典和前沿的研究成果的基礎上,提出並實現了一套完整的篇章語義表示體系,該體系包括:(1)篇章表示方法,從大規模文本數據中將辭彙、短語乃至句子映射到同一語義空間中,為篇章級的語義計算奠定基礎;(2)篇章關係分析方法,以語義表示為基礎,獲取同一文檔內兩個文本塊之間的語義關係,為篇章的結構化表示奠定基礎;(3)篇章結構建模,在篇章關係的基礎上,構建篇章結構拓撲圖,清晰的揭示出段落之間的語義联系;(4)事件鏈,本課題在篇章結構建模的基礎上還對篇章的主題結構進行分析,以辭彙鏈的形式將作為篇章主題代表的事件呈現出來,並對事件賦予權重用於區分事件的重要性;(5)篇章聯想,原文內容並不能脫離外部背景知識而存在,本課題為上述的分析結果補充外部背景知識,通過聯想三元組背景知識進一步提升篇章語義表示的性能。為了證明本課題實現的篇章語義表示體系的有效性,本課題將其套用於閱讀理解和作文評閱兩項典型的需藉助篇章分析的套用中,實驗結果證明了本課題提出的篇章語義表示體系能夠在對篇章建模的基礎上充分量化篇章之間的語義關係,進而提升兩項套用的性能。當然,除去以上兩項典型套用,篇章語義表示體系還可以套用於事件抽取、自動文摘、依存分析等典型的自然語言處理任務中。在課題實現的基礎上,本課題共形成論文110篇,已授權專利2項,部分成果達到國際領先水平。

相關詞條

熱門詞條

聯絡我們