基於深度神經網路的句子篇章一體化的依存分析

基於深度神經網路的句子篇章一體化的依存分析

《基於深度神經網路的句子篇章一體化的依存分析》是依託上海交通大學,由趙海擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於深度神經網路的句子篇章一體化的依存分析
  • 項目類別:面上項目
  • 項目負責人:趙海
  • 依託單位:上海交通大學
項目摘要,結題摘要,

項目摘要

本項目擬研究基於深度神經網路的句子-篇章一體化的依存關係模型,將依存關係作為基本的表達手段,使用依存結構連線句子和篇章兩級的標識架構,改進已有的篇章分析研究。具體來說,我們篇章分析將充分利用包括字嵌入向量、詞向量、句子卷積向量在內的多層語言處理信息。在基本的學習模型上,我們將綜合考慮簡單前向神經網路、卷積神經網路和遞歸神經網路。本項目有望幫助進一步改進典型的深層篇章分析處理任務,並達到對於文本特性更加全面深入理解的目的。

結題摘要

本一年期項目的研究服務於增進對於漢語文本特性的更全面理解,圍繞著改進既有的典型句子-篇章級任務處理效能,利用符合中文文本深層特徵的句子-篇章表示的一體化模型,實現從辭彙、短語、句子到篇章級的不同粒度的結構表示和分析計算及其之間的有效融合。 本項目在執行中圓滿乃至超額完成了項目規劃的研究目標及指標,包括預定的各項關鍵技術研發以相關論文發表。本項目研究報告的結果集中於細粒度(漢字)切分相關的深度學習表示(嵌入)在各層語言處理上的可能性能改進。在神經分詞這一層,我們論證了字-詞嵌入表示需要結合(正如項目申請所預期的)進行,才能帶來進一步性能提升(ACL論文)。在篇章分析這一層,我們報告了首個引入字一級嵌入式表示強化隱式分析性能的工作(COLING論文),同時還報告了首個集成顯示和隱式數據的對抗神經網路模型(ACL論文)。在本項目尤其關注的集成模型上,我們報告了首個神經模型下的字-詞-句一體的中文分析以及對應的樹庫(AAAI論文)。 在工程實驗工作上,我們報告了鼓舞人心的結果。同時,本一年期項目資助發表10篇論文,包括3篇CCF-A類(ACL\AAAI)論文, 3篇CCF-B類論文(均屬頂級計算語言學會議論文),1篇SCI國際期刊論文(CCF-C),2篇EI論文。我們注重人才培養以及相關學術交流,本項目資助下,已累計培養各級學位學生8名,並6人次參與相關頂級國際會議的學術交流(含論文發表)。

相關詞條

熱門詞條

聯絡我們