基於排序學習和深度學習的專利檢索研究

基於排序學習和深度學習的專利檢索研究

《基於排序學習和深度學習的專利檢索研究》是依託大連理工大學,由許侃擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於排序學習和深度學習的專利檢索研究
  • 依託單位:大連理工大學
  • 項目類別:青年科學基金項目
  • 項目負責人:許侃
項目摘要,結題摘要,

項目摘要

專利是世界上最大的技術信息源,專利檢索是當今從海量專利文獻中獲取知識,了解技術動態的重要手段,能夠極大地提升專利的利用價值。項目的宗旨是:綜合運用信息檢索、文本挖掘和機器學習方法,從查詢擴展、檢索模型、方法融合等多個角度,進行專利檢索模型的構建。重點研究基於不同信息源的查詢擴展方法;針對專利文本域的內容差異性,對於不同的文本域採用不同檢索方法;針對專利中的摘要等文本域構建基於深度學習的檢索模型,對多個文本域的檢索結果進行融合;採用排序學習方法對於提出的多種方法進行融合,在模型訓練過程中加入專利的質量因素,提高專利檢索準確率以及用戶對於返回結果的滿意度。本研究為以語義檢索技術為目標,以文本表示、查詢理解、查詢重構、文本相似度計算等為基礎,構建基於排序學習和深度學習的專利檢索方法,為專利檢索提供一個可靠的研究思路。

結題摘要

專利是當今世界最重要的智慧財產權,而專利檢索是對於專利進行獲取和分析的重要基礎。面向專利檢索的排序學習方法、深度學習方法和信息檢索方法的研究,是項目研究的重要途徑。通過排序學習模型的構建和深度學習方法的套用為專利檢索方法的研究提供的新的方向,能夠有效的提高信息檢索任務的準確率。本項目的研究對於信息檢索的研究以及智慧財產權有效運用都有著重要的意義。本項目從組排序學習理論和套用兩個方面展開研究。 理論研究方面,一是檢索模型方面,對於組排序學習方法展開研究,基於排序學習方法融合的研究思路,提出了兩種融合框架:特徵層次融合框架FGFIREM和損失函式層次融合框架,使用不同的方案融合損失函式以提高排序性能。二是,查詢處理方面,套用深度學習等方法最佳化查詢擴展過程,進而有效的提高擴展詞的性能。檢索模型和查詢擴展的相關研究奠定專利檢索研究的理論基礎。 套用研究方面,一是專利檢索方面的研究,採用語義資源、詞向量表示、排序學習和查詢擴展等方法對於已有的專利檢索任務進行最佳化,實驗證明所提出的方法能夠有效的提高檢索性能。二是排序學習方法在查詢擴展方法中的套用,採用排序學習模型選擇查詢擴展詞,能夠有效的最佳化查詢擴展過程,生物醫學和社交媒體等相關任務套用的實驗結果顯示了所提出方法的有效性。 基於項目的研究工作,發表及錄用學術論文16篇,其中SCI檢索論文7篇,EI檢索論文2篇,CSSCI檢索論文1篇,北大中文核心期刊論文6篇。軟體著作權2項。

相關詞條

熱門詞條

聯絡我們