基於語義Web的實體關聯搜尋方法與技術研究

基於語義Web的實體關聯搜尋方法與技術研究

《基於語義Web的實體關聯搜尋方法與技術研究》是依託南京大學,由程龔擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於語義Web的實體關聯搜尋方法與技術研究
  • 項目類別:面上項目
  • 項目負責人:程龔
  • 依託單位:南京大學
項目摘要,結題摘要,

項目摘要

語義Web上描述實體及其關聯的RDF圖數據正在不斷增長,面向圖數據搜尋實體之間關聯的需求愈發強烈。然而,現有研究及系統在實體關聯的表達能力、搜尋性能和結果組織等方面均不能令人滿意。為此,本項目開展語義Web上實體關聯搜尋方法與技術的研究,主要研究實體間語義關聯的表示與發現、語義關聯的搜尋、語義關聯模式的挖掘、語義關聯的融合等內容。項目力圖提出語義關聯的表示模型,創造出新型的實體語義關聯搜尋方法,並在帶語義標籤的圖搜尋、帶語義標籤的圖模式挖掘、圖數據的組織呈現與用戶互動、實體關聯搜尋環境下的語義數據融合等關鍵技術方面有所創新。通過這些模型、方法與技術的研究,推動語義Web以及信息檢索、圖挖掘、數據融合等相關領域研究的發展,促進和指導實體關聯搜尋引擎的研發,提升語義Web的信息服務水平。

結題摘要

語義網的發展催生了大量的圖結構的RDF數據,為實現更加有效的實體關聯搜尋提供了可能。針對現有研究的局限性,本項目圍繞實體語義關聯的表示與發現、搜尋、模式挖掘、融合等問題開展研究,形成了一系列具有創新性的技術成果。在語義關聯表示與發現方面,項目組提出了兩種語義關聯表示模型,提出了一種基於距離剪枝的語義關聯發現算法,並套用於新聞瀏覽領域。在語義關聯搜尋方面,項目組提出了多種基於語義映射和激活傳播的關鍵字查詢解釋方法,提出了基於語義連貫性、數據覆蓋性和查詢覆蓋性的語義關聯排序算法,並構建了實驗評價體系,提出了基於LDA生成實體摘要的語義關聯組織呈現方法,構建了標準測試集並對相關問題進行了綜述分析。在語義關聯模式挖掘方面,提出了一種通用高效的層次化挖掘方法,提出了一種高頻率低冗餘語義關聯模式的排序選取方法,提出了基於語義關聯模式的互動疊代式導航方法和實體搜尋方法。在語義關聯融合方面,提出了三種實體相似性度量方法和一種基於嵌入的跨語言實體匹配方法,提出了一種基於神經網路模型的實體屬性匹配方法,提出了一種複雜事件實體關聯融合方法並套用於機器閱讀理解任務。項目發表論文26篇,其中期刊論文6篇、會議論文20篇,CCF推薦國際會議或期刊論文A類4篇、B類8篇、C類3篇,SCI收錄5篇、EI收錄22篇,其中1篇論文獲CCF-B類國際會議COLING最佳論文提名獎,體現了一定的學術價值。項目申請國家發明專利1項、登記計算機軟體著作權2項,實現了語義關聯搜尋系統MEAST和MiCRon、語義關聯排序系統IlluSnip、語義關聯模式挖掘系統HIEDS、基於語義關聯模式的互動式搜尋系統RelSUE等原型系統,具有一定的套用價值。

相關詞條

熱門詞條

聯絡我們