語義Web的連結結構分析方法與技術

《語義Web的連結結構分析方法與技術》是依託東南大學,由瞿裕忠擔任項目負責人的面上項目。

基本介紹

  • 中文名:語義Web的連結結構分析方法與技術
  • 項目類別:面上項目
  • 項目負責人:瞿裕忠
  • 依託單位:東南大學
中文摘要,結題摘要,

中文摘要

隨著語義Web的發展,語義Web數據正在不斷增長。語義Web的連結結構分析不僅對於理解語義Web的巨觀結構具有重要意義,而且對於語義Web數據的搜尋和數據管理具有指導作用。傳統的Web連結分析已經取得了很大的成功,而語義Web的連結結構分析仍處於初始階段。本項目研究語義Web文檔的連結模型及結構分析、語義Web實體的連結模型及結構分析、語義Web複雜網路模型、語義Web連結結構分析的支撐技術。本項目力圖在語義Web文檔的連結模型、語義Web實體的連結模型、語義Web複雜網路模型以及大規模語義Web數據的結構分析方法等方面有所創新。這些面向語義Web連結結構分析的新模型、方法和技術對於語義Web的發展具有重要作用。

結題摘要

項目組就語義Web中對象連結圖模型及分析、語義Web中對象共指發現、本體相關性的巨觀結構分析、本體相關性度量方法、面向本體搜尋的結構分析方法等進行深入研究,主要研究成果如下:我們提出語義Web中對象連結圖(OLG)這一新概念,以Falcons搜尋系統收集的一個大規模數據集作為樣例,分析OLG的複雜網路結構,實驗表明OLG有無標度特性,且其有效直徑較小。這個結論在另一個數據集上得到了驗證。這個結論對於理解語義Web的巨觀結構具有重要意義,且對於語義Web的搜尋具有指導作用。我們發現語義Web上URI共指現象比較普遍,而機器學習是發現URI共指的一個重要途徑。但是,構建理想的訓練集比較困難。為此,我們提出一種自訓練的方法來發現語義Web中的對象共指,並實現了一個可伸縮的系統,在基準測試集和大規模數據集上的實驗都展示出較高的準確度和召回率。我們開展了本體相關性的巨觀結構分析。對於收集到的4千多個本體,我們實施了大規模的成對匹配,在本體中的術語(類和屬性)間創建了大約3百萬個映射,然後以術語為頂點、映射為邊構建出一個複雜的術語映射圖,並根據術語映射圖導出本體映射圖。這些映射及分析結果有助於開發者更好地創建、集成和維護本體。對於本體搜尋和本體推薦,本體之間的相關性度量是一個重要問題。現有工作主要分析它們的相似性。我們檢查了更加一般的相關性概念,從四個角度加以刻畫:良好定義的語義相關性、內容上的詞法相關性、表達上的親密性以及分布相關性。我們在一個真實的大數據集對這些度量進行實證研究。基於上述研究,我們實現了一個推薦服務,基於手工構造的黃金標準驗證了它的有效性。本體排序及摘要對於本體搜尋系統來說十分重要,我們分析了本體之間的引用結構以及本體內部的基於RDF句子的連結結構,以此來研究其結構上的重要性。特別地,我們提出了多個結構模型,以完善本體摘要方法。有關方法在Falcons本體搜尋系統中得到了實現,實驗結果表明,我們的本體排序方法與本體摘要具有明顯的效果。總的來說,本項目的研究達到了預期的目標。項目組共發表學術論文12篇,其中,3篇發表在SCI源期刊上,4篇發表在國際全球資訊網會議和國際語義Web會議等本領域頂級學術會議上。項目組研發的語義Web本體搜尋系統在本領域具有較強的國際影響力。

相關詞條

熱門詞條

聯絡我們