《面向大規模Web資源的事件知識流動與演化機理研究》是依託上海大學,由駱祥峰擔任項目負責人的面上項目。
基本介紹
- 中文名:面向大規模Web資源的事件知識流動與演化機理研究
- 項目類別:面上項目
- 項目負責人:駱祥峰
- 依託單位:上海大學
中文摘要,結題摘要,
中文摘要
以關聯語義鏈網路為基礎,基於大規模Web資源辭彙數目有限性及知識的層次性,提出事件及領域背景知識的全局知識屬性-概念知識屬性-辭彙知識屬性三層關聯語義鏈網路(TALN)模型及構造方法,以避免對大規模Web資源的直接計算。基於事件TALN的網路拓撲結構及知識屬性的不確定性、可信度與熱點度等參數,計算事件微觀知識屬性承受的內部力;基於領域TALN及被激活背景知識屬性的參數,計算知識屬性承受的外部力。然後,探討這兩種力對事件微觀知識屬性流動和演化過程共同作用的機理。繼而,基於信息熵與完美無標度網路,探討事件知識巨觀流動和演化過程的無序性,度量事件知識整體流動與演化過程的動力;基於相鄰時刻事件TALN中拓撲結構的變化,獲取事件知識巨觀流動與演化速度、加速度及方向向量。最後,把上述研究套用到新型語義搜尋和最具流動與演化潛力事件和資源的搜尋與推薦中;以緩解資源大規模性與人認知能力有限性之間的矛盾。
結題摘要
為了實現大規模Web資源的語義計算。1、提出了關鍵字微觀層次關聯語義鏈網路(KALN)表達模型、構造及最佳化方法;面向網頁資源,提出了Web事件知識的網站-網頁-關鍵字三層ALN模型;2、面向科技文獻資源,提出了“領域背景知識ALN-文本知識碎片ALN-文本連通語義ALN”三層ALN的知識表達模型與構造方法等;為了在大規模網頁資源中發現Web事件和話題,提出了基於文本圖語義表達的Web事件子話題挖掘模型;面向科技文獻資源,提出了Semantic LDA話題發現模型;上述研究形成了不同類型的全局知識屬性-概念知識屬性-辭彙知識屬性網路。 實驗證明,提出的模型在事件話題和主題挖掘中具有較好效果。 為了獲取事件知識流動與演化速度、加速度及方向。本項目基於關鍵字微觀層次的KALN,1、 提出了Web事件內部知識的語義金字塔結構,以對Web事件知識流動與演化過程機理進行分析,以突顯不同層次語義不確定性對Web事件知識流動與演化過程的影響。2、基於關鍵字微觀層次KALN信息熵等參數的計算,探索了Web事件知識語義的不確定性的上界和下界的計算方法,形成了Web事件知識語義的不確定性空間,並將Web事件狀態映射到這個空間中,以度量該事件在不同時刻所受到的內部演化動力模型。3、基於人類記憶過程和‘錨’理論,我們對社會環境和Web事件之間的互動過程進行模擬,量化了社會環境對Web事件演化過程的影響,即外部演化動力的計算。4、提出了內外部力對事件知識流動和演化過程共同作用的機理。5、 提出了基於選擇性注意與KL散度的事件知識內部結構度量及知識流動與演化預測方法,通過構建前沿知識/主題知識流動與演化方向的判定模型,可發現領域主題知識流動與演化的速度、加速度及方向等。 為了驗證本項目的研究成果可用於新型網路資源語義搜尋、推薦及最具有活力話題搜尋與推薦等知識服務等,面向300萬專利、100萬TP類科技文獻,近百萬網頁,我們開發了專利科技文獻創新知識發現平台,科技論文搜尋與推薦服務平台及基於Web事件語義金字塔的網頁推薦平台等。