基於關係Markov網的多關係數據聚類分析方法研究

基於關係Markov網的多關係數據聚類分析方法研究

《基於關係Markov網的多關係數據聚類分析方法研究》是依託吉林大學,由高瀅擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於關係Markov網的多關係數據聚類分析方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:高瀅
  • 依託單位:吉林大學
項目摘要,結題摘要,

項目摘要

多關係數據的聚類分析作為多關係數據挖掘的重要任務之一,對於分析多關係數據的拓撲結構、理解其功能、發現其隱含模式和預測其行為等具有重要意義,在生物信息學、WWW、社會網、地理信息系統等領域具有廣泛套用,但現有方法對大規模數據、複雜關係及不確定環境的處理能力有限。關係Markov網將Markov網與資料庫的關係模式相結合,具有出色的多關係表示及不確定性處理能力,成功解決了連結預測、協作分類等任務,但其判別學習的特點妨礙了其在聚類分析中的套用,且其學習效率有待進一步提高。本項目以多關係數據的聚類分析為目的,在發揮關係Markov網優勢基礎上,對其進行擴展與改進,增強其表達能力,並將其改造成產生式模型;結合智慧型最佳化技術研究能提高其學習效率的方法;並進一步從橫向、縱向兩個角度,提出基於關係Markov網混合模型和基於關係團模板的聚類分析方法。該研究對促進多關係數據挖掘研究具有重要理論意義和套用價值。

結題摘要

多關係數據的聚類分析作為多關係數據挖掘的重要任務之一,對於分析多關係數據的拓撲結構、理解其功能、發現其隱含模式和預測其行為等具有重要意義,在生物信息學、WWW、社會網、地理信息系統等領域具有廣泛套用。為了增強現有方法在複雜關係及不確定環境下的處理能力,本項目研究了基於統計關係模型的多關係數據聚類分析方法,並研究了基於隨機搜尋的參數最佳化方法,並對這些方法的套用開展研究,取得如下研究結果。(1)在模型及參數最佳化方面,提出了增量式概論圖模型、兩階段粒子群最佳化算法,及基於混沌鯰魚效應的改進人工蜂群算法。所提出的機率圖模型用貝葉斯網表示數據及其間關係,用馬爾科夫地毯選擇相關數據,具有隨環境變化增量式學、學習時間複雜性低、準確性高的特點;所提出的兩階段粒子群最佳化算法,在白天、夜晚兩階段交叉疊代進行,其套用到模型的參數最佳化方面,更容易跳出局部極值,有利於搜尋全局最優解;所提出的基於混沌鯰魚效應的改進人工蜂群算法,採用隨機性更高的混沌序列初始化蜂群,並引入了混沌鯰魚蜂,及其與跌入局部極值的蜂群之間的有效競爭協調機制,從而增進蜂群跳出局部最優解的能力,並套用其對模型參數進行了最佳化。(2)在多關係數據的聚類分析方面,提出了基於q個加權中心點的模糊關係聚類算法,和基於多個矩陣、多個加權中心點的模糊多關係聚類算法。所提出的基於q個加權中心點的模糊關係聚類算法,在現有基於一個中心點的劃分聚類算法基礎上,用q個加權中心點來表示類簇,能夠更加準確的表示類簇內部的結構信息,具有更好的聚類效果;所提出的基於多個矩陣、多個加權中心點的模糊關係聚類算法,組合了多矩陣數據表示和多個加權對象類簇表示的優點,能夠描述類簇內部的豐富信息,學習矩陣相關權重,對多關係數據獲取最優模糊劃分。(3)在複雜網路社區發現和數據融合兩個方面,對研究結果進行了套用。在複雜網路社區發現方面,研究了馬爾卡夫動力學方法與網路社區結構的關係,提出了基於連結動力學的複雜網路社區發現方法,以發現網路中的連結社區;研究了基於生成模型發現網路中結點和連結社區的方法,提出了基於連結的社區發現生成模型。在數據融合方面,將增量機率圖模型套用到多個感測器數據的融合;將聚類結果與凸函式證據理相結合,完成海量信息的融合。上述研究結果發表學術論文8篇,其中SCI檢索3篇。該研究對促進多關係數據挖掘、機器學習研究具有理論意義和套用價值。

熱門詞條

聯絡我們