基於統一評價的方法

計算機學者們利用機器學習中統計推斷的技術,綜合觀察網路和一定約束條件建立目標最佳化模型。該方法將社區發現問題看作是圖重構問題,完全摒棄了社區質量評價和時間軸演化評價割裂的局限性。

基本介紹

  • 中文名:基於統一評價的方法
  • 外文名:Methods based on uniform evaluation
基於時空獨立評價和集成評價的方法,都是外部可見數據驅動的,被動的結果分析方法,在實際套用中往往具有普適性差、解決問題有限等問題。最近幾年計算機學者們提出利用機器學習中統計推斷的技術,從內部模擬網路結構形成和演化的情況,建立生成式機率模型,以實際觀察網路為監督,以所建立的隱結構高機率生成網路是否與真實互動網路擬合為評價標準,綜合觀察網路和一定約束條件建立目標最佳化模型。這種方法將社區發現問題看作是圖重構問題,完全摒棄了社區質量評價和時間軸演化評價割裂的局限性,成為當前最具潛力的熱點研究方法。其中,基於貝葉斯推斷的機率生產圖模型、狄里克雷過程模型以及塊模型是這類研究的主要手段。
1)基於貝葉斯推斷的方法
貝葉斯模型使社區發現的問題轉化為隱空間發現問題,提供了將多因素機率關係統一在模型中的可能,是當前社區發現的主要方法之一。
貝葉斯推斷包括兩個主要部分:可見信息和統計模型參數。不同模型和算法設計構成了不同的貝葉斯推斷方法,其中先驗機率的選擇和先驗機率集成的不同設計構成了不同的最佳化目標模型。上部分介紹過的時空集成評價中的”基於隱空間的方法”是貝葉斯推斷的一種,它的模型是社區質量時空評價的乘積。當前,許多研究者提出利用主題模板建立生成式機率模型進行社區發現的方法。
另一類基於貝葉斯推斷的方法是直接對網路結構生成過程建立先驗機率。Newman等人提出一種基於混合機率模型和EM的方法發現社區結構,在給定社區數目的情況下,對模型參數和社區結構推斷,由於該模型中僅對邊存在的情況進行建模,所以計算機率較高。這些方法都是基於貝葉斯模型的靜態社區探測方法,是在給定社區數目情況下進行的。
2) 基於非參貝葉斯的方法
基於貝葉斯推斷的方法有助於發現隱含真實社區結構,但它需要事先設定社區數目,在不斷動態變化的線上社區網路中,隱含社區結構及其社區數目也同時在不斷動態變化,非參貝葉斯模型有助於解決動態網路中動態社區數目的人為設定問題。2008年Hofman和Wiggins針對複雜網路中隱含社區劃分和社區數目的發現問題,利用分布和Dirichlet分布提出了一種圖聚類的貝葉斯模型,設定了同社區節點連邊機率和不同社區節點連邊機率分布,實現了對社區數目、模型參數(邊連線機率等)和社區分配情況的極大似然估計。Xu等人利用Dirichlet過程混合模型能夠表示無限簇的特點,引入Dirichlet過程混合模型對網路演化中的社區數目建立先驗機率分布,結合隱馬爾可夫模型,建立了兩種無參貝葉斯學習模型DPChain和HDP—HTM,發現隱含動態社區並監測社區演化過程.其中,DPChain模型是將平滑性假設引入,建立了社區分布的指數衰減因子,和DPM(Dirichlet Process Mixture)模型結合進行建模。HDP—HTM模型是將分層Dirichlet過程(Hierarchical Dirichlet Process,HDP)和無限分層馬爾可夫狀態模型的分層轉換矩陣相結合進行建模,運用分層Dirichlet過程處理全局和局部社區中的關係問題,運用狀態轉換矩陣反映不同時間點間社區和社區之間的轉換關係。這兩個模型不僅能自動發現網路演化過程中的社區數目和社區結構,並且能顯式指示出社區演化的因果聯繫。
3)基於塊模型的方法
塊模型能表現出具有相同屬性節點間的豐富多樣的塊結構關係,可用來進行隱含多角色群組發現或重疊社區探測,是社區發現與動態社區演化研究的一類重要方法。基本的塊模型表現為關係矩陣形式,通過對矩陣行列進行重排,得到連線度緊密以及具有共同性質的群組結構,並能標示出這些群組間的關係。與其他社區發現算法相比,它提供了在統一模型框架中發現緊密團、同質團等多特徵群組的功能,成為當前社會網路社區發現、聚類研究中的一個重要方法。

相關詞條

熱門詞條

聯絡我們