基本介紹
- 中文名:聚集係數
- 外文名:Clustering coefficient
- 別稱:集群係數
基礎概念,整體集聚係數,參見,
基礎概念
集聚係數主要是描述圖(或者稱為網路)的特性。一個圖G是由一些頂點V和頂點與頂點之間的一些連線(稱為邊)E構成。兩個相連的頂點也稱為鄰接點。比如在一群人中,將每個人用一個點表示,如果兩人之間認識,就將對應的兩點連起來。這樣就構成了一個圖。有的圖是有方向的,比如在同樣一群人中,如果一人甲欠另一人乙的錢,就連一條從 甲至乙的線,這樣就構成了一個有向圖。
整體集聚係數
整體集聚係數的定義建立在閉三點組(鄰近三點組)之上。假設圖中有一部分點是兩兩相連的,那么可以找出很多個“三角形”,其對應的三點兩兩相連,稱為閉三點組。除此以外還有開三點組,也就是之間連有兩條邊的三點(缺一條邊的三角形)。這兩種三點組構成了所有的連通三點組。整體集聚係數定義為一個圖中所有閉三點組的數量與所有連通三點組(無論開還是閉)的總量之比(也有定義為這個值的三倍,使得在完全圖中的整體集聚係數等於1)。最早嘗試測量這個係數是在1949年羅伯特·鄧肯·路斯和阿爾伯特·D·佩里合作的一篇論文中。
假設有圖 ,其中 表示頂點的集合, 表示邊的集合( 表示連線頂點 和 的邊)。
每一個頂點連線的頂點有多有少,用L(i) 表示與頂點 相連的邊的集合:
L(i) 里的邊的數量就是頂點 的度,記作 : 。
如果用 表示整體集聚係數,用 表示圖中閉三點組的個數, 表示其中開三點組的個數,那么:
使用 來表示的話,也可以寫成: