貝葉斯網路模型

貝葉斯網路模型

貝葉斯網路(BN),又稱為信度網,由一個有向無環圖(Directed Acylic Graph,DAG)和條件機率表(ConditionalProbability Table,CPT)組成。

基本介紹

  • 中文名:貝葉斯網路模型
  • 外文名:Bayesian network model
  • 組成:有向無環圖、條件機率表
  • 構造方式:三種
  • 基本結構:順連、分連和匯連
  • 又稱:信度網模型
基本結構,構造方式,優點,

基本結構

貝葉斯網路中,兩個變數X和Y如果直接相連,則表示它們之間有直接依賴關係,對X的了解會影響關於Y的信度,反之亦然。在這種意義下,我們稱信息能夠在兩個直接相連的節點之間傳遞。
另一方面,如果兩個變數X和Y不直接相連,那么信息需要通過其它變數才能在兩者之間傳遞。如果X和Y之間的所有信息通道都被阻塞,那么信息就無法在它們之間傳遞。這時,對其中一個變數的了解不會影響對另一個變數的信度,因而和相互條件獨立。
貝葉斯網路模型
如果考慮兩個變數X和通Y過第三個變數Z間接相連這一基本情況,則可將貝葉斯網路分解成三種基本的結構,即順連、分連和匯連。

構造方式

一般情況下,構造貝葉斯網有三種不同的方式:
(1)由領域專家確定貝葉斯網的變數(有時也稱為影響因子)節點,然後通過專家的知識來確定貝葉斯網路的結構,並指定它的分布參數。這種方式構造的貝葉斯網完全在專家的指導下進行,由於人類獲得知識的有限性,導致構建的網路與實踐中積累下的數據具有很大的偏差。
(2)由領域專家確定貝葉斯網路的節點,通過大量的訓練數據,來學習貝葉斯網的結構和參數。這種方式
完全是一種數據驅動的方法,具有很強的適應性,而且隨著人工智慧、數據挖掘和機器學習的不斷發展,使得這種方法成為可能。如何從數據中學習貝葉斯網的結構和參數,已經成為貝葉斯網路研究的熱點。
(3)由領域專家確定貝葉斯網路的節點,通過專家的知識來指定網路的結構,而通過機器學習的方法從數據中學習網路的參數。這種方式實際上是前兩種方式的折衷,當領域中變數之間的關係較明顯的情況下,這種方法能大大提高學習的效率。

優點

通過提供圖形化的方法來表示和運算機率知識,貝葉斯網路克服了基於規則的系統所具有的許多概念上和計算上的困難。貝葉斯網路與統計技術相結合,使得其在數據分析方面擁有了許多優點,與規劃挖掘、決策樹、人工神經網路、密度估計、分類、回歸和聚類等方法相比,貝葉斯網路的優點主要體現在:
(1)貝葉斯網路使用圖形的方法描述數據間的相互關係,語義清晰,易於理解。圖形化的知識表示方法使得保持機率知識庫的一致性和完整性變得容易,可以方便地針對條件的改變進行網路模組的重新配置。
(2)貝葉斯網路易於處理不完備數據集。對於傳統標準的監督學習算法而言必須知道所有可能的數據輸入,如果缺少其中的某一輸入就會對建立的模型產生偏差,貝葉斯網路的方法反映的是整個資料庫中數據間的機率關係模型,缺少某一數據變數仍然可以建立精確的模型。
(3)貝葉斯網路允許學習變數間的因果關係。在以往的數據分析中,一個問題的因果關係在干擾較多時,系統就無法做出精確的預測。而這種因果關係己經包含在貝葉斯網路模型中。貝葉斯方法具有因果和機率性語義,可以用來學習數據中的因果關係,並根據因果關係進行學習。
(4)貝葉斯網路與貝葉斯統計相結合能夠充分利用領域知識和樣本數據的信息。貝葉斯網路用弧表示變數間的依賴關係,用機率分布表來表示依賴關係的強弱,將先驗信息與樣本知識有機結合起來,促進了先驗知識和數據的集成,這在樣本數據稀疏或數據較難獲得的時候特別有效。

相關詞條

熱門詞條

聯絡我們