狄利克雷過程混合模型(Dirichlet Process Mixture Model, DPMM)是一種非參數貝葉斯模型,它可以理解為一種聚類方法,但是不需要指定類別數量,它可以從數據中推斷簇的數量。
基本介紹
- 中文名:狄利克雷過程混合模型
- 外文名:Dirichlet Process Mixture Model
- 縮寫:DPMM
- 套用:聚類
定義,套用,
定義
我們有一組數據
,它們是相互獨立的、來自於一些未知的分布中。
可以是多元的,它的值可以是實數的,也可以是類別型的。假設這些觀測值來自於一個混合分布,其形式是
,其參數
來自於狄利克雷過程(Dirichlet Process, DP)G,即該分布的參數的先驗是一個狄利克雷過程,器集中參數為α,基分布是
。那么,狄利克雷過程混合模型(Dirichlet Process Mixture Model, DPMM)有如下:








套用
狄利克雷過程混合模型可以用作聚類。由於它不需要指定類別數量,是非參數貝葉斯模型,它可以從數據中推斷類別數量。其經典實現過程是中餐館過程。