《非參數貝葉斯建模、計算及在類屬數據分析中的套用》是依託浙江大學,由張志華擔任項目負責人的面上項目。
基本介紹
- 中文名:非參數貝葉斯建模、計算及在類屬數據分析中的套用
- 依託單位:浙江大學
- 項目負責人:張志華
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
信息科學牽涉的數據往往是不完整或不精確的,而非參數貝葉斯統計學非常適合用來處理不確定性數據,因此,它能夠為信息科學提供有效的建模工具和計算方法,並將成為統計學習的主流研究方向。本項目將主要研究高斯過程、威沙特過程和狄利克雷過程等三種非參數貝葉斯建模方法及其推理算法和在類屬數據分析中的套用。重點研究如下內容:研究完全貝葉斯的廣義核模型,從而克服高斯過程嚴重依賴於方差函式以及計算的高代價等問題;研究威沙特過程在再生核函式統計建模中的理論和算法設計問題;研究狄利克雷過程混合體、相關狄利克雷過程的有效建模途徑和高效計算算法;研究高斯過程、威沙特過程和狄利克雷過程的組合模型及其計算方法;研究本項目提出的非參數貝葉斯方法在類屬數據分析中的套用,並研發相應的軟體原型系統。
結題摘要
我們的工作首次將矩陣元分布理論引入到相關性狄利克雷過程領域中,提出了一個矩陣元狄利克雷過程混合模型, 且將該模型套用於多元回歸問題以及因子分析中。項目提出了一種新構造相關狄利克雷過程的方法, 即利用條件自回歸的思想來表示一組隨機分布之間的相關性,項目給出具體的模型以及用於模型推斷的MCMC算法,並套用到多元回歸問題上。項目提出了一個完全貝葉斯廣義核模型。這個工作從再生核希爾伯特空間上的一個無窮維基展開理論出發,導出了我們稱之為的“Silverman g-prior”. 項目同時針對當前機器學習的一個熱點方向---貝葉斯稀疏學習---做了一些研究。主要進展在於稀疏建模的非凸鬆弛方法,考慮了Levy 過程套用。此外,對面向大數據的機器學習的隨機算法做了一些深入研究。研究成果有5篇論文發表在國際頂級期刊JMLR (Journal of Machine Learning Research)上。