高維數據的圖模型學習與統計推斷

高維數據的圖模型學習與統計推斷

《高維數據的圖模型學習與統計推斷》是依託中國人民大學,由尹建鑫擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:高維數據的圖模型學習與統計推斷
  • 項目類別:青年科學基金項目
  • 項目負責人:尹建鑫
  • 依託單位:中國人民大學
項目摘要,結題摘要,

項目摘要

研究在高維數據情形下,圖模型的結構學習及相關統計推斷問題。在高維情形下,當均值受到另一組高維協變數影響時,我們用似然函式加懲罰的方法來估計無向圖的結構。用懲罰似然方法研究array-型數據的無向圖模型估計。對於高維有向圖(DAG)採用基於約束的學習方法,其中關鍵的步驟是高維條件獨立性檢驗。我們分別研究在有分布假定和無分布假定情況下的高維條件獨立性檢驗。傳統的檢驗統計量在高維情形下一般是無法工作的。需要提出在一定合理假定下(比如稀疏性或者結構上的假定)新的統計量和檢驗方法。研究所提出的檢驗的漸近相合性、功效以及最優性。條件獨立性的推斷結論本身也有意義。進一步該推斷結果可以嵌入到有向無環圖(DAG)整體或者部分的結構學習算法中去,比如PC,IC,遞歸, 或者局部學圖算法。對於學得的高維圖(無向或有向),我們評價在相依的多重檢驗下的整體錯誤發現率(FDR)等相關置信度度量,並研究它們的極限性質。

結題摘要

本項目研究在高維數據情形下,高斯圖模型的結構學習、估計問題和高維統計推斷問題。主要分為以下4個主要部分: 1.在高維情形下,當均值受到另一組高維協變數影響時,我們用似然函式加懲罰的方法來估計高維高斯無向圖的結構。用兩步估計方法,我們的得到了高維條件高斯圖模型的均值係數矩陣和高維誤差協方差逆陣的快速收斂算法。理論上,使用Primal-Dual-Witness技術,我們證明了維數遠遠大於樣本量時,估計的誤差的相合性和收斂速度,以及模型選擇的符號相合性。文章發表在2013年的《Journal of Multivariate Analysis》上。 2.用懲罰似然方法研究高維張量型數據的無向圖模型估計。使用張量-正態型分布描述多重條件下的多維數組型數據聯合分布,我們得到在各個維數分別固定和都趨向於無窮時,估計的相合性、誤差收斂速度,以及維數增長時的稀疏相合性。文章發表在2014年《Journal of Multivariate Analysis》上。 3.對於高維有向圖(DAG)採用基於約束的學習方法,其中關鍵的步驟是高維條件獨立性檢驗。而有效約減條件集是一個行之有效的途徑。我們提出了基於似然函式加懲罰的方法對高維數據進行基於降維技術的馬爾科夫毯子選擇。得到了快速收斂的坐標下降算法。文章發表在2014年(Online Version)《Communications in Statistics: Simulation and Computation》上。 4.對於自適應臨床試驗設計中如果有缺失數據時如何進行在各個變數上進行平衡的問題,我們提出了一種將缺失水平視為一個“新取值”的方法,進而在證明該偏差度量還是滿足一些相合性等性質。文章發表在2015年《Science China Mathematics》上。該工作與馬氏鏈有很密切的聯繫。也是本項目的一種拓展。

相關詞條

熱門詞條

聯絡我們