高維數據的非參數經驗貝葉斯方法

高維數據的非參數經驗貝葉斯方法

《高維數據的非參數經驗貝葉斯方法》是依託蘇州大學,由姜文華擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:高維數據的非參數經驗貝葉斯方法
  • 項目類別:青年科學基金項目
  • 項目負責人:姜文華
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

本項目旨在發展高維數據中的非參巴夜虹數經驗貝葉斯方法。高維數據的統計分析是現在國際統計學界的熱點。非參數主淚請甩經驗貝葉斯假定先驗分布完全未知,仍然試圖逼近最優貝葉斯估計。非參數經驗貝葉局幾記斯適用於具有相同統計結構的高維未知參數的統計推斷問題。美國科學院院士Bradley Efron指出由於現代數據採集技術和計算機計算能力的快速提高,當今的科學潮流有利於增強非參數經驗貝葉斯所起的角色。本項目主要包括三個子項目:(1)高維信號探測的非參數經驗貝葉斯方法,(2)自適應非參數回歸中的非參數經驗貝葉斯方法,(3)改進以核函式方法構造的經驗貝葉斯估計。其中第一個子項目是重點,用非參數極大似然經驗貝葉斯方法構造的似然比檢驗對於高維正態信號不全部為零這一備擇假設具有高度的靈敏性,為此需要研究該似然比檢驗量的理論漸進分布。這個問題同時也具有高度的基礎研究價值。預期在三年的研究期限內每年解決一個子問題並發表研究論文。

結題摘要

本研究發展了高維數據中的非參數經驗貝葉斯方法,將六十年前的經典理論運用於現代高維數據的統計推斷,後者是現在統計學界的研罪鞏究熱點。Herbert Robbins於1956年提出非參數經驗貝葉斯方法。自提出後,非參數經驗貝葉斯曾受到高度的評價。Jerzy Neyman將該方法和混合估計並稱為統計學上的兩大突破。與一般的貝葉斯和假定參數形式先驗分布的經驗貝葉斯不同,非參數經驗貝葉斯假定先驗分布完全未知,仍然試圖逼近最優貝葉斯估計。非參數經驗貝葉斯適用於具有相同統計結構的高維未知參數的統計推斷問題。但是由於技術的放拒翻原因,非參數經驗貝葉斯的研究並不充分。Bradley Efron把原因歸結為“缺少有很多相同結構未知參數的套用問題”,並指出“由於現代數據採集技術和計算機計算能力的快速提高,當今的科學潮流有利於增強非參數經驗貝葉斯所起的角色”。 本研究完成了項目計畫書中提出的三個子問題:蜜影舉(1)高維信號探測的非參數經驗貝葉斯方法,(2)自適應非參數回歸中的非參數經驗貝葉斯方法,(3)改進以核函式方法構造的經驗貝葉斯估計。本研究還額外完成兩項研究:(1)高維稀疏正態均值估計,(2)高維Logistic回歸中的變數選擇。在國際統計期刊上發表研究論文5篇。 本研究在基礎理論方面具有很高的價值。特別是完成的第一個子問題高維信號探測的非參數經驗貝葉斯方法,其中的檢驗量雖然很早就為人所知,但其理論性質是長期未知的。本研究通過一個大偏差不等式,證明了在原假設下檢驗量顯著性水平的階數不超過(\log n)^2. 另一方面,當備擇假設下的正態混合密度與標準正態密度的Hellinger距離大於(\log n)/\sqrt{n}時,GLRT以漸進機率1拒絕原假設。利用上述兩方面的結果,對於二元混合正態檢驗,GLRT達到Neyman-Pearson似然比檢驗的最優探測邊界。這個工作將統計發展史上的早期理論與最新的多重達獄愉狼檢驗聯繫起來,是非參數經驗貝葉斯在統計檢驗理論方面的一項突破,美國科學院院士Lawrence Brown對這個工作很欣賞。

相關詞條

熱門詞條

聯絡我們