穩健且有效的回歸和變數選擇方法研究

穩健且有效的回歸和變數選擇方法研究

《穩健且有效的回歸和變數選擇方法研究》是依託中山大學,由王學欽擔任項目負責人的面上項目。

基本介紹

  • 中文名:穩健且有效的回歸和變數選擇方法研究
  • 項目類別:面上項目
  • 項目負責人:王學欽
  • 依託單位:中山大學
中文摘要,結題摘要,

中文摘要

如何構造高穩健又高有效的回歸估計,尤其在超高維數據中,是一個具有挑戰性的工作。對於回歸模型和(超)高維環境中的大多數M-估計,雖然在模擬實驗中能夠驗證它們具有一定的穩健性,但是它們的一個重要的穩健性度量- - -有限樣本的崩潰點很低,漸進為0。基於分步M-估計的MM估計和ARETE等估計可以改進這些不足,使得它們能夠同時具有高穩健性和高有效性,但它們都依賴於一個高穩健的初始估計。也因為這種依賴性,ARETE雖然是第一個提供穩健理論證明的穩健變數選擇方法,但不能簡單推廣到超高維數據中。因此,本項目試圖回答兩個問題:(1)是否可以構造不依賴高穩健的初始估計的高穩健又高有效的回歸估計? 從而提出針對超高維數據的高穩健又高有效的變數選擇方法。進一步考慮它們的多元推廣。(2)是否能夠在非漸進理論的框架下考慮新的穩健性度量,使其能夠闡明Quantile回歸估計等常用的M-估計的穩健性

結題摘要

如何構造高穩健又高有效的回歸估計,尤其在超高維數據中,是一個具有挑戰性的工作。對於回歸模型和(超)高維環境中的大多數M-估計,雖然在模擬實驗中能夠驗證它們具有一定的穩健性,但是它們的一個重要的穩健性度量---有限樣本的崩潰點很低,漸進為0。基於分步M-估計的MM-估計和ARETE等估計可以改進這些不足,使得它們能夠同時具有高穩健性和高有效性,但它們都依賴於一個高穩健的初始估計。也因為這種依賴性,ARETE雖然是第一個提供穩健理論證明的穩健變數選擇方法,但不能簡單推廣到超高維數據中。本項目主要圍繞如何構建超高維數據的高穩健又高有效的變數選擇方法而展開方法學研究,並進一步探討相關套用。在國家自然科學基金(項目編號:11271383)的支助下,在穩健超高維變數選擇方法、不依賴於模型的超高維特徵篩選方法等方向取得重要的研究成果,例如(1)提出了基於指數平方損失的穩健變數選擇方法,並從理論上證明其Oracle性質和穩健性:漸時崩潰點為1/2而且影響函式是有界的;(2)研究了變數選擇方法中的懲罰函式是如何影響到變數選擇的效果,提出了一種無窮次可微且有界的懲罰函式,使得對應的懲罰變數選擇方法不僅具有優良的統計性質,而且具有計算上的優勢。相關成果發表在統計學著名刊物JASA, Scandinavian Journal of Statistics, SII上。研究成果套用於分析食管鱗狀細胞癌病人的樣本、分析精神疾病病人腦部MRI數據、下一代測序數據,成果豐富,系列成果分別發表在交叉領域著名刊物:British journal of cancer(影響因子:5.57), Nature子刊Scientific report(影響因子:5.23),生物信息學頂尖刊物Bioinformatics。

相關詞條

熱門詞條

聯絡我們