《穩健變數選擇與高維數據分析》是依託北京師範大學,由崔恆建擔任項目負責人的面上項目。
基本介紹
- 中文名:穩健變數選擇與高維數據分析
- 依託單位:北京師範大學
- 項目負責人:崔恆建
- 項目類別:面上項目
《穩健變數選擇與高維數據分析》是依託北京師範大學,由崔恆建擔任項目負責人的面上項目。
《穩健變數選擇與高維數據分析》是依託北京師範大學,由崔恆建擔任項目負責人的面上項目。項目摘要眾所周知,當誤差分布或因變數的分布偏離了理論假定分布時,基於懲罰最小二乘或正態似然的變數選擇方法及其參數估計方法將很不穩定,甚至...
《高維時間過程型數據的聚類及變數選擇分析》是依託東北師範大學,由黃偉擔任項目負責人的青年科學基金項目。項目摘要 對高維時間過程型數據的分析一直是生物學、醫學用於研究某個自然過程(細胞分化、癌變細胞生長)的重要手段。時間過程型...
本項目主要圍繞如何構建超高維數據的高穩健又高有效的變數選擇方法而展開方法學研究,並進一步探討相關套用。在國家自然科學基金(項目編號:11271383)的支助下,在穩健超高維變數選擇方法、不依賴於模型的超高維特徵篩選方法等方向取得重要的...
對於超高維線性模型,我們將研究基於加權Wilcoxon型估計的穩健變數掃描方法。利用U過程理論,我們將建立該方法的sure screening 性質,並利用此方法來研究超高維部分線性模型的穩健變數掃描問題。我們將通過模擬和實際數據分析來驗證所提方法的...
目前,分析這些高維數據的最有效工具之一是圖模型。它可清晰地表示問題的背景知識及變數間的結構關係,是高維數據統計建模的非常自然的方式。然而,由於圖模型中涉及的變數太多,傳統的參數估計和模型選擇方法,要么計算複雜度比較高,要么...
與此同時,還研究了函式型變數的M估計以及變數選擇問題,對函式型數據和多元協變數混合的回歸模型進行理論探索;第四,對複雜類型數據的關聯分析、聚類分析以及模糊聚類的距離範式進行了研究,在高維度數據的餘弦相似度計算方面,提出了“...
此外,我們也研究協變數缺失時降維技術,在無須對傾向性得分函式作模型假設下發展降維技術。結題摘要 缺失數據普遍發生在一些實際問題的研究中。本項目研究數據缺失時高維數據分析的方法、理論與套用。研究了協變數缺失時非參數降維問題,...
本書的主要創新之處是將非線性數據、相依數據、非平穩數據和分類數據引入高維統計模型,發展了估計理論和模型識別方法;對稀疏高維統計模型引入了正則方法和變數選擇來提高高維統計模型的識別能力和預測精度;對非平穩隨機微分方程發展了穩健...
本課題就複雜縱向數據的統計建模推斷完成了以下主要研究內容和重要結果。 1)基於廣義估計方程理論提出含有脫落型缺失值的高維縱向數據的變數選擇方法,提供了變數選擇相合性的理論證明、模擬比較和實際套用範例,是一種新的適用於實際高維隨機...
發展新的變數篩選方法。在超高維框架下發展新的變數篩選方法以實現充分降維,探索合適的算法,將理論成果套用於實際數據分析。其研究可以豐富懲罰類變數選擇的方法體系,也為生存數據分析領域的套用提供理論基礎。科研成果 ...
含多個因變數的線性回歸模型是統計學中的經典模型之一,其套用廣泛存在於各個學科中。目前國內外對高維數據情形下的該模型的研究比較欠缺。本項目研究該模型在自變數和因變數維數都遠大於樣本量的情形下的統計推斷問題。在誤差項服從多元正...
基於我們構建的假設檢驗理論和方法,我們還進一步研究了高維數據領域的變數篩選和選擇問題。除此之外,我們還研究了高維數據分析領域裡的其它重要相關議題,比如懲罰充分降維方法、穩健型降維方法以及基於充分降維方法的統計建模問題。在項目資助...