《函式數據降維及相關問題研究》是依託東北師範大學,由張寶學擔任項目負責人的面上項目。
基本介紹
- 中文名:函式數據降維及相關問題研究
- 項目類別:面上項目
- 項目負責人:張寶學
- 依託單位:東北師範大學
《函式數據降維及相關問題研究》是依託東北師範大學,由張寶學擔任項目負責人的面上項目。
《函式數據降維及相關問題研究》是依託東北師範大學,由張寶學擔任項目負責人的面上項目。項目摘要本項目主要研究函式型數據降維及其相關問題,該領域在醫學、基因表達數據分析、化學、氣候等領域的理論研究和實際套用中具有十分重要的意...
本項目致力於通過充分降維方法系統構建並深化高維數據模型下的假設檢驗理論。我們將著重展開如下三個方面的研究:(1)基於二階參數化降維方法的結構維數檢驗理論和方法;(2)超高維半參數模型下變數顯著檢驗理論和方法;(3)高維函式型數據模型的結構維數檢驗以及特徵顯著性檢驗。本項目的研究成果必將為分析和處理金融...
此外,我們也研究協變數缺失時降維技術,在無須對傾向性得分函式作模型假設下發展降維技術。結題摘要 缺失數據普遍發生在一些實際問題的研究中。本項目研究數據缺失時高維數據分析的方法、理論與套用。研究了協變數缺失時非參數降維問題,發展了兩步方法,證明了降維方向估計有根號n相合性及維數估計的相合性,與已有工作...
本課題著重研究了複雜數據背景下的充分性降維問題,以及降維技術在生物醫學研究的套用。把刪失數據下的充分性降維問題看成一個半參數回歸問題,將不同的降維方法統一到一個框架下進行討論;通過構造估計方程,提出了若干不同形式的估計量;結合鞅理論和半參數理論,研究了這些方法的理論性質;開發了R軟體包orthoDr。建立...
本項目系統研究了生物特徵識別這一實際問題中高維數據降維的前沿統計方法和算法,具體包括:(1)帶異常干擾線性生物數據的穩健降維及算法。使用協方差矩陣的多種穩健估計,例如最小協方差行列式估計(MCD)方法改進PCA、LDA數據降維方法;使用基於異常點度量的多種重構誤差方法;使用基於熵信息的高維小樣本數據處理方法...
其中廣義模型能夠用於對一些實際數據(如食品分析數據)進行判別分析;(3)針對函式型回歸模型估計中常用的降維方法,提出了一個更穩健方法—函式型切片逆回歸方法,該方法適用於函式型數據中有異常值的問題,同時部分函式型線性模型提出了穩健的M估計方法,並獲得了估計的大樣本性質;(4)針對多元函式型數據的半參數...
學習理論研究基於隨機樣本的學習算法,並對取樣誤差和逼近誤差進行理論上的分析。學習理論依賴於機率統計,也充分借鑑和利用函式論的思想和方法。本項目旨在研究面向複雜信息的學習算法設計和算法的誤差分析。高維信息、多任務信息、多視圖信息是信息複雜性的重要體現。針對高維數據設計降維算法,對數據降維後最優預測函式的...
本項目力圖在難點問題上有突破和創新,在熱點問題上取得重大進展和研究成果。結題摘要 提出了針對二元正態數據函式檢驗問題的序貫檢驗方法;提出了穩健性與Hastiness兩個指標平衡下的二元正態數據最優量化降維序貫檢驗方法。這些研究開拓了對於多元數據序貫檢驗方法性質研究的新角度,所提出的方法及相關結論豐富和完善了序貫...
本項目研究了矩陣值數據跡回歸模型中,參數的估計和變數選擇問題。通過將核範數和group lasso懲罰相結合,建立了凸的目標函式,得到了估計的相合性。在實際問題中,異常值或影響點是十分常見的。 當有多個影響點時,由於masking效應和swamping效應的存在,模型診斷是一個困難的問題。我們提出了影響點診斷的新方法MIP,...
進一步研究了高維/超高維生存數據的同時模型結構識別、變數選擇和參數估計方法;(3)研究了幾類複雜生存數據(包括帶有輔助信息的核實數據、基於有偏抽樣的生存數據等)的半參數統計推斷問題;(4)研究了超高維生存數據的非參數降維方法和快速穩健算法的設計;(5)多元複雜生存數據的半參數統計推斷。
研究的主要模型為幾種常見的非參數可加模型和半參數模型。在方法上,主要研究自適應的參數和非參數兩步估計、無窮維討厭參數的估計插入後的估計函式的糾偏技術以及對應的高維數據模型的降維方法。要達到的具體目是:1.在模型函式估計方面,得到的估計量有標準的收斂速度,並與數據的維數無關,即:如果要估計的函式是非參...