《帶有群組結構的充分降維理論與方法研究》是依託寧波大學,由周景科擔任負責人的國家自然科學基金資助專項基金項目。
基本介紹
- 中文名:帶有群組結構的充分降維理論與方法研究
- 依託單位:寧波大學
- 項目負責人:周景科
- 項目類別:專項基金項目
項目簡介,結題摘要,
項目簡介
充分降維方法在不損失回響變數信息的前提下構造低維潛變數,對協變數進行降維。然而,潛變數往往不具有明確的現實意義,給模型的解釋和套用帶來了困難。群組充分降維方法利用協變數之間的群組結構構造稀疏潛變數,使得每個潛變數只是某個群組中協變數的線性組合,提高了模型的可解釋性和套用性。但是,現有的群組充分降維文獻均假定群組結構已知且群組之間互不重疊。本項目重點研究群組之間存在交叉重疊,甚至群組結構未知情形的群組充分降維問題。研究內容包括:對現有的群組充分降維的定義進行擴展,使得新定義適用於重疊群組結構的情形;對於重疊群組結構情形,提出群組中心子空間的估計方法,並研究估計量的大樣本性質;對於群組結構未知情形,構建協變數之間的高斯圖模型刻畫結構關係,將圖結構關係與群組充分降維問題相結合,提出群組中心子空間的估計量並研究相應的大樣本性質;最後,通過數值模擬和實際數據分析檢驗所提估計量的有限樣本效果。
結題摘要
項目組成員嚴格按照獲批的研究計畫開展了文獻蒐集與研讀、學術研討與交流、學術論文的撰寫與投稿等活動。完成了項目計畫書中的所有研究內容,達到了預期的研究成果,簡要概述如下:擴展了現有群組充分降維的基本概念,以適用於重疊群組結構的充分降維問題;套用稀疏懲罰的方法處理群組結構之間存在的信息冗餘,並結合包絡方法提出了重疊群組結構中心子空間的估計量,從理論上證明了估計量的大樣本性質,通過數值模擬和實際數據分析驗證了估計量的有限樣本效果;當群組結構未知時,套用Graphic Lasso方法構造協變數之間的高斯圖模型,並基於節點的思路將圖結構轉化為重疊群組結構的充分降維問題,並結合實際數據分析展示了方法的效果。除了項目計畫書的內容外,項目組還進行了若干拓展性研究。包括:結合充分降維方法研究了融合協變數圖結構的高維廣義線性模型的變數選擇問題,將現有的線性模型變數選擇問題推廣到廣義線性模型,理論上證明了參數估計的Oracle性質,並通過數值模擬和實際數據分析驗證了估計量的有限樣本效果;基於稀疏懲罰方法研究了高維眾數回歸的變數選擇問題,套用EM算法對最佳化問題進行求解,理論上證明了參數估計的相合性和變數選擇的相合性。基於該項目研究內容,項目組已完成了三篇學術論文的撰寫與投稿,其中兩篇分別在中國科學數學英文版和套用統計雜誌(Journal of Applied Statistics)公開發表,另還有一篇已投稿到journal of statistical planning and inference.