高維數據統計分析方法及套用研究

《高維數據統計分析方法及套用研究》是依託中國科學技術大學,由金百鎖擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:高維數據統計分析方法及套用研究
  • 項目類別:青年科學基金項目
  • 項目負責人:金百鎖
  • 依託單位:中國科學技術大學
中文摘要,結題摘要,

中文摘要

在現代社會,信息量以及套用信息的程度都以幾何級數的方式在增長,這些海量信息大多可以表示成高維數據的形式,因此高維數據分析是當今數理統計發展最重要的方向之一。本項目將從三個方面較系統的研究高維數據問題。一是高維情形下回歸設計的若干問題,將套用Hadamard矩陣和其他一些矩陣的正交結構尋找最優設計,從而在收集高維數據時既可以包含足夠的信息又可以極大地減少人力、物力、成本花費等。二是在收集的高維數據具有稀疏性情況下,套用當前流行的SCAD和MCP等大規模數據模型選擇方法,在模型選擇的同時對多變點進行更加快速有效的檢測。三是當高維數據不具有稀疏性情形下,研究具有相依結構的大維隨機矩陣極限譜分布,進而研究由譜分布構成的多元統計量的極限性質,為統計推斷奠定基礎。本項目還將採用上述方法對金融、環境、地質等領域的高維數據進行套用研究,使得上述理論研究也具有較大的實際套用價值。

結題摘要

在項目執行期間,我們基於立項目的、預期目標和自然科學基金提倡的原則開展研究工作。在科學研究方面:以高維數據分析為主線,研究了最優試驗設計、模型選擇與變點檢測、大維隨機矩陣譜分析理論。最優試驗設計方面,推廣了對數線性混合模型精確D-最優設計問題和基於最大熵的站點網路設計問題。模型選擇和變點檢測方面,提出了一個新穎的快速的針對非平穩時間序列模型的多變點同時檢測和模型選擇的方法。算法方面,我們選取一個自適應序列改進了多元線性回歸模型的遞歸M估計,以及具有線性約束的截斷多元正態的EM算法。大維隨機矩陣理論方面,我們研究了對稱自交叉樣本協方差矩陣極限譜分布的顯示表達式和其最大特徵根與最小特徵根的極限。論著方面:受項目資助課題組共發表8篇SCI論文,2篇已被接受的SCI論文和1篇中文核心期刊,其中項目申請人為第一作者或通訊作者有7篇。人才培養方面:本項目培養了2名博士生,13名碩士生,其中2名獲得博士學位,6名獲得碩士學位。

相關詞條

熱門詞條

聯絡我們