高維數據統計建模與分析

《高維數據統計建模與分析》是依託北京大學,由陳松蹊擔任項目負責人的重點項目。

基本介紹

  • 中文名:高維數據統計建模與分析
  • 依託單位:北京大學
  • 項目負責人:陳松蹊
  • 項目類別:重點項目
項目摘要,結題摘要,

項目摘要

隨著現代數據的收集和儲存技術的提高,統計數據呈現出高維性。由於可重複研究的限制,參加研究的個體數量相對很小。這就是現代統計學中最具挑戰的大p,小n問題。具體地說,數據的維數大大超過樣本的個數。 這尤其表現在生物基因學研究,網路信息,以及金融數據中。如何在樣本量不是很大的前提下分析超高維數據,是一個非常具有挑戰的、也是國際統計學的前沿課題。本項目將著重在五個方面對高維數據統計建模與分析進行科學的,系統的研究。這五個方面是:(1)高維數據的變數選擇、(2)超高維多元統計分析、(3)複雜數據的相關性、(4)大規模線上數據的監控和(5)高維生存數據分析。這五方面的研究均對傳統的統計推斷理論提出了全新的挑戰,且均是目前國際統計學研究的最前沿問題。這五個課題相對獨立又相互依託,有理論也有套用,將從不同的方向對高維數據的統計推斷提出有效的解決方法,建立一個統一的適應於高維數據統計建模與分析的框架。

結題摘要

隨著現代數據的收集和儲存技術的提高,統計數據呈現出高維性。由於可重複研究的限制,參加研究的個體數量相對很小。這就是現代統計學中最具挑戰的“大p,小n”問題。具體地說,數據的維數大大超過樣本的個數。 這尤其表現在生物基因學研究,網路信息,以及金融數據中。如何在樣本量不是很大的前提下分析超高維數據,是一個非常具有挑戰的、也是國際統計學的前沿課題。本項目著重在五個方面對高維數據統計建模與分析進行科學的,系統的研究。這五個方面是:(1)高維數據的變數選擇、(2)超高維多元統計分析、(3)複雜數據的相關性、(4)大規模線上數據的監控和(5)高維生存數據分析。這五方面的研究均對傳統的統計推斷理論提出了全新的挑戰,且均是目前國際統計學研究的最前沿問題。這五個課題相對獨立又相互依託,有理論也有套用,將從不同的方向對高維數據的統計推斷提出有效的解決方法,建立一個統一的適應於高維數據統計建模與分析的框架。本重點項目在五個子課題方面都取得了不斐的成績和結果,解決了一系列高維統計推斷的關健問題。5年中發表、接受發表的論文有106篇,其中有12篇在國際統計學的頂尖的四個期刊上發表。另外有數篇在國際精算期刊和經濟計量期刊上發表。

相關詞條

熱門詞條

聯絡我們