大數據與試驗設計中的統計方法與計算

《大數據與試驗設計中的統計方法與計算》是依託南開大學,由王兆軍擔任項目負責人的重點項目。

基本介紹

  • 中文名:大數據與試驗設計中的統計方法與計算
  • 項目類別:重點項目
  • 項目負責人:王兆軍
  • 依託單位:南開大學
中文摘要,結題摘要,

中文摘要

可以說,大數據正在變革我們的生活、工作和思維,如何有效地挖掘並利用大數據中的有用信息,則是我們當前需要深入研究的重要課題。本項目將從四個方面對大數慨戶雄據與試驗設計進行研究:1) 大數據挖掘與計算;2)超高維數據陣的統計推斷;3)大數據的實時監控與診斷;4)複雜試驗的設計理論與建模方法。具體研究內容將包括:從計算機科學角度研究處理數據的融合算法、數據挖掘推薦算法、大數據隱私保護算法、並行算法等;從統計學角度研究高維稀疏協方差的穩健矩陣、超大規模兩樣本t檢驗的穩健性研究、高維數據流的實時監控與診斷、線上數據質量的定義與監控、多元函式型數據的實時監控、高水平及混水平超飽和設計(SSD)的最優理論及構造、多種拉丁超立方體設計(LHD)的構造及數據分析與建模。通過本項研究,爭取有一定的理論突破,為今後的實際套用和推廣奠定堅實的基礎。.本項目的研究成果將包括專利(或軟體著作權)、學術論文及學生培養。

結題摘要

背景及科學意義大數據正在變革我們的生活、工作和思維,如何有效地挖掘並利用大數據中的有用信息,則是我們當前需要深入研究的重要課題。通過本項研究,爭取有一定的理獄寒榜白論突破,為今後的實際套用和推廣奠定堅實的基礎。本項目的研究成果包括一系列學術論文及學生培養。主要研究內容本項目將從四個方面對大數據與試驗設計進行研究:(1)大數據挖掘與計算;(2)超高維數據陣的統計推斷;(3)大數據的實時監控與診斷;(4)複雜試驗的設計理論與建模方埋鞏雅法。重要結果(1)從計算機科學角度我們研究了處理數據的融合算法、數據挖凶樂射危掘推薦算法、大數據隱私保護算法、並行算法等;(2)從統計學角度我們研究了高維稀疏協方差的穩健矩陣、超大規模兩樣本t檢驗的穩健性研究等;(3)從統計學角度我們研究了高維數據流的實時監控與診斷、線上數據質量的定義與監控、多元函式型數據的實時監控等;(4)從統計學角度我們研究了高水平及混水平超飽和設計(SSD)的最優理論及構造、多種拉丁超立方體設計(LHD)的構造及數據分析與建模等。關鍵數據在本項目執行期間(2015-2019年),在本項目的資助下,本項目組成記舉境員共出版專著2本,發表或接收待發表SCI論文104篇,包括國際統計四大頂尖雜誌11篇、國際工業統計頂級期刊Technometrics 5篇、泛華統計協會會刊Statistica Sinica 12篇、計算機科學頂級雜誌或會議論文12篇。畢業博士生15名、碩士生38名、專業嚷棕碩士41名;在讀博士生35名、碩士生9名、專厚囑漏業碩士16名。
check!

熱門詞條

聯絡我們