關於大數據處理分散式學習算法的可行性理論研究

關於大數據處理分散式學習算法的可行性理論研究

《關於大數據處理分散式學習算法的可行性理論研究》是依託西安交通大學,由常象宇擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:關於大數據處理分散式學習算法的可行性理論研究
  • 項目類別:青年科學基金項目
  • 項目負責人:常象宇
  • 依託單位:西安交通大學
中文摘要,結題摘要,

中文摘要

進入大數據時代,經典的統計機器學習算法面臨著兩個基本的挑戰,即如何設計能夠適應於大數據的統計機器學習算法,以及如何分析這樣算法的可行性。針對第一個問題,有大量的文獻研究了如何利用分而治之的策略把經典的統計機器學習算法推廣為分散式學習算法。但是這樣的分散式學習算法對於大數據處理是否是可行的仍然沒有完整的理論研究。.因此,本項目將聚焦於研究統計機器學習方法套用於大數據的兩個基本問題:第一,從理論上對於分散式學習算法研究其可行性,特別的對於分散式回歸算法,分散式K均值聚類算法,分散式隨機塊算法提供可行性理論;第二,針對一些特定的還不能套用於大數據的非分散式學習算法(例如基於隨機塊模型的社區發現算法)設計分散式學習算法。

結題摘要

扣緊研究計畫,項目組對大數據的分散式學習算法的可行性理論做了深入的研究。在理論方面,本項目的主要研究成果包括: 基於新的誤差分解策略的分散式回歸算法的學習理論。針對高維數據的稀疏聚類方法的可行性理論。針對大規模社交網路的統計建模與分析。基於上述三部分成果,本項目組共發表論文20篇,其中19篇文章被SCI收錄,1篇會議文章被EI收錄。特別的,其中一篇文章被統計機器學習的頂級期刊Journal of Machine Learning Research收錄。本項目所構建的理論分析方法已經被其他文章所使用,並引用超過10餘次。在人才培養方面,培養畢業博士2名,副教授1名,陝西省高等學校傑出青年人才1名。

相關詞條

熱門詞條

聯絡我們