HDFS讀、寫性能機率建模與模型遷移方法研究

HDFS讀、寫性能機率建模與模型遷移方法研究

《HDFS讀、寫性能機率建模與模型遷移方法研究》是依託西安交通大學,由董博擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:HDFS讀、寫性能機率建模與模型遷移方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:董博
  • 依託單位:西安交通大學
中文摘要,結題摘要,

中文摘要

HDFS性能建模是雲計算領域研究熱點之一。HDFS性能具有獨特的機率分布特徵,蘊含著有用的信息。但當前尚未開展HDFS性能機率建模研究;並且HDFS性能建模主要使用單一建模方法,性能模型遷移方法的研究處在起步階段。為此,本項目研究一種“實驗建模、分析建模與遷移學習結合”的HDFS讀、寫性能機率建模方法。.首先,基於HDFS工作機理,對檔案大小域(0, BS)範圍的檔案大小(BS代表塊長),採用實驗建模,提出基於“特徵指標值預測-機率密度還原”的性能機率密度函式估計方法;對檔案大小域(BS, +∞)的檔案大小,採用分析建模,提出基於機率密度疊加的性能建模方法。其次,對新平台的HDFS性能機率建模,提出基於實例遷移的HDFS性能機率建模方法。.以上方法能夠建立不同平台HDFS讀、寫性能在檔案大小域的機率模型,減少建模成本、提高建模效率,對其它數據密集型檔案系統性能建模具有借鑑意義。

結題摘要

性能建模是雲計算和大數據領域研究熱點之一。以大數據分析為套用背景,研究數據密集型檔案系統和計算的建模關鍵技術。主要研究內容包括:Hadoop分散式檔案系統性能建模、基於系統辨識的Hadoop MapReduce性能建模、公有雲環境下Spark性能建模和資源最佳化配置方法和Virtual Machine Consolidation性能建模與死鎖避免策略。研究成果發表學術論文14篇,授權國家發明專利2項;成功部署於國稅總局“金稅三期”決策支持風險管理、納稅人信用管理、個人稅收管理等跨省套用系統,實現了“總局+省局”多Hadoop數據中心。並作為主要研究成果獲2017年度國家科學技術進步二等獎,項目負責人為第六完成人。

相關詞條

熱門詞條

聯絡我們