圖嵌入方法在大規模數據密集型系統中的套用研究

圖嵌入方法在大規模數據密集型系統中的套用研究

《圖嵌入方法在大規模數據密集型系統中的套用研究》是依託南昌大學,由李嵐擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:圖嵌入方法在大規模數據密集型系統中的套用研究
  • 項目類別:青年科學基金項目
  • 項目負責人:李嵐
  • 依託單位:南昌大學
項目摘要,結題摘要,

項目摘要

大數據是繼雲計算之後的又一研究熱點,它融合了眾多現有技術,其中關鍵技術之一是圖嵌入方法,即將套用數據抽象得到的虛擬邏輯拓撲經圖同態運算後有效嵌入到真實的計算節點物理拓撲中的方法。針對密集型大數據處理中普遍存在的擴展性、負載均衡自適應性和容錯性問題,本項目從兩方面研究Cayley圖及其陪集圖的圖嵌入方法在解決這些問題中的套用。一方面,研究圖嵌入方法在數據中心網路中用於設計高對稱性的數據中心體系結構並獲得高效的路由策略問題;並探討以此為基礎設計出可擴展性強且負載均衡的大數據平台體系架構;一方面,在現有的和新設計的大數據體系架構基礎上研究如何將圖嵌入方法套用于海量數據的分散式存儲,改進現有的鍵值對數據模型,使其支持更複雜的多維數據查詢處理。圖嵌入方法充分利用圖結構對稱性來簡化數據中心和大數據的虛擬化問題,該研究成果為設計高擴展性、負載均衡和高容錯性的大數據處理平台提供理論基礎和關鍵技術。

結題摘要

本課題研究使用圖嵌入方法,設計並構建用於密集數據存儲的數據中心網路;研究了密集數據索引的方法和策略。基於OTIS光通信網路結構,設計了Mesh結構和超立方體結構作為因子網Ω的數據密集型平台體系架構,使用人體生物體徵數據、人臉圖像數據和垃圾郵件數據,研究了海量數據的分散式存儲和索引方法,設計了基於超立方體結構的兩層Cayley圖索引模型CayIndex。研究了圖嵌入方法在人體生物體徵數據、人臉圖像數據以及垃圾郵件數據中的套用。研究實驗說明圖嵌入方法在密集數據索引和存儲的套用中,不僅存在挑戰,也具有強大的優勢,基於對稱的確定性拓撲所設計的索引結構具有很好的容錯性和魯棒性,但是數據提取和分析在前期的研究中複雜,且難度大。下一步重點研究數據在輕度清洗後如何充分利用圖嵌入的容錯性和魯棒性來規避非結構化數據分析的難度和強度。

相關詞條

熱門詞條

聯絡我們