大數據偏好查詢算法關鍵技術研究

《大數據偏好查詢算法關鍵技術研究》是依託哈爾濱工業大學,由韓希先擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:大數據偏好查詢算法關鍵技術研究
  • 依託單位:哈爾濱工業大學
  • 項目類別:青年科學基金項目
  • 項目負責人:韓希先
項目摘要,結題摘要,

項目摘要

在大數據套用中,如何有效執行偏好查詢正在成為一個越來越重要的問題。數據爆炸使得人們很難找到自己真正想要的數據,傳統的布爾資料庫查詢模型在大數據上執行時經常遇到以下問題:空集或過多候選結果。偏好查詢通過信息過濾和信息抽取有效減少返回的數據量,幫助用戶找到真正有價值的數據,具有較大的學術和實用價值。我們發現,現有的偏好查詢算法只適用於中小規模數據,在大數據上會引起較大的執行費用,而且現有關於近似偏好查詢的研究工作還很少。為此,本項目主要研究大數據偏好查詢算法的關鍵技術,包括大數據偏好查詢的理論基礎、準確算法、近似算法和線上算法,擬分析大數據偏好查詢的數學抽象和複雜性結果,根據具體偏好查詢的特點設計有效的剪下規則來丟棄不屬於查詢結果的候選元組,在近似偏好查詢中考慮誤差度和執行行為的關係,從而較好地利用給定誤差提供的性能提高空間,並實現大數據偏好查詢的原型系統來驗證本項目研究成果的正確性和有效性。

結題摘要

數據爆炸使得人們很難找到自己真正想要的數據,傳統的布爾資料庫查詢模型在大數據上執行時經常遇到以下問題:空集或過多候選結果。偏好查詢通過信息過濾和信息抽取有效減少返回的數據量,幫助用戶找到真正有價值的數據,具有較大的學術和實用價值。現有的偏好查詢算法大都只考慮中小規模的數據集,在大數據上,現有算法都存在執行效率較差的問題。本項目考慮大數據上的偏好查詢算法的關鍵技術。在本項目的支持下,課題組共發表包括資料庫頂級國際期刊和CCF A類會議在內的高質量學術論文10篇。研究成果表明,課題組提出的大數據偏好查詢算法比現有方法,無論在執行時間、記憶體消耗和磁碟費用方面,都表現出較大的性能優勢。在商業決策和分析過程中,作為實現個性化查詢的重要手段,偏好查詢處理對於企業決策人員及時掌握市場動向從而及時做出正確的商業決策起著至關重要的作用,本項目的研究成果將在實際生產中體現其科研和經濟價值。

相關詞條

熱門詞條

聯絡我們