高維數據聚類信息核保存與隱藏技術研究

《高維數據聚類信息核保存與隱藏技術研究》是依託東南大學,由倪巍偉擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:高維數據聚類信息核保存與隱藏技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:倪巍偉
  • 依託單位:東南大學
中文摘要,結題摘要,

中文摘要

數據隱藏發布中聚類可用性的維持在高維及數據動態更新環境下尤為困難:(1)聚類對數據個體差異的依賴與隱藏操作弱化個體差異的主要思想存在截然矛盾;(2)維數災難導致常用的匿名與隨機化隱藏方法失效;(3)面向聚類的重發布隱藏中數據聚簇關係可獲取為軌跡跟蹤攻擊提供了便利。本課題針對上述問題:(1)引入聚類信息核對數據聚類可用性建模,並構建面向聚類的隱私模型;(2) 提出數據集內涵與外延概念,構建關於聚類的數值屬性類別層次,實現低維數據匿名隱藏中聚類信息核保存;(3)藉助信息熵概念對數據空間進行劃分,借鑑勢能場理論構建子空間數據對象等勢面模型,設計啟發式擾動策略實現高維數據隱藏中聚類信息核保存;(4)提出重發布影響集和邊緣記錄集概念,對更新後數據進行分類隱藏,避免軌跡跟蹤導致的隱私泄露。彌補現有研究數據隱藏後難以滿足深層套用需求,及對數據集靜態、常規維度限制與現實世界複雜數據環境脫節的不足。

結題摘要

數據隱藏發布中聚類可用性的維持在高維及數據動態更新環境下尤為困難:(1) 聚類對數據個體差異的依賴與隱藏操作弱化個體差異的主要思想存在截然矛盾;(2) “維數災難導致常用的匿名與隨機化隱藏方法失效;(3) 面向聚類的重發布隱藏中數據聚簇關係可獲取為“軌跡跟蹤”攻擊提供了便利。項目組針對上述問題開展了以下研究:(1) 從k鄰域對象集這一粒度介於數據分布與數據距離間的微分布結構角度定義聚類信息核,提出保鄰域隱藏思想,並構建面向聚類的隱私模型;(2) 分析數據對象k鄰域結構成因,構建遺傳算法與隱藏操作間的映射機制、隱藏操作與空間向量運算間的關在線上制,設計基於遺傳算法和向量偏轉等技術的隱私保護數據發布方法,提出面向聚類的微數據隱藏發布解決方案;(3) 從信息熵角度分析各屬性對維持聚類信息核所起的作用,設計隱藏策略,提出面向聚類的高維數據隱藏發布方法;進一步採取分治策略,利用阿基米德螺線和對數螺線旋轉特性提出適應高維數據、能更好地兼顧數據聚類可用性與隱私安全性的數據隱藏方案;(4) 在所提出基於螺線旋轉數據隱藏方法基礎上,通過構建面向動態數據集的隱私泄露風險模型,利用閾值控制和延時發布策略,提出數據動態更新環境下兼顧聚類可用性與隱私安全性的增量式數據隱藏方案。本項目主要關注以數據為中心的複雜約束環境下靜態數據隱藏發布問題,在完成項目預期研究工作基礎上,項目組對已取得研究成果在以服務為中心的隱私保護位置服務中的套用進行探索,作為項目研究的外延,提出基於Hilbert編碼及位置擾動隱藏的保護位置隱私近鄰查詢解決方案。

相關詞條

熱門詞條

聯絡我們