高維混合型數據聚類及套用研究

高維混合型數據聚類及套用研究

《高維混合型數據聚類及套用研究》是依託汕頭大學,由孫浩軍擔任項目負責人的面上項目。

基本介紹

  • 中文名:高維混合型數據聚類及套用研究
  • 項目類別:面上項目
  • 項目負責人:孫浩軍
  • 依託單位:汕頭大學
項目摘要,結題摘要,

項目摘要

高維混合型數據聚類問題的研究是近年來數據挖掘研究中提出的新問題,因數據的複雜性使得在全空間上聚類效果不理想。本項目瞄準這一焦點問題,通過研究多種類型數據的信息融合,建立基於遺傳算法構建高維混合型數據的子空間聚類模型,開發適用於海量高維數據聚類分析的有效方法,以及在銀行客戶信用評價中的套用研究。主要研究方向:(1)用模糊邏輯研究多種類型數據的信息融合,解決目前信息融合中的信息丟失問題;(2)探索用遺傳算法建立高維混合數據聚類子空間搜尋模型,研究適應於子空間聚類評估的適應度,為評估子空間聚類效果提供依據,建立基於蟻群算法的主動進化變異機制,使收斂速度提高,而又不會陷入局部極小;(3)開展在銀行客戶信用評估聚類中的套用研究。

結題摘要

高維混合型數據聚類問題的研究是近年來數據挖掘研究中提出的新問題,因數據的複雜性使得在全空間上聚類效果不理想。本項目瞄準這一焦點問題,通過研究多種類型數據的信息融合,建立基於信息熵理論構建高維混合型數據的子空間聚類模型,開發適用於海量高維數據聚類分析的有效方法,以及在醫學數據預測評價中的套用研究。主要研究成果(1)用信息熵理論研究多種類型數據的信息融合,提出了兩種混合數據間相似度的度量方法,在一定程度上解決目前信息融合中的信息丟失問題;(2)探索用全信息熵理論建立高維數據聚類子空間搜尋模型,特別在分類型數據聚類問題,研究適應於子空間聚類子空間合併和子簇類合併機制,在理論上探討了高維數據子空間簇類的結構,首次提出了基於類簇的基本子空間和核心子空間的概念,其結果與實際數據相匹配;(3)開展了在醫學數據挖掘的研究,通過對醫院重症病人是實時血壓值進行聚類分析,以及基於高斯回歸模型和理察分量分解模型進行趨勢分析,在一定時間段內對病人發生急性低血壓情況進行預測,達到良好的的效果;(4)電子商務中的協同過濾算法在一定程度上提高了推薦效果,我們通過對用戶-項目評分矩陣進行基於支持度的項目聚類的方法,減少最近鄰居集的搜尋空間,提高了推薦效果。

相關詞條

熱門詞條

聯絡我們