混合屬性條件下的聚類分析方法研究

混合屬性條件下的聚類分析方法研究

《混合屬性條件下的聚類分析方法研究》是依託東北師範大學,由冀進朝擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:混合屬性條件下的聚類分析方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:冀進朝
  • 依託單位:東北師範大學
項目摘要,結題摘要,

項目摘要

隨著信息技術在社會生活中的廣泛套用,人類社會在各個方面比如醫療衛生、教育、社交網站、商場和購物網站等領域源源不斷的產生數據。這些數據大多同時具有數值和分類屬性,而現有的聚類分析方法大多是針對單一屬性類型數據設計的。同時考慮數值屬性和分類屬性的特點,開發混合屬性條件下的高效聚類分析方法已成為聚類分析領域的一個重要研究方向。本項目針對該研究領域存在的問題,擬提出混合屬性條件下的簇中心初始化方法;結合競爭者懲罰競爭學習機制、參數自動確定技術等思想開發混合屬性條件下的恰當簇數的自動確定機制;基於融合混合屬性特徵的相異性度量、參數自動確定技術和群智慧型尋優策略設計混合屬性條件下的智慧型全局最佳化策略。該研究不僅對聚類分析理論的進一步發展做出貢獻,具有重要的理論意義;也為解決以聚類分析為代表的實際決策問題提供一組科學、有效的分析手段,具有重要的套用價值。

結題摘要

人類社會在教育、醫療、銀行、社交網路、線上線下購物平台等各個方面都積累了大量的數據。這些數據大多同時具有不同類型的屬性,主要分為數值屬性和分類屬性。聚類分析是從數據中獲取知識的重要手段。本課題在分析現有聚類方法存在局限性的基礎上,同時考慮這兩類屬性的取值特點和分布特徵,系統研究面向混合屬性數據條件下的聚類分析方法。本課題的研究內容包括三個方面:簇中心初始位置的確定、恰當簇數的確定和全局最佳化策略。在簇中心初始位置的確定方面,在考慮不同屬性取值特點和分布特徵的基礎上,採用數據點的密度、鄰居集來度量數據點在簇中的中心性,用距離來衡量二者之間的遠近,提出了一種混合屬性條件下的簇中心初始位置的確定方法;在恰當簇數的確定方面,結合競爭者競爭懲罰學習學習機制和參數自動確定技術設計出了混合屬性條件下恰當簇數的自動確定方法。在全局最佳化方面,採用人工蜂群算法的尋優策略結合局部搜尋策略OKP,設計了混合屬性條件下的全局最佳化策略。本課題在青年基金的資助下順利進行並完成了任務,在國內外高水平期刊和會議上共發表5篇研究論文,其中SCI檢索論文4篇。本課題的深入研究不僅對聚類分析理論的發展做出貢獻,具有一定的理論意義,也為解決以聚類分析為代表的實際決策提供了一組科學、有效的分析手段,具有潛在的套用價值。

相關詞條

熱門詞條

聯絡我們