Radius k-means算法及其拓展問題的研究

Radius k-means算法及其拓展問題的研究

《Radius k-means算法及其拓展問題的研究》是依託鄭州大學,由婁錚錚擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:Radius k-means算法及其拓展問題的研究
  • 項目類別:青年科學基金項目
  • 項目負責人:婁錚錚
  • 依託單位:鄭州大學
項目摘要,結題摘要,

項目摘要

項目首次提出Radius k-means,它打破了k-means算法的劃分聚類,為每一個簇匹配一個半徑R,只有位於以簇質心為中心點、R為半徑所覆蓋區域內的數據對象才可被指派到該簇中。Radius k-means力圖從數據中學習低信息、高密度的簇,低信息確保了簇內數據對象的一致性,高密度確保了簇的凝聚性。針對項目研究中亟待解決的關鍵問題,擬採用順序“抽取-合併”策略來最佳化目標函式,它具有聚類速度快、實施性強的特點;擬通過考察每一個數據對象自身攜帶的信息來判斷它是否適合被指派到多個簇中,從而控制簇與簇之間的分離性;擬通過探索R與簇所包含數據對象的數量之間的規律來解決R的確定問題;擬採用重疊區域數據對象所承載的信息量作為簇與簇是否連通的判定依據,來解決基於可信簇的數據高層模式再抽取問題。該項目的研究,一方面完成對經典k-means的突破,另一方面為大數據分析提供一種有效的學習機制。

結題摘要

Radius K-Means從質心、半徑、互信息及密度四個方面來描述簇,其中質心決定了簇在數據空間中的位置,半徑刻畫了簇所能覆蓋的範圍,互信息度量了簇中所包含對象的一致性,密度反映了簇所包含對象的數量。給定一個半徑,期望從數據空間中尋找具有低信息、高密度的簇,低信息使得簇內所包含的數據對象具有較強的一致性,高密度使得一個簇具有較強的凝聚性。為此,項目研究了Radius K-Means目標函式的定義、算法的最佳化、聚類的靈活性、理論分析、套用適宜性等。在Radius k-means思想的基礎上,項目研究了一致性聚類、多任務聚類、聚類的可解釋性、推薦算法、集體行為識別等。在項目的資助下,在國內外期刊會議上發表論文15篇,其中一些研究成果發表在軟體學報、計算機學報、計算機研究與發展、IJCAI 2016、CVPR 2017、ICNC-FSKD 2017、Information Sciences、IEEE Trans on Multimedia、Water上。

相關詞條

熱門詞條

聯絡我們