《符號數據的聚類有效性分析與最佳化算法研究》是依託山西大學,由白亮擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:符號數據的聚類有效性分析與最佳化算法研究
- 項目類別:青年科學基金項目
- 項目負責人:白亮
- 依託單位:山西大學
《符號數據的聚類有效性分析與最佳化算法研究》是依託山西大學,由白亮擔任項目負責人的青年科學基金項目。
《符號數據的聚類有效性分析與最佳化算法研究》是依託山西大學,由白亮擔任項目負責人的青年科學基金項目。項目摘要由於在人們的日常生活中存在著大量的符號數據(一種非數值型數據),如生物信息數據、Web數據和客戶交易數據等,如何針...
而數據聚類分析正是解決這一問題的有效途徑, 它是數據挖掘的重要組成部分, 用於發現在資料庫中未知的對象類 ,為數據挖掘提供有力的支持,它是近年來廣為研究的問題之一。聚類分析是一個極富有挑戰性的研究領域, 採用基於聚類分析方法的數據挖掘在實踐中已取得了較好的效果。聚類分析也可以作為其他一些算法的預處理步驟...
從統計學的觀點看,聚類分析是通過數據建模簡化數據的一種方法。傳統的統計聚類分析方法包括系統聚類法、分解法、加入法、動態聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。採用k-均值、k-中心點等算法的聚類分析工具已被加入到許多著名的統計分析軟體包中,如SPSS、SAS等。從機器學習的角度講,簇相當於隱藏模式。
《基於圖論方法的符號網路中重疊聚類算法的研究》是依託山東大學,由亓興勤擔任項目負責人的青年科學基金項目。中文摘要 類簇結構或社區結構是複雜網路最普遍和最重要的拓撲結構屬性之一。目前已有的聚類算法大多是基於非符號複雜網路(邊上權重為正),對符號網路(signed network)(邊上權重擴展為正、負)的研究少之又...
因此,本課題擬開展面向地理標籤數據的高效聚類算法的研究,提出複雜度低、實時性高和效果好的聚類算法。我們擬從兩方面進行研究:一是改進傳統聚類算法,形成新算法;二是融入領域知識,設計新算法。為了達到高效的目的,我們擬提出一種新的、基於類級別的有效性方法。在不增加原有算法的計算負擔下,可以將它與傳統...
子空間聚類是實現高維數據集聚類的有效途徑,它是在高維數據空間中對傳統聚類算法的一種擴展,其思想是將搜尋局部化在相關維中進行。套用 高維數據聚類分析是聚類分析中一個非常活躍的領域,同時它也是一個具有挑戰性的工作。目前,高維數據聚類分析在市場分析、信息安全、金融、娛樂、反恐等方面都有很廣泛的套用。
對半監督聚類集成的機理與關鍵技術進行系統研究,探索半監督聚類集成的理論基礎及通用的學習模型,進而設計其高效算法及並行最佳化方法。研究內容包括五部分:1.建立有效的半監督聚類集成的理論基礎,研究半監督聚類集成中的魯棒性和穩定性等問題;2.構建滿足魯棒性和穩定性的半監督聚類集成通用模型,運用選擇性和加權等策略...
主要研究成果包括:(1)針對動態數據挖掘中的聚類問題,提出了增量AP聚類、微粒群最佳化演化聚類、動態複雜網路社區發現等多種有效的演化聚類模型與算法;(2)對聚類模型與算法進行了聚類數目估計、擾動分析、稀疏成分分析等方面的理論分析,提出了區間型符號數據的特徵選擇方法和可用於聚類分析的可視化降維方法;(3)提出...
《雙重空間聚類及其自組織遺傳最佳化算法研究》是依託武漢大學,由焦利民擔任項目負責人的青年科學基金項目。項目摘要 面向海量、高維、多專題空間數據的探測性數據分析是空間信息技術發展及其套用拓展的迫切需求,也是空間數據挖掘的難點和重要方向。雙重空間聚類面向帶有多類型非空間屬性的高維專題空間數據,要求聚類結果在空間...
二是分析符號網路行為。分析網路成員連線行為以及成員地位等,包括網路個體、群體的傳播行為、傳播路徑。分析網路成員之間連線趨勢,最佳化群體劃分算法,通過數據分析證明符號網路群體發現算法的有效性等。研究表明,網路中成員的群聚構成社團遵循物以類聚演化機理。結合網路的結構,利用網路成員的局部結構和全局信息,發現社團...
尋找影響IB算法解精確度的關鍵因素;使用貝葉斯熵改造IB理論,祛除其對有限數據集的依賴性;將最小描述長度原理等成熟的模型選擇方法用於IB中,使得IB算法能夠對數據聚類分析的結果進行選擇,從而確定數據劃分的簇數,解決聚類有效性的基本問題;力圖用數學方法構造IB算法套用於普通數據集的機制,解決IB理論的適用性問題...
建立了適於動態環境的新型協同進化機制,給出了基於環境敏感程度的變數空間分割方法,以及基於完整解集的子種群個體優劣比較策略;在此基礎上,基於微粒群最佳化這一典型進化最佳化方法,提出了適於動態環境的合作型協同多目標微粒群最佳化算法,並將其用於數據流聚類等實際問題,驗證了所提理論與方法的有效性。
8.4 算法性能評價指標 8.5 大數據處理平台下聚類算法的實驗結果與分析 8.6 本章小結 第9章 大數據分析算法的並行化研究 9.1 大數據分析中並行化研究現狀 9.2 大數據分析中並行化算法的研究內容 9.3 大數據分析中相關並行化算法 9.4 算法性能評價指標 9.5 基於Map Reduce的大數據處理並行算法的最佳化...
沒有一種算法是十全十美的,根據實際情況使用綜合性的半監督聚類算法。 半監督聚類是近幾年機器學習領域的一個 新的研究方向,隨著套用的日益廣泛,需處理的數據量越來越大、越來越複雜,維數越來越高,可以利用有效處理二維和小的數據集的半監督聚類方法進行強化和修改,以使其能處理大的和高維的數據集。背景 將物理...
本書重點研究了位置數據的智慧型聚類學習相關模型和算法前沿,集中反映了作者近年來對空間數據聚類與智慧型最佳化相結合的研究成果,系統闡述了GPS位置數據聚類學習的相關模型與算法。本書共分為7章,包括GPS位置數據聚類模型和智慧型最佳化的關鍵技術,GPS位置數據的遺傳、模糊粒子-遺傳融合、遺傳-模糊蟻群混合自動聚類模型與算法,...
《模糊聚類算法及套用》介紹了聚類分析的基本概念、算法及存在的主要問題.著重對一類重要的模糊聚類算法——fcm類算法進行了系統的分析,在原型初始化、噪聲敏感性、多尺度結構、核函式、聚類有效性、聚類趨勢、目標函式最佳化方法等方面進行系統的研究,提出了相應的改進模型,並論證了基於核函式的fcm類算法的收斂性定理...
設計的算法通過同傳統的聚類方法在有效性和計算效率方面加以分析比較並最佳化。具體研究內容包括:(1)建立快速有效的海量複雜時空數據概化機制;(2)高性能的概化粗糙模糊聚類算法及實例驗證;(3)時空聚類的有效性評價及模式分析。本項目的研究成果可拓展套用於城市公共安全應急管理平台中。結題摘要 海量複雜的時空...