自動聚類是一種典型的無監督機器學習(無監督學習)方法。聚類試圖將數據集中的樣本劃分為若干個通常不相交的子集,每個子集稱為一個簇,通過這樣的劃分,每一個簇可能對應一些潛在的概念(類別)。
需說明的是,概念對於聚類算法而言事先是未知的,聚類過程僅能自動形成簇結構,簇所對應的概念語義需由使用者來把握和命名。
基本介紹
- 中文名:自動聚類
- 外文名:Automatic Clustering
- 學科:機器學習
- 基本釋義:將數據集劃分為若干個不相交子集
- 分為:原型聚類;密度聚類;層次聚類
- 套用:人工智慧
自動聚類是一種典型的無監督機器學習(無監督學習)方法。聚類試圖將數據集中的樣本劃分為若干個通常不相交的子集,每個子集稱為一個簇,通過這樣的劃分,每一個簇可能對應一些潛在的概念(類別)。
需說明的是,概念對於聚類算法而言事先是未知的,聚類過程僅能自動形成簇結構,簇所對應的概念語義需由使用者來把握和命名。
自動聚類是一種典型的無監督機器學習(無監督學習)方法。聚類試圖將數據集中的樣本劃分為若干個通常不相交的子集,每個子集稱為一個簇,通過這樣的劃分,每一個簇...
聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。聚類分析的目標就是在相似的基礎上收集數據來分類。聚類...
將物理或抽象對象的集合分成由類似的對象組成的多個類的過程被稱為聚類。由聚類所生成的簇是一組數據對象的集合,這些對象與同一個簇中的對象彼此相似,與其他簇中...
聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種統計分析方法,同時也是數據挖掘的一個重要算法。聚類(Cluster)分析是由若干模式(Pattern)組成的,通常,模式...
自動聚類由計算機系統按照被考察對象的內部或外部特徵,根據一定的要求(如類別的數量限制,同類對象的親近程度等等),將相近、相似或相同特徵的對象聚合在一起的過程。...
文本聚類(Text clustering)文檔聚類主要是依據著名的聚類假設:同類的文檔相似度較大,而不同類的文檔相似度較小。作為一種無監督的機器學習方法,聚類由於不需要訓練...
所謂數據聚類是指根據數據的內在性質將數據分成一些聚合類,每一聚合類中的元素儘可能具有相同的特性,不同聚合類之間的特性差別儘可能大。聚類分析的目的是分析數據...
譜聚類算法建立在譜圖理論基礎上,與傳統的聚類算法相比,它具有能在任意形狀的樣本空間上聚類且收斂於全局最優解的優點。該算法首先根據給定的樣本數據集定義一個...
數據挖掘的算法之一,通過統計學的聚類分析方法進行數據挖掘。...... 學習相比,分類學習的例子或數據對象有類別標記,而要聚類的例子沒有標記,需要有聚類學習算法來自...
實現大數據的並行搜尋聚類,進行語義本體模型構建,為離群點新建一個簇,依次對每個文檔的主題詞集進行處理,將每個主題詞自動添加入形式背景的屬性集中,採用並行搜尋...
半監督聚類是近幾年機器學習領域的一個新的研究方向, 也是數據挖掘的一個重要分支,逐步成為許多領域的有用工具。...
模式識別(Pattern recognition),就是通過計算機用數學技術方法來研究模式的自動處理和判讀。自動模式識別是指無需依靠運行人員人為觀察與分析把具體的樣本歸類到某一個...
聚類檢索是在對文獻進行自動標引的基礎上,構造文獻的形式化表示——文獻向量,然後通過一定的聚類方法,計算出文獻與文獻之間的相似度,並把相似度較高的文獻集中在一...
把模糊數學方法引入聚類分析即產生了模糊聚類分析方法。模糊聚類分析方法大致可分為兩種:一是基於模糊關係上的模糊聚類法.並稱為系統聚類分析法。另一種稱為非系統...
(自動化專家)編輯 鎖定 陳宗海,男,教授,博士生導師,1963 年12 月生。...32、基於量子模距離的量子態聚類識別 , 量子光學學報 ,Vol.9(4),2003:144-...
《基於聚類的金融時間序列數據挖掘方法研究》探討了譜聚類的理論、模型、算法及其在金融時間序列數據挖掘中的套用。以矩陣擾動理論為工具證明了多路歸一化割譜聚類方法...
模糊c-均值聚類算法 fuzzy c-means algorithm (FCMA)或稱( FCM)。在眾多模糊聚類算法中,模糊C-均值( FCM) 算法套用最廣泛且較成功,它通過最佳化目標函式得到每個...
《自動目標識別效果評估技術》是2006年國防工業出版社出版的圖書,作者是莊釗文。本書在對自動目標識別效果評估深入研究的基礎上,力求給出客觀的、定量化的、系統的...
K-means算法是硬聚類算法,是典型的基於原型的目標函式聚類方法的代表,它是數據點到原型的某種距離作為最佳化的目標函式,利用函式求極值的方法得到疊代運算的調整規則。...