《數據聚類》是2017年科學出版社出版的圖書,作者是張憲超。
基本介紹
- 書名:數據聚類
- 作者:張憲超
- 出版社:科學出版社
- ISBN:9787030528469
內容簡介
圖書目錄
- 序
- 前言
- 符號表
- 1概述
- 2基於模型的聚類
- 3基於劃分的聚類算法
- 4基於密度的聚類算法
- 5基於格線的聚類算法
- 6層次聚類算法
- 7半監督聚類
- 8譜聚類
- 9基於非負矩陣分解的聚類
- 10高維數據聚類
- 11圖聚類
- 12不確定數據聚類
- 13多源相關數據聚類
- 後記
- 彩版
《數據聚類》是2017年科學出版社出版的圖書,作者是張憲超。
所謂數據聚類是指根據數據的內在性質將數據分成一些聚合類,每一聚合類中的元素儘可能具有相同的特性,不同聚合類之間的特性差別儘可能大。聚類分析的目的是分析數據是否屬於各個獨立的分組,使一組中的成員彼此相似,而與其他組中的成員...
由聚類所生成的簇是一組數據對象的集合,這些對象與同一個簇中的對象彼此相似,與其他簇中的對象相異。“物以類聚,人以群分”,在自然科學和社會科學中,存在著大量的分類問題。聚類分析又稱群分析,它是研究(樣品或指標)分類問題...
聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。聚類分析的目標就是在相似的基礎上收集數據來分類。聚類源於很多領域,包括數學,計算機科學,統計學,生物學和經濟學。在不同的套用...
《數據聚類》是2017年科學出版社出版的圖書,作者是張憲超。內容簡介 聚類是數據挖掘領域的一個重要分支。本書全面系統地介紹聚類的主要方法。首先,對涉及聚類的各個方面進行簡略的綜述;然後,對各類聚類算法進行較詳細的討論。本書主要...
《基於約束的高維數據聚類》是依託大連理工大學,由張憲超擔任項目負責人的面上項目。項目摘要 聚類是數據挖掘的基本內容,它幫助發現數據的自然結構,在很多領域起重要作用。近年來產生的大量高維數據給傳統聚類算法帶來被稱為維度災難的巨大...
聚類是一個將數據集中在某些方面相似的數據成員進行分類組織的過程,聚類就是一種發現這種內在結構的技術,聚類技術經常被稱為無監督學習。k均值聚類是最著名的劃分聚類算法,由於簡潔和效率使得他成為所有聚類算法中最廣泛使用的。給定一個...
《EM聚類分析法在大數據時代的套用》是2021年發布的論文。在大數據的時代背景下,各行各業的數據信息在套用和共享上都有著極大的便利,所以對數據的處理和分析手段顯得尤為重要。大數據具有數據量龐大、分析效率低下、非結構化等特點,由於...
具體包括:(1)研究多特徵協同的層次聚類及特徵缺失條件下的多特徵協同層次聚類;(2)研究特徵-結構協同的層次聚類,有效利用多種特徵和多種結構並存的複雜多視角信息;(3)研究多視角協同維度約減方法及多視角協同採樣方法,對原始數...
聚類是指利用計算機根據樣本之間的相似度將整個樣本集合聚集成若干個類的過程。其目標是使得屬於同一個類的樣本儘量相似,而屬於不同類的樣本差別明顯。系統聚類法和k-Means算法是目前聚類分析中套用最多的兩種方法。分類(這裡僅指自動...
增廣鏈修復下大數據並行搜尋聚類算法 背景 數據聚類在工程設計、計算機網路及信息處理、機械故障診斷、雷達目標識別、資料庫建立、人工智慧等許多領域具有廣泛的套用前景。通過設計有效的聚類算法,通過計算機軟體處理,對數據和信息進行聚類處理...
隨著信息技術的快速發展,越來越多的數據以流數據的形式存在,並往往呈現多源異構性。現有流數據聚類算法多適用於常規單源流數據,對於多源異構流數據的聚類研究還非常匱乏。本項目擬以聚類集成與流數據聚類為切入點,研究面向多源異構流數據...
《高維數據聚類信息核保存與隱藏技術研究》是依託東南大學,由倪巍偉擔任項目負責人的青年科學基金項目。中文摘要 數據隱藏發布中聚類可用性的維持在高維及數據動態更新環境下尤為困難:(1)聚類對數據個體差異的依賴與隱藏操作弱化個體差異的...
《關聯數據聚類——模型、算法及套用》是2015年7月科學出版社出版的圖書,作者是(美)龍波(Bo Long)。內容簡介 該書是當前國際新興的熱門研究領域-關係數據挖掘-的首部有關關係數據聚類的奠基性專著。該書通過深入淺出的方法,系統地...
基本思想:假設整個數據集服從高斯混合分布,待聚類的數據點看成是分布的採樣點,通過採樣點利用類似極大似然估計的方法估計高斯分布的參數。求出參數即得出了數據點對分類的隸屬函式。密度聚類 密度聚類亦稱為“基於密度的聚類”,此類算法...
《面板數據聚類的複合方法與套用》是2016年8月對外經濟貿易出版出版的書籍,作者是楊 娟、謝遠濤。內容簡介 本書的研究目的是,提出適用於不同聚類目的的面板數據聚類方法。本書提出了三種面板數據聚類的方法,分別對應不同的聚類目的。基...
第5章 基於疊代重聚類的基因表達數據聚類算法 5.1 研究現狀及存在的問題 5.2 相關工作 5.2.1 基因表達矩陣 5.2.2 數據預處理 5.2.3 數據標準化 5.2.4 相似性度量 5.3 CRADLE聚類算法 5.3.1 基本定義 5.3...
表12-1310名運動員的三項測試數據 操作方法分為以下幾步:(1)首先定義變數、輸人數據。建立聚類工作數據檔案,也稱聚類分析的輸入數據檔案。(2)按Analyze、Classify、K-Meanscluster順序逐一單擊滑鼠鍵,最後展開對話框,如圖1所示。(...
《高維數據聚類的數學模型及在反垃圾郵件中的套用》是依託廈門大學,由姜青山擔任項目負責人的面上項目。項目摘要 研究高維數據的聚類問題是十分重要的前沿和熱點課題,其套用前景極其廣泛。本項目主要是通過構建高維數據聚類的具有一定通用性...
將物理或抽象對象的集合分組稱為由類似的對象組成的多個類的過程被稱為聚類。高維聚類分析與傳統聚類分析的最主要差別就是高維度。高維數據聚類是聚類技術的難點和重點。詳細內容 目前,聚類分析的研究集中在聚類方法的可伸縮性、對複雜形狀...
《基於非顯式隱私保護的大規模高維數據聚類方法研究》是依託哈爾濱工業大學,由張曉峰擔任項目負責人的面上項目。項目摘要 隨著人們的隱私保護意識的提升,如何在實現隱私保護的前提下,對大規模高維度數據進行準確的聚類分析,已經成為數據...
《面向地理標籤數據的高效聚類算法研究》是依託同濟大學,由趙欽佩擔任項目負責人的青年科學基金項目。中文摘要 隨著GPS設備和通訊技術的發展,日常生活中出現了大量的地理標籤數據。聚類分析是用以挖掘這類數據中所包含信息的一個有用的工具...
本書共分為7章,包括GPS位置數據聚類模型和智慧型最佳化的關鍵技術,GPS位置數據的遺傳、模糊粒子-遺傳融合、遺傳-模糊蟻群混合自動聚類模型與算法,基於MapReduce的GPS位置數據遺傳自動聚類模型與算法,基於小二乘非監督GPS軌跡回歸模型與算法,...
《基於高維數據聚類的算法交易策略若干關鍵問題研究》是依託武漢大學,由王峰擔任項目負責人的青年科學基金項目。項目摘要 算法交易是根據當前的市場信息、數據等分析推斷市場走勢,從而制定交易策略的一種新興交易手段。現有的算法交易模型及其...
本項目的研究面向大數據環境下的空間聚類方法展開,內容包括:(1)利用並行計算框架MapReduce,首次將現有聚類算法移植到分散式計算平台,以滿足空間大數據的科學計算需求,也為更大規模、更高維度的空間數據及時空數據聚類研究提供了基礎;(2)...
比如給定一 個由二維點組成的集合{(3,4),(2,6),(4,5)},那么: CF 結構概括了簇的基本信息,並且是高度壓縮的,它存儲了小於實際數據點的聚類信 息。[3]同時CF 的三元結構設定使得計算簇的半徑、簇的直徑、簇與簇之間的距離...
《動態數據挖掘中的演化聚類模型與算法研究》是依託大連理工大學,由郭崇慧擔任項目負責人的面上項目。項目摘要 近年來,各種聚類分析方法已經在數據挖掘領域中得到了較為深入的研究,但這些方法大多是針對關係資料庫中的靜態數據對象而提出的...
在現實世界中存在著大量的符號數據。由於符號數據缺乏固有的幾何特性,現有大量的數值數據聚類算法不能簡單地將套用於符號數據。如何為符號數據建立適合其自身的聚類模型受到越來越多的學者關注。本項目針對符號數據,就其聚類有效性及其聚類...
聚類是一個將數據集中在某些方面相似的數據成員進行分類組織的過程,聚類就是一種發現這種內在結構的技術,聚類技術經常被稱為無監督學習。1973年,Bezdek等人提出了FCM聚類算法,該方法用隸屬度確定每個數據點屬於某個聚類的程度,是作為...
PAM(Partitioning Around Medoid,圍繞中心點的劃分)是聚類分析算法中劃分法的一個聚類方法,是最早提出的k-中心點算法之一。算法簡介 如今數據挖掘的理論越來越廣泛的套用在商業、製造業、金融業、醫藥業、電信業等等許多領域。數據挖掘的...
此後不久,Michele又在文獻《Unsupervised and semi-supervised clustering by message passing:soft-constraint affinity propagation》中給出了一種半監督的軟約束AP算法,利用先驗信息指導AP聚類過程。這兩種算法雖然有效解決了環形數據聚類,...