《MATLAB數據探索性分析(原書第2版)》是2018年9月1日由清華大學出版社出版的圖書。作者為(美) 溫迪·L.馬丁內茲 (Wendy L. Martinez) (美) 安吉爾·R. 馬丁內茲(Angel R. Martinez) (美) 傑弗瑞·L. 索。
基本介紹
- 書名:MATLAB數據探索性分析(原書第2版)
- 作者:溫迪·L.馬丁內茲、安吉爾·R.馬丁內茲、傑弗瑞·L. 索
- ISBN:9787302474999
- 定價:79元
- 出版社:清華大學出版社
- 出版時間:2018.09.01
內容簡介,圖書目錄,譯者序Ⅰ,第2版前言Ⅲ,第1版前言Ⅴ,第一部分探索性數據分析綜述,第二部分模式發現的EDA方法,
內容簡介
本書系統介紹了基於MATLAB語言的探索性數據分析與實現方法。本書共分10章,從實際數據集與探索性數據分析的基本概念講起,內容涉及數據模式的發現、線性與非線性降維方法、數據巡查方法、聚類分析,以及用於探索性數據分析的數據可視化方法。除了基本分析與實現方法,書中也給出了豐富的套用實例,並提供了大量免費的相關資源,全部實例代碼都可以直接用於探索性數據分析。
圖書目錄
譯者序Ⅰ
第2版前言Ⅲ
第1版前言Ⅴ
第一部分探索性數據分析綜述
第1章緒論
1.1何為探索性數據分析
1.2全文概述
1.3關於符號表示法
1.4本書使用的數據集
1.4.1非結構化文本文檔
1.4.2基因表達數據
1.4.3Oronsay數據集
1.4.4軟體檢測
1.5數據變換
1.5.1冪變換
1.5.2標準化
1.5.3數據球面化
1.6深入閱讀
練習
第二部分模式發現的EDA方法
第2章降維——線性方法
2.1簡介
2.2主成分分析——PCA
2.2.1基於樣本協方差矩陣的PCA
2.2.2基於樣本相關矩陣的PCA
2.2.3應該保留多少個維度
2.3奇異值分解——SVD
2.4非負矩陣分解
2.5因子分析
2.6Fisher線性判別
2.7本徵維數
2.7.1最近鄰法
2.7.2關聯維數
2.7.3最大似然法
2.7.4包數估計
2.8總結與深入閱讀
練習
第3章降維——非線性方法
3.1多維尺度分析——MDS
3.1.1度量MDS
3.1.2非度量MDS
3.2流形學習
3.2.1局部線性嵌入
3.2.2等距特徵映射——ISOMAP
3.2.3海賽特徵映射
3.3人工神經網路方法
3.3.1自組織映射
3.3.2生成式拓撲映射
3.3.3曲元分析
3.4總結與深入閱讀
練習
第4章數據巡查
4.1總體巡查法
4.1.1TorusWinding法
4.1.2偽總體巡查法
4.2插值巡查法
4.3投影追蹤法
4.4投影追蹤索引
4.4.1Posse卡方索引
4.4.2矩索引
4.5獨立成分分析
4.6總結與深入閱讀
練習
第5章發現類
5.1簡介
5.2層次聚類法
5.3最佳化方法——k均值聚類
5.4譜聚類
5.5文本聚類
5.5.1非負矩陣分解——回顧
5.5.2機率潛在語義分析
5.6聚類評估
5.6.1Rand索引
5.6.2同型相關
5.6.3上尾法
5.6.4輪廓圖
5.6.5間隙統計
5.7總結與深入閱讀
練習
第6章基於模型的聚類
6.1基於模型的聚類方法概述
6.2有限混合模型
6.2.1多元有限混合模型
6.2.2分量模型——協方差矩陣約束
6.3最大期望算法
6.4基於模型的層次聚合聚類
6.5基於模型的聚類
6.6基於模型聚類的密度估計和判決分析
6.6.1模式識別介紹
6.6.2貝葉斯決策理論
6.6.3基於模型聚類的機率密度估計
6.7由混合模型生成隨機數據
6.8總結與深入閱讀
練習
第7章平滑散點圖
7.1簡介
7.2loess
7.3魯棒loess擬合
7.4loess殘差分析與診斷
7.4.1殘差圖
7.4.2散布平滑
7.4.3loess包絡——向上和向下平滑
7.5平滑樣條及套用
7.5.1樣條回歸
7.5.2平滑樣條
7.5.3均勻間隔數據的平滑樣條
7.6選擇平滑參數
7.7二元分布平滑
7.7.1中間平滑對
7.7.2極平滑
7.8曲線擬合工具箱
7.9總結與深入閱讀
練習
第三部分EDA的圖形方法
第8章聚類可視化
8.1樹狀圖
8.2樹圖
8.3矩形圖
8.4ReClus圖
8.5數據圖像
8.6總結與深入閱讀
練習
第9章分布圖形
9.1直方圖
9.1.1一元直方圖
9.1.2二元直方圖
9.2箱線圖
9.2.1基本箱線圖
9.2.2基本箱線圖的變形
9.3分位數圖
9.3.1機率圖
9.3.2qq圖
9.3.3分位數圖
9.4袋狀圖
9.5測距儀箱線圖
9.6總結與深入閱讀
練習
第10章多元可視化
10.1象形圖
10.2散點圖
10.2.12D和3D散點圖
10.2.2散點圖矩陣
10.2.3六邊形分組散點圖
10.3動態圖
10.3.1識別數據
10.3.2關聯
10.3.3筆刷
10.4協同圖
10.5點陣圖
10.5.1基本點陣圖
10.5.2多路點陣圖
10.6繪點為線
10.6.1平行坐標圖
10.6.2安德魯曲線
10.6.3安德魯圖像
10.6.4其他繪圖矩陣
10.7再看數據巡查
10.7.1總體巡查
10.7.2組合巡查
10.8雙標圖
10.9總結與深入閱讀
練習
附錄A近似度量
A.1定義
A.1.1相異性
A.1.2相似性度量
A.1.3二值數據的相似性度量
A.1.4機率密度函式的相異性
A.2變換
A.3進階閱讀
附錄BEDA相關軟體資源
B.1MATLAB程式
B.2其他EDA程式
B.3EDA工具箱
附錄C數據集的描述
附錄DMATLAB工具使用要點
D.1MATLAB簡介
D.2在MATLAB中獲得幫助
D.3檔案和工作空間管理
D.4MATLAB的標點符號
D.5算術運算符
D.6MATLAB的數據結構
D.6.1基本數據結構
D.6.2構建數組
D.6.3元胞數組
D.6.4結構體
D.7腳本檔案與函式
D.8控制流
D.8.1for循環
D.8.2while循環
D.8.3條件分支語句
D.8.4開關語句
D.9基本繪圖
D.10如何獲取MATLAB信息
附錄EMATLAB函式
E.1MATLAB
E.2統計工具箱
E.3EDA工具箱
E.4EDA圖形界面工具箱
參考文獻