內容簡介
本書系統介紹了基於MATLAB語言的探索性數據分析與實現方法。本書共分10章,從實際數據集與探索性數據分析的基本概念講起,內容涉及數據模式的發現、線性與非線性降維方法、數據巡查方法、聚類分析,以及用於探索性數據分析的數據可視化方法。除了基本分析與實現方法,書中也給出了豐富的套用實例,並提供了大量免費的相關資源,全部實例代碼都可以直接用於探索性數據分析。
圖書目錄
第一部分探索性數據分析綜述
第1章緒論
1.1何為探索性數據分析
1.2全文概述
1.3關於符號表示法
1.4本書使用的數據集
1.4.1非結構化文本文檔
1.4.2基因表達數據
1.4.3Oronsay數據集
1.4.4軟體檢測
1.5數據變換
1.5.1冪變換
1.5.2標準化
1.5.3數據球面化
1.6深入閱讀
練習
第二部分模式發現的EDA方法
第2章降維——線性方法
2.1簡介
2.2主成分分析——PCA
2.2.1基於樣本協方差矩陣的PCA
2.2.2基於樣本相關矩陣的PCA
2.2.3應該保留多少個維度
2.3奇異值分解——SVD
2.4非負矩陣分解
2.5因子分析
2.6Fisher線性判別
2.7本徵維數
2.7.1最近鄰法
2.7.2關聯維數
2.7.3最大似然法
2.7.4包數估計
2.8總結與深入閱讀
練習
第3章降維——非線性方法
3.1多維尺度分析——MDS
3.1.1度量MDS
3.1.2非度量MDS
3.2流形學習
3.2.1局部線性嵌入
3.2.2等距特徵映射——ISOMAP
3.2.3海賽特徵映射
3.3人工神經網路方法
3.3.1自組織映射
3.3.2生成式拓撲映射
3.3.3曲元分析
3.4總結與深入閱讀
練習
第4章數據巡查
4.1總體巡查法
4.1.1TorusWinding法
4.1.2偽總體巡查法
4.2插值巡查法
4.3投影追蹤法