地球科學中的大數據分析與挖掘算法手冊

《地球科學中的大數據分析與挖掘算法手冊》是2018年人民郵電出版社出版的圖書,作者是李國慶、劉瑩、龐祿申。

基本介紹

  • 中文名:地球科學中的大數據分析與挖掘算法手冊
  • 作者:李國慶,劉瑩,龐祿申
  • 類別:計算機/網路類圖書 
  • 出版社:人民郵電出版社
  • 出版時間:2018年8月
  • 開本:16 開
  • 裝幀:平裝-膠訂
  • ISBN:9787115478559
內容簡介,作者簡介,目 錄,

內容簡介

本書以數據分析與挖掘思想為主線,深入剖析關聯、分類、回歸、聚類、順序模式挖掘、深度學習以及異常檢測等算法的原理、實現、相似算法、改進思路以及地學案例,具有很強的系統性、完整性以及落地性,可以作為各行業特別是地球科學領域中希望駕馭大數據並發掘其價值的科研人員和工程人員的參考書,讀者既可以通過本書系統掌握大數據分析挖掘的思想方法,也可以將其作為算法工具書查閱。

作者簡介

李國慶
對地觀測和數字地球科學中心數據技術部主任。主要研究方向為高性能地學計算、網路化數據工程,承研項目40多項、在研項目6項,發表論文70多篇。IEEE和中國計算機學會的高級會員,中國計算機學會高性能計算專業委員會理事和中國軟體協會數學軟體分會理事。長期參與相關國際組織的工作,曾任國際對地觀測衛星委員會(CEOS)格線任務組主席和套用工作組副主席、現任國際數據系統(WDS)科學委員會委員、國際科學數據委員會(CODATA)“災害數據開放和互聯”工作組主席,同時擔任國際科聯(ICSU)中國專家委員會、國際災害風險集成研究計畫(IRDR)中國專家委員會、國家綜合地球觀測組織(GEO)中國專家委員會的主要成員。

目 錄

第 1章 關聯規則 001
1.1 Apriori算法 002
1.1.1 算法概要 002
1.1.2 算法原理 002
1.1.3 實例說明 004
1.1.4 算法優缺點 010
1.1.5 最佳化改進 010
1.1.6 大數據適應度分析 012
1.1.7 地球科學套用案例 013
1.2 FP-growth算法 015
1.2.1 算法概要 015
1.2.2 算法原理 015
1.2.3 實例說明 017
1.2.4 最佳化改進 019
1.2.5 大數據適應度分析 021
1.2.6 地球科學套用案例 024
參考文獻 026
第 2章 分類 027
2.1 決策樹算法 028
2.1.1 算法概要 028
2.1.2 算法原理 028
2.1.3 算法優缺點 031
2.1.4 最佳化改進 032
2.1.5 決策樹衍生算法 033
2.1.6 大數據適應度分析 035
2.1.7 地球科學套用案例 037
2.2 貝葉斯分類算法 038
2.2.1 算法概要 038
2.2.2 算法原理 038
2.2.3 實例說明 040
2.2.4 算法優缺點 042
2.2.5 最佳化改進 042
2.2.6 大數據適應度分析 045
2.2.7 地球科學套用案例 046
2.3 神經網路分類算法 047
2.3.1 算法概要 047
2.3.2 算法原理 047
2.3.3 算法優缺點 051
2.3.4 最佳化改進 052
2.3.5 大數據適應度分析 053
2.3.6 地球科學套用案例 053
2.4 粗糙集分類 055
2.4.1 算法概要 055
2.4.2 算法原理 055
2.4.3 實例說明 062
2.4.4 算法優缺點 064
2.4.5 最佳化改進 064
2.4.6 大數據適應度分析 065
2.4.7 地球科學套用案例 066
2.5 支持向量機 066
2.5.1 算法概要 066
2.5.2 算法原理 067
2.5.3 實例說明 073
2.5.4 算法優缺點 074
2.5.5 最佳化改進 074
2.5.6 大數據適應度分析 076
2.5.7 地球科學套用案例 077
2.6 K-近鄰算法 078
2.6.1 算法概要 078
2.6.2 算法原理 078
2.6.3 算法優缺點 080
2.6.4 最佳化改進 080
2.6.5 大數據適應度分析 082
2.6.6 地球科學套用案例 085
2.7 Bagging算法 086
2.7.1 算法概要 086
2.7.2 算法原理 087
2.7.3 實例說明 090
2.7.4 最佳化改進 093
2.7.5 大數據適應度分析 094
2.7.6 地球科學套用案例 095
2.8 AdaBoost算法 096
2.8.1 算法概要 096
2.8.2 算法原理 097
2.8.3 訓練過程 099
2.8.4 同類算法 100
2.8.5 大數據適應度分析 103
2.8.6 地球科學套用案例 103
參考文獻 105
第3章 回歸 115
3.1 線性回歸 116
3.1.1 算法概要 116
3.1.2 算法原理 116
3.1.3 實例說明 119
3.1.4 算法優缺點 120
3.1.5 最佳化改進 121
3.1.6 大數據適應度分析 123
3.1.7 地球科學套用案例 123
3.2 邏輯回歸 124
3.2.1 算法概要 124
3.2.2 算法原理 125
3.2.3 算法實現 127
3.2.4 SoftMax算法 129
3.2.5 大數據適應度分析 129
3.2.6 地球科學套用案例 130
參考文獻 131
第4章 聚類 133
4.1 K-means算法 134
4.1.1 算法概要 134
4.1.2 算法原理 134
4.1.3 實例說明 135
4.1.4 算法優缺點 138
4.1.5 最佳化改進 138
4.1.6 大數據適應度分析 140
4.1.7 地球科學套用案例 141
4.2 K-medoids算法 142
4.2.1 算法概要 142
4.2.2 算法原理 142
4.2.3 實例說明 144
4.2.4 算法優缺點 147
4.2.5 最佳化改進 148
4.2.6 大數據適應度分析 149
4.2.7 地球科學套用案例 149
4.3 層次聚類算法 151
4.3.1 算法概要 151
4.3.2 距離度量 151
4.3.3 算法流程 153
4.3.4 改進最佳化 154
4.3.5 大數據適應度分析 158
4.3.6 地球科學套用案例 159
4.4 基於密度的聚類算法 160
4.4.1 算法概要 160
4.4.2 算法原理 160
4.4.3 實例說明 162
4.4.4 算法優缺點 164
4.4.5 最佳化改進 165
4.4.6 大數據適應度分析 166
4.4.7 地球科學套用案例 167
4.5 基於格線的聚類算法 168
4.5.1 算法概要 168
4.5.2 STING 168
4.5.3 CLIQUE 170
4.5.4 最佳化改進 173
4.5.5 大數據適應度分析 176
4.5.6 地球科學套用案例 177
參考文獻 179
第5章 序列模式挖掘 183
5.1 GSP算法 184
5.1.1 算法概要 184
5.1.2 算法原理 184
5.1.3 實例說明 189
5.1.4 算法優缺點 191
5.1.5 GSP衍生算法 192
5.1.6 大數據適應度分析 194
5.1.7 地球科學套用案例 195
5.2 SPADE算法 196
5.2.1 算法概要 196
5.2.2 算法原理 197
5.2.3 實例說明 203
5.2.4 算法優缺點 206
5.2.5 最佳化改進 206
5.2.6 SPADE衍生算法 207
5.2.7 大數據適應度分析 209
5.2.8 地球科學套用案例 213
參考文獻 215
第6章 深度學習 217
6.1 深度信念網 218
6.1.1 算法概要 218
6.1.2 算法原理 219
6.1.3 最佳化改進 225
6.1.4 大數據適應度分析 226
6.1.5 地球科學套用案例 227
6.2 卷積神經網路 228
6.2.1 算法概要 228
6.2.2 算法原理 228
6.2.3 實例說明 229
6.2.4 模型演化 231
6.2.5 最佳化改進 234
6.2.6 大數據適應度分析 235
6.2.7 地球科學套用案例 235
6.3 自動編碼器算法 237
6.3.1 算法概要 237
6.3.2 算法原理 238
6.3.3 算法實現 240
6.3.4 衍生算法 241
6.3.5 最佳化改進 243
6.3.6 大數據適應度分析 244
6.3.7 地球科學套用案例 245
參考文獻 245
第7章 異常檢測 249
7.1 概述 250
7.2 基於統計的異常檢測算法 251
7.2.1 算法原理 251
7.2.2 典型算法 251
7.3 基於距離的方法 252
7.3.1 算法原理 252
7.3.2 典型算法 252
7.4 基於深度的異常檢測方法 256
7.4.1 算法原理 256
7.4.2 典型算法 257
7.5 基於密度的異常檢測算法 258
7.5.1 算法原理 258
7.5.2 典型算法 258
7.6 基於偏離的異常檢測算法 262
7.6.1 算法原理 262
7.6.2 典型算法 263
7.7 基於聚類的異常檢測算法 265
7.7.1 算法原理 265
7.7.2 典型算法 265
7.8 大數據適應度分析 268
7.9 地球科學套用案例 269
參考文獻 271
附錄A 軟體、源碼及開發包 275

相關詞條

熱門詞條

聯絡我們