《機器學習技術與實戰:醫學大數據深度套用》是2018年5月1日機械工業出版社出版的圖書,作者是[加] Hong Song Lin( 洪松林) 。
基本介紹
- 書名:機器學習技術與實戰:醫學大數據深度套用
- 作者:[加] Hong Song Lin( 洪松林)
- 出版社:機械工業出版社
- ISBN:9787111595991
內容簡介,圖書目錄,
內容簡介
本書作者曾在北美多家智慧型專業公司任高級架構師,有20年數據挖掘、機器學疊照才簽習方面的設計、開發、管理經驗。他結合自己多年的行業經歷,總結了自己在機器學習方面的知識和實際工程中的經驗,提供了大量一線資料。本書不僅介紹了機器學習中的常用算法,而且給出了具體實施環境和經驗總結。重點介紹了相關算法,包括:相關因子算法、聚類算法、分類算法、回歸與測試算法等。不僅列舉了詳細示例,還介紹了算法在工程實踐中的具體套用,特別是總結了自己獨特的一些算法,例如矢量相關的因子選擇算法、秩和相關因子選擇算法、密度分布聚類算法、機率特徵模型算閥只遙危法等。重點剖析了醫藥學領域的套用。
圖書目錄
CONTENTS
目 錄
前言
第1章 機器學習基礎1
1.1 認識機器學習1
1.1.1 機器學習概念1
1.1.2 機器學習與生活4
1.1.3 機器學習與知識6
1.2 機器學習套用基礎6
1.2.1 事物與維度7
1.2.2 分布與關係9
1.2.3 描繪與預測12
1.2.4 現象與知識13
1.2.5 規律與因果13
1.3 機器學習套用系統14
1.3.1 數據層14
1.3.2 算法講您記層18
1.3.3 套用層23
1.3.4 經驗積累與套用26
1.4 無限三維嵌套空間假說26
1.4.1 一維空間26
1.4.2 二維空間26
1.4.3 三維空間27
1.4.4 突破三維空間27
1.4.5 五維空間28
1.4.6 六維空間29
1.5 分數維度空間30
1.5.1 分數維度30
1.5.2 自相似性31
1.5.3 無限疊代32
1.6 不確定論33
1.7 本章小結34
第2章 數據探索35
2.1 數據關係探索36
2.1.1 業務發現36
2.1.2 關係發現38
2.1.3 數據質量探索38
2.1.4 數據整合42
2.2 數據特徵探索43
2.2.1 數據的統計學特徵43
2.2.2 統計學特徵套用50
2.2.3 變數相關性探索53
2.3 數據選擇56
2.3.1 適當的數據規模57
2.3.2 數據的代表性57
2.3.3 數據的選取59
2.4 數據處迎淋理61
2.4.1 數據標準化62
2.4.2 數霸婚想據離散化63
2.5 本章小結64
第3章 機器學習技術65
3.1 聚類分析65
3.1.1 劃分聚類(K均值)66
3.1.2 層次聚類(組平均)70
3.1.3 密度聚類75
3.2 特性選擇76
3.2.1 特性選擇概念76
3.2.2 線性相關80
3.2.3 相關因子SRCF82
3.3 特徵抽取91
3.3.1 主成分分析91
3.3.2 因子分析93
3.3.3 非負矩陣因子分解94
3.4 關聯規則95
3.4.1 關聯規則概念95
3.4.2 Apriori算法96
3.4.3 FP樹頻集97
3.4.4 提升(Lift)97
3.5 分類和預測98
3.5.1 支持向量機98
3.5.2 Logistic回歸102
3.5.3 樸素貝葉斯分類106
3.5.4 決策樹112
3.5.5 人工神經網路116
3.5.6 分類與聚類的關係119
3.6 時間序列120
3.6.1 灰色系統預測模型120
3.6.2 ARIMA模型預測126
3.7 深度學習127
3.7.1 圖像深度學習:卷積神經網路127
3.7.2 自然語言深度學習:循環神經網路141
3.8 本章小結145
第4章 機器學習套用案例146
4.1 特性選擇的套用146
4.1.1 數據整合146
4.1.2 數據描繪147
4.1.3 數據標準化148
4.1.4 特性選擇探索148
4.2 分類模型的套用——算法比較154
4.2.1 數據整合154
4.2.2 數據描繪155
4.2.3 數據標準化156
4.2.4 特性選擇探索156
4.2.5 分類模型160
4.3 算法的綜合套用——腫道她凳瘤標誌物的研究161
4.3.1 樣本選取161
4.3.2 癌胚抗原臨床特徵主題分析165
4.3.3 癌胚抗原臨床特徵規則分析169
4.3.4 癌胚抗原臨床特徵規則的比較分析173
4.3.5 癌胚抗原相關因子分析174
4.3.6 不同等級癌胚抗原組差異分析177
4.4 本章小結180
第5章 機器學習套用系統開發181
5.1 IMRS的設計思路181
5.1.1 IMRS核心功能設計182
5.1.2 IMRS主要功能184
5.1.3 IMRS的模組設計和套用實現185
5.1.4 IMRS的評估方法194
5.2 機器學習應估挨笑用系統:IMRS技術設計199
5.2.1 對數據源的分析200
5.2.2 IMRS的總體設計203
5.3 IMRS異常偵測模型的開發210
5.3.1 異常偵測模型的功能展示211
5.3.2 技術開發要點214
5.4 IMRS特徵抽取模型的開發221
5.4.1 特徵抽取模型的功能展示221
5.4.2 技術開發要點221
5.5 IMRS的算法開發232
5.5.1 相關因子算法SRCF的實現232
5.5.2 樸素貝葉斯分類算法的實現237
5.6 本章小結241
第6章 機器學習系統套用(一):結構數據挖掘242
6.1 分布探索243
6.1.1 兩維度聚類模型套用243
6.1.2 高維度聚類模型套用248
6.2 關係探索249
6.2.1 關聯規則的套用249
6.2.2 特性選擇的套用252
6.3 特徵探索257
6.3.1 不穩定心絞痛的特徵總結258
6.3.2 動脈硬化性心臟病的臨床特徵262
6.4 異常探索264
6.4.1 生理指標的異常偵測264
6.4.2 異常偵測模型的比較267
6.5 推測探索268
6.6 套用系統的高級套用269
6.6.1 異常偵測的高級用法270
6.6.2 關聯規則的高級套用274
6.7 本章小結278
第7章 機器學習系統套用(二):非結構數據挖掘280
7.1 文本挖掘技術280
7.1.1 文本分詞算法280
7.1.2 文本相似性算法283
7.1.3 文本聚類算法287
7.1.4 文本分類算法290
7.2 文本數據挖掘在醫學上的套用293
7.2.1 醫學自然文本挖掘的套用293
7.2.2 醫學自然文本挖掘的方法294
7.2.3 醫學自然文本挖掘的相關技術295
7.2.4 醫學自然文本挖掘系統的實現295
7.3 文本分詞的實現296
7.3.1 專業語料庫與分詞算法的結合297
7.3.2 專業分詞庫的自完善297
7.4 文本智慧型搜尋298
7.4.1 文本相似性搜尋298
7.4.2 文本相關性搜尋299
7.5 文本聚類與分類的套用299
7.5.1 文本聚類套用300
7.5.2 文本分類套用302
7.6 文本主題提取套用303
7.7 本章小結305
第8章 基於機器學習的人工智慧套用306
8.1 基於大數據和機器學習的人工智慧306
8.1.1 廣義大數據306
8.1.2 人工智慧307
8.1.3 基於大數據的人工智慧套用308
8.1.4 基於小數據的人工智慧套用311
8.2 人工智慧的套用:智慧型醫學診斷系統314
8.2.1 智慧型診斷推理機314
8.2.2 臨床智慧型診斷的實現319
8.2.3 臨床智慧型診斷的套用321
8.2.4 臨床智慧型診斷的驗證:基於群體特徵的個案臨床評估323
8.3 混沌人工智慧325
8.3.1 混沌理論325
8.3.2 人類大腦的混沌性327
8.3.3 大腦混沌性的套用328
8.3.4 人工智慧大腦展望332
8.4 本章小結333
3.2.2 線性相關80
3.2.3 相關因子SRCF82
3.3 特徵抽取91
3.3.1 主成分分析91
3.3.2 因子分析93
3.3.3 非負矩陣因子分解94
3.4 關聯規則95
3.4.1 關聯規則概念95
3.4.2 Apriori算法96
3.4.3 FP樹頻集97
3.4.4 提升(Lift)97
3.5 分類和預測98
3.5.1 支持向量機98
3.5.2 Logistic回歸102
3.5.3 樸素貝葉斯分類106
3.5.4 決策樹112
3.5.5 人工神經網路116
3.5.6 分類與聚類的關係119
3.6 時間序列120
3.6.1 灰色系統預測模型120
3.6.2 ARIMA模型預測126
3.7 深度學習127
3.7.1 圖像深度學習:卷積神經網路127
3.7.2 自然語言深度學習:循環神經網路141
3.8 本章小結145
第4章 機器學習套用案例146
4.1 特性選擇的套用146
4.1.1 數據整合146
4.1.2 數據描繪147
4.1.3 數據標準化148
4.1.4 特性選擇探索148
4.2 分類模型的套用——算法比較154
4.2.1 數據整合154
4.2.2 數據描繪155
4.2.3 數據標準化156
4.2.4 特性選擇探索156
4.2.5 分類模型160
4.3 算法的綜合套用——腫瘤標誌物的研究161
4.3.1 樣本選取161
4.3.2 癌胚抗原臨床特徵主題分析165
4.3.3 癌胚抗原臨床特徵規則分析169
4.3.4 癌胚抗原臨床特徵規則的比較分析173
4.3.5 癌胚抗原相關因子分析174
4.3.6 不同等級癌胚抗原組差異分析177
4.4 本章小結180
第5章 機器學習套用系統開發181
5.1 IMRS的設計思路181
5.1.1 IMRS核心功能設計182
5.1.2 IMRS主要功能184
5.1.3 IMRS的模組設計和套用實現185
5.1.4 IMRS的評估方法194
5.2 機器學習套用系統:IMRS技術設計199
5.2.1 對數據源的分析200
5.2.2 IMRS的總體設計203
5.3 IMRS異常偵測模型的開發210
5.3.1 異常偵測模型的功能展示211
5.3.2 技術開發要點214
5.4 IMRS特徵抽取模型的開發221
5.4.1 特徵抽取模型的功能展示221
5.4.2 技術開發要點221
5.5 IMRS的算法開發232
5.5.1 相關因子算法SRCF的實現232
5.5.2 樸素貝葉斯分類算法的實現237
5.6 本章小結241
第6章 機器學習系統套用(一):結構數據挖掘242
6.1 分布探索243
6.1.1 兩維度聚類模型套用243
6.1.2 高維度聚類模型套用248
6.2 關係探索249
6.2.1 關聯規則的套用249
6.2.2 特性選擇的套用252
6.3 特徵探索257
6.3.1 不穩定心絞痛的特徵總結258
6.3.2 動脈硬化性心臟病的臨床特徵262
6.4 異常探索264
6.4.1 生理指標的異常偵測264
6.4.2 異常偵測模型的比較267
6.5 推測探索268
6.6 套用系統的高級套用269
6.6.1 異常偵測的高級用法270
6.6.2 關聯規則的高級套用274
6.7 本章小結278
第7章 機器學習系統套用(二):非結構數據挖掘280
7.1 文本挖掘技術280
7.1.1 文本分詞算法280
7.1.2 文本相似性算法283
7.1.3 文本聚類算法287
7.1.4 文本分類算法290
7.2 文本數據挖掘在醫學上的套用293
7.2.1 醫學自然文本挖掘的套用293
7.2.2 醫學自然文本挖掘的方法294
7.2.3 醫學自然文本挖掘的相關技術295
7.2.4 醫學自然文本挖掘系統的實現295
7.3 文本分詞的實現296
7.3.1 專業語料庫與分詞算法的結合297
7.3.2 專業分詞庫的自完善297
7.4 文本智慧型搜尋298
7.4.1 文本相似性搜尋298
7.4.2 文本相關性搜尋299
7.5 文本聚類與分類的套用299
7.5.1 文本聚類套用300
7.5.2 文本分類套用302
7.6 文本主題提取套用303
7.7 本章小結305
第8章 基於機器學習的人工智慧套用306
8.1 基於大數據和機器學習的人工智慧306
8.1.1 廣義大數據306
8.1.2 人工智慧307
8.1.3 基於大數據的人工智慧套用308
8.1.4 基於小數據的人工智慧套用311
8.2 人工智慧的套用:智慧型醫學診斷系統314
8.2.1 智慧型診斷推理機314
8.2.2 臨床智慧型診斷的實現319
8.2.3 臨床智慧型診斷的套用321
8.2.4 臨床智慧型診斷的驗證:基於群體特徵的個案臨床評估323
8.3 混沌人工智慧325
8.3.1 混沌理論325
8.3.2 人類大腦的混沌性327
8.3.3 大腦混沌性的套用328
8.3.4 人工智慧大腦展望332
8.4 本章小結333