《實用健康醫療數據科學精要》是2023年清華大學出版社出版的圖書,作者是弓凱。
基本介紹
- 中文名:實用健康醫療數據科學精要
- 作者:弓凱
- 出版時間:2023年12月1日
- 出版社:清華大學出版社
- ISBN:9787302647676
- 定價:298 元
內容簡介,圖書目錄,
內容簡介
本書分為道、術兩篇。道篇講述了數據科學與醫療全領域互動融合的底層邏輯,以及數據科學在醫療科、教、醫、研、管五個方面的角色和作用,建立適用於醫療人工智慧開發的ML-PICOS原則,並從建設角度,闡述了醫療大數據理、采、存、管、用的全過程。術篇普及了數據科學用於回歸、分類、聚類、關聯分析的基礎算法,以及他們在醫療領域套用的場景和邏輯。
圖書目錄
目 錄
第1章 醫學發展與數據科學 1
1.1 醫學認知的物質化、科學化和數據化 1
1.1.1 從神靈主義走出的醫學 1
1.1.2 醫學認知的物質化 2
1.1.3 醫學認知的科學化 4
1.1.4 醫學認知的數據化 6
1.2 數據化或是傳統醫學現代化的必經之路 8
1.2.1 現代醫學與傳統醫學的分歧 8
1.2.2 數據科學助力傳統醫學融入現代 8
1.3 以實踐和數據說話的循證醫學發展歷程 10
1.3.1 理解循證醫學 10
1.3.2 循證醫學證據體系建立的五個階段 11
1.4 基於PICOS原則把臨床語言轉變為數據語言 18
1.5 數據科學在循證醫學證據體系以外的套用 19
第2章 走進數據科學時代 23
2.1 大數據的由來、定義和特徵 23
2.1.1 大數據的由來和定義 23
2.1.2 大數據的nV特徵 24
2.1.3 走出數據以“大”論英雄的誤區 25
2.2 大數據發展的數據工程問題 27
2.2.1 硬體工程問題 27
2.2.2 軟體技術問題 28
2.3 大數據發展的數據科學問題 30
2.3.1 統計學的由來與發展 30
2.3.2 智慧型的內涵:知有所合謂之智,能有所合謂之能 31
2.3.3 人工智慧的起落與輝煌 32
2.3.4 發展人工智慧應堅守的造物觀:重己役物,致用利人 35
2.4 大數據驅動的數據科學生態變革 38
2.4.1 從統計學思維到套用型思維 38
2.4.2 數據科學生態促使數據從業者角色分化 40
2.5 大數據驅動的科學研究範式變革 42
2.5.1 科學革命的結構 42
2.5.2 第四範式與AI for science 43
2.6 大數據驅動的日常生活變革 46
2.7 數字經濟驅動數據要素價值變現 48
2.7.1 網際網路泡沫破碎後的數字經濟重建 48
2.7.2 理解數據要素化 49
2.7.3 數據變現的路徑 51
第3章 健康醫療大數據與人工智慧 54
3.1 健康醫療大數據的範圍 54
3.2 健康醫療大數據的行業特徵 55
3.2.1 醫療大數據的縱向和橫向孤島現象 55
3.2.2 健康醫療大數據的多模態性、疾病主題特異性和動態性 56
3.2.3 健康醫療大數據的主觀性和價值稀疏性 56
3.3 大數據驅動的人工智慧在醫療領域的套用與角色 59
3.3.1 人工智慧在醫療領域的套用 59
3.3.2 從效率工具角度看待醫療人工智慧 61
3.3.3 醫療AI開發中的困難與瓶頸 62
3.4 模型的透明性和可問責性是醫療人工智慧廣泛落地的基礎 64
第4章 健康醫療大數據讓循證醫學走進真實世界 67
4.1 以RCT為代表的理想世界研究的局限性 67
4.2 基於真實世界數據的真實世界研究 69
4.2.1 真實世界研究的定義 69
4.2.2 真實世界研究的證據等級體系 72
4.3 大數據時代下的真實世界人群佇列管理 74
第5章 基於真實世界數據的醫學統計 76
5.1 醫療業務的數據化 76
5.2 缺失值的識別和處理 78
5.3 真實世界研究數據分析要點概述 80
5.4 統計三件套:說一說、比一比、找關係 84
5.5 從暴露到結局的單變數關係是經典循證醫學研究的基本關注點 90
5.5.1 單變數之間的線性和廣義線性關係 90
5.5.2 單變數之間的線性趨勢關係和非線性關係 98
5.5.3 從辛普森悖論看為什麼研究單變數之間的關係同樣要做多因素分析 101
5.5.4 單變數間的相關關係和因果關係 104
5.6 單變數之間關係的論證邏輯結構 105
5.6.1 從定性到定量:單變數關係研究需要回答的四個問題 105
5.6.2 從一根槓桿看懂何為混雜和互動因素 106
5.6.3 混雜因素的識別和控制 108
5.6.4 互動因素的識別和控制 112
5.6.5 傾向性評分:控制多個混雜的神器 113
第6章 由統計推導結論到智慧型預測 119
6.1 從醫學統計到統計學習 119
6.1.1 從效用統計到結局預測 119
6.1.2 從人工智慧到機器學習 120
6.1.3 人工智慧中的損失和最佳化 123
6.2 臨床預測模型構建的基本思路 125
6.2.1 建模前工作 125
6.2.2 建模中工作 127
6.2.3 建模後工作 129
6.3 醫療機器學習的“PICOS” 140
第7章 統計學習的常見算法淺析 142
7.1 回歸分析中的多重共線性與Lasso回歸 142
7.1.1 多重共線性的影響和識別 142
7.1.2 Lasso回歸的原理 143
7.2 通俗好用的樹模型和集成算法 146
7.2.1 用於分類任務的決策樹構建 146
7.2.2 用於回歸任務的回歸樹和模型樹 151
7.2.3 群策群力的集成學習 152
7.3 人們日用而不自知的貝葉斯推理 155
7.3.1 初識貝葉斯定理 155
7.3.2 樸素貝葉斯算法 158
7.3.3 機率圖模型 159
7.4 基於距離的機器學習分類與聚類 161
7.4.1 K近鄰分類 162
7.4.2 聚類算法 163
7.5 數據降維的藝術 166
7.5.1 主成分分析 166
7.5.2 因子分析 174
7.6 支持向量機 178
7.6.1 AI界的水果忍者 178
7.6.2 SVM到底在最佳化什麼? 180
7.6.3 核技巧是使SVM真正強大起來的原因 183
7.7 挖掘數據共顯模式的關聯規則算法 185
7.7.1 驅動購物的關聯規則 185
7.7.2 Apriori算法 186
7.8 時間序列分析 188
第8章 開啟多模態學習的深度學習 201
8.1 人工神經網路與深度學習 201
8.1.1 人工神經網路與深度學習入門 201
8.1.2 神經網路在學習過程中,到底學到了什麼? 204
8.1.3 如何更準確地選擇損失函式下降的方向 208
8.2 卷積神經網路與機器視覺 211
8.2.1 卷積神經網路的直觀理解 211
8.2.2 卷積運算的數學解釋 214
8.2.3 計算機視覺和卷積神經網路的發展脈絡 217
8.2.4 醫學影像人工智慧 222
8.3 給AI植入想像力的對抗生成網路和擴散模型 227
8.3.1 對GAN原理的形象理解 227
8.3.2 GAN訓練過程的算法數學理解 228
8.3.3 GAN的其他集中花式玩法 230
8.3.4 擴散模型簡介 233
8.4 使AI學會策略的強化學習 235
8.4.1 理解決策過程 235
8.4.2 如何學習Q值? 236
8.4.3 理解整個策略學習過程 236
8.4.4 理解深度強化學習之DQN 238
8.5 循環神經網路與自然語言處理 240
8.5.1 對RNN的形象理解 240
8.5.2 對RNN的算法理解 241
8.6 基於深度學習的自然語言處理簡介 245
8.6.1 詞的向量表示 245
8.6.2 Encoder-Decoder和注意力機制 250
8.6.3 從transformer到ChatGPT 253
8.6.4 自然語言處理在醫學中的套用淺析 261
8.7 大模型驅動的AIGC通用人工智慧時代 263
8.7.1 AIGC緣起 263
8.7.2 大力出奇蹟:ChatGPT引爆了AIGC的奇點 264
8.7.3 大模型的解封咒語:提示工程 269
第9章 日常診療與數據科學 271
9.1 臨床推理中的雙重認知模式 271
9.2 醫療與數據科學的認知協同 275
9.3 人機決策與CDSS 278
9.4 醫療從業者學習數據科學的必要性和可行性 281
第10章 精準醫學與數據科學 284
10.1 精準醫學的由來 284
10.2 精準醫學與組學研究 285
10.3 以中心法則為主線開展的組學研究 286
10.4 中心法則之外,拓寬組學的邊界 291
10.5 始於差異,經由機制,終於臨床 293
第十一章 醫藥研發與數據科學 301
11.1 新藥研發概述 301
11.2 生物分子的化學表征與計算 302
11.3 基於不同分子表征的模型計算 304
第12章 轉化醫學與數據科學 307
12.1 轉化醫學的由來、階段和與數據科學的關係 307
12.2 樹立合理的醫學科技創新觀念和轉化動機 310
12.3 科技成果評價的主要方法和維度 314
12.4 醫學科技成果的轉化途徑與過程 325
12.5 醫學轉化案例之CRISPR-Cas9基因編輯技術 330
第13章 智慧健康醫療與數據科學 333
13.1 智慧健康醫療概述 333
13.2 智慧健康醫療衍射出的重要概念 340
13.3 數據科學之於智慧醫療,是漁而非魚 345
第14章 合理醫療與數據科學 351
14.1 合理醫療的大道理 351
14.2 不合理醫療的小算盤 352
14.3 合理醫療監管的外儒內法 359
14.4 監管手段從形式之法到數據之法 361
14.5 基於數據科學的合理醫療循證評價 364
第15章 醫院管理與數據科學 370
15.1 指標化的醫院數位化管理 370
15.2 基於數據科學的DRGs/DIP醫保費用管理 379
15.3 基於數據科學方法的精細醫院運營管理 386
15.4 基於數據科學的RBRVS績效評價體系構建 391
第16章 醫學人文與數據科學 396
16.1 技術和人文是醫學發展的雙翼 396
16.2 數據科學對醫學人文的潛在影響 400
16.3 在醫學美學的指導下發展醫療數據科學 403
第17章 醫療大數據的理、采、存、管、用 407
17.1 醫療機構數據套用的窘境 407
17.2 醫療大數據平台的四層架構和五項功能 412
17.3 醫療大數據的變現管理 421
17.4 醫療大數據套用的安全體系 426
17.4.1 信息安全是所有數據建設的基礎 427
17.4.2 健康醫療大數據的合規管理 431
17.4.3 隱私計算在促進醫療大數據合規套用的作用 437
17.4.4 隱私計算融合區塊鏈提升數據協作全流程保護能力 441
17.4.5 易被忽視的AI安全 442
17.5 DataOps推動業務數據協作聯動 445
17.6 警惕唯數據主義的陷阱 447
後 記 精數道以明醫理,通仁術以踐仁心 453