內容簡介
本書以零基礎講解為宗旨,面向學習數據科學與人工智慧的讀者,通俗地講解每一個知識點,旨在幫助讀者快速打下數學基礎。
全書分為 4 篇,共 17 章。其中第 1 篇為數學知識基礎篇,主要講述了高等數學基礎、微積分、泰勒公式與拉格朗日乘子法;第 2 篇為數學知識核心篇,主要講述了線性代數基礎、特徵值與矩陣分解、機率論基礎、隨機變數與機率估計;第 3 篇為數學知識提高篇,主要講述了數據科學的幾種分布、核函式變換、熵與激活函式;第 4 篇為數學知識套用篇,主要講述了回歸分析、假設檢驗、相關分析、方差分析、聚類分析、貝葉斯分析等內容。
本書適合準備從事數據科學與人工智慧相關行業的讀者。
圖書目錄
第1 章 人工智慧與數學基礎..........1
1.1 什麼是人工智慧............................ 2
1.2 人工智慧的發展 ............................ 2
1.3 人工智慧的套用 ............................ 4
1.4 學習人工智慧需要哪些知識 ............. 5
1.5 為什麼要學習數學 ......................... 7
1.6 本書包括的數學知識 ...................... 8
第 1 篇
基礎篇................................................................. 9
第 2 章 高等數學基礎 ................. 10
2.1 函式.......................................... 11
2.2 極限..........................................13
2.3 無窮小與無窮大...........................17
2.4 連續性與導數..............................19
2.5 偏導數...................................... 24
2.6 方嚮導數................................... 27
2.7 梯度......................................... 29
2.8 綜合實例—梯度下降法求函式的最小值.......................................31
2.9 高手點撥................................... 35
2.10 習題....................................... 38
第 3 章 微積分..............................39
3.1 微積分的基本思想 ....................... 40
3.2 微積分的解釋..............................41
3.3 定積分...................................... 42
3.4 定積分的性質............................. 44
3.5 牛頓—萊布尼茨公式.................... 45
3.6 綜合實例—Python 中常用的定積分求解方法................................... 49
3.7 高手點撥....................................51
3.8 習題 ........................................ 52
第 4 章 泰勒公式與拉格朗日乘子法..............................53
4.1 泰勒公式出發點.......................... 54
4.2 一點一世界................................ 54
4.3 階數和階乘的作用....................... 59
4.4 麥克勞林展開式的套用..................61
4.5 拉格朗日乘子法.......................... 63
4.6 求解拉格朗日乘子法.................... 64
4.7 綜合實例—編程模擬實現 sinx 的n 階泰勒多項式並驗證結果.................. 67
4.8 高手點撥 ................................... 68
4.9 習題 ......................................... 68
第2 篇
核心篇............................................................... 69
第 5 章 將研究對象形式化—線性代數基礎 ..........................70
5.1 向量..........................................71
5.2 矩陣......................................... 73
5.3 矩陣和向量的創建....................... 77
5.4 特殊的矩陣................................ 85
5.5 矩陣基本操作..............................91
5.6 轉置矩陣和逆矩陣....................... 96
5.7 行列式..................................... 101
5.8 矩陣的秩..................................104
5.9 內積與正交...............................108
5.10 綜合實例—線性代數在實際問題中的套用 ....................................... 114
5.11 高手點撥 ................................ 121
5.12 習題......................................126
第 6 章 從數據中提取重要信息—特徵值與矩陣分解..........127
6.1 特徵值與特徵向量 .....................128
6.2 特徵空間..................................133
6.3 特徵值分解...............................133
6.4 SVD 解決的問題.......................135
6.5 奇異值分解(SVD)..................136
6.6 綜合實例 1—利用 SVD 對圖像進行壓縮 .......................................140
6.7 綜合實例 2—利用 SVD 推薦商品 .......................................143
6.8 高手點撥..................................150
6.9 習題 .......................................154
第 7 章 描述統計規律 1—機率論基礎................................155
7.1 隨機事件及其機率 ......................156
7.2 條件機率.................................. 161
7.3 獨立性.....................................162
7.4 隨機變數..................................165
7.5 二維隨機變數............................173
7.6 邊緣分布..................................177
7.7 綜合實例—機率的套用.............180
7.8 高手點撥.................................. 181
7.9 習題........................................184
第 8 章 描述統計規律 2—隨機變數與機率估計........................185
8.1 隨機變數的數字特徵 ..................186
8.2 大數定律和中心極限定理.............193
8.3 數理統計基本概念......................199
8.4 最大似然估計........................... 203
8.5 最大後驗估計........................... 206
8.6 綜合實例 1—貝葉斯用戶滿意度預測 ...................................... 209
8.7 綜合實例 2—最大似然法求解模型參數 .......................................217
8.8 高手點撥 ................................ 222
8.9 習題 ....................................... 224
第 3 篇
提高篇............................................................. 225
第 9 章 隨機變數的幾種分布...... 226
9.1 常態分配 ................................ 227
9.2 二項分布................................. 240
9.3 泊松分布................................. 250
9.4 均勻分布..................................261
9.5 卡方分布................................. 266
9.6 Beta 分布 .............................. 273
9.7 綜合實例—估算棒球運動員的擊中率 ...................................... 283
9.8 高手點撥 ................................ 285
9.9 習題 ...................................... 286
第 10 章 數據的空間變換—核函式變換............................. 287
10.1 相關知識簡介 ......................... 288
10.2 核函式的引入 ......................... 290
10.3 核函式實例............................ 290
10.4 常用核函式.............................291
10.5 核函式的選擇......................... 294
10.6 SVM 原理 ............................ 295
10.7 非線性 SVM 與核函式的引入.... 305
10.8 綜合實例—利用 SVM 構建分類
問題......................................310
10.9 高手點撥................................315
10.10 習題 ................................... 322
第 11 章 熵與激活函式 .............. 323
11.1 熵和信息熵............................ 324
11.2 激活函式 ............................... 328
11.3 綜合案例—分類算法中信息熵的套用...................................... 339
11.4 高手點撥 ................................341
11.5 習題 ..................................... 342
第4 篇
套用篇............................................................. 333
第 12 章 假設檢驗 ..................... 344
12.1 假設檢驗的基本概念................. 345
12.2 Z 檢驗 ...................................351
12.3 t 檢驗 ................................... 353
12.4 卡方檢驗............................... 358
12.5 假設檢驗中的兩類錯誤 ..............361
12.6 綜合實例 1—體檢數據中的假設檢驗問題..................................... 363
12.7 綜合實例 2—種族對求職是否有影響..................................... 369
12.8 高手點撥............................... 372
12.9 習題..................................... 374
13 章 相關分析...................... 375
13.1 相關分析概述.......................... 376
13.2 皮爾森相關係數....................... 378
13.3 相關係數的計算與假設檢驗........ 379
13.4 斯皮爾曼等級相關.................... 385
13.5 肯德爾係數............................. 392
13.6 質量相關分析.......................... 396
13.7 品質相關分析.......................... 400
13.8 偏相關與復相關....................... 403
13.9 綜合實例—相關係數計算........ 405
13.10 高手點撥.............................. 407
13.11 習題..................................... 408
第 14 章 回歸分析......................409
14.1 回歸分析概述...........................410
14.2 回歸方程推導及套用..................412
14.3 回歸直線擬合優度.....................416
14.4 線性回歸的模型檢驗..................417
14.5 利用回歸直線進行估計和預測......419
14.6 多元與曲線回歸問題..................421
14.7 Python 工具包....................... 426
14.8 綜合實例—個人醫療保費預測任務...................................... 432
14.9 高手點撥................................ 444
14.10 習題..................................... 446
第 15 章 方差分析......................449
15.1 方差分析概述.......................... 448
15.2 方差的比較............................. 450
15.3 方差分析.................................451
15.4 綜合實例—連鎖餐飲用戶評級分析...................................... 460
15.5 高手點撥................................ 464
15.6 習題...................................... 466
第 16 章 聚類分析......................469
16.1 聚類分析概述.......................... 468
16.2 層次聚類................................ 470
16.3 K-Means 聚類...................... 484
16.4 DBSCAN 聚類....................... 494
16.5 綜合實例—聚類分析.............. 499
16.6 高手點撥.................................512
16.7 習題.......................................512
第 17 章 貝葉斯分析....................513
17.1 貝葉斯分析概述........................514
17.2 MCMC 概述.......................... 520
17.3 MCMC 採樣 ......................... 525
17.4 Gibbs 採樣........................... 529
17.5 綜合實例—利用 PyMC3 實現隨機模擬樣本分布......................... 532
17.6 高手點撥............................... 539
17.7 習題..................................... 540
作者簡介
唐宇迪,計算機專業博士,網易雲課堂人工智慧認證行家,51CTO學院講師,CSDN部落格專家。
李琳,河南工業大學副教授,在軟體工程、機器學習、人工智慧和模式識別等領域有深入研究。
侯惠芳,教授,解放軍信息工程大學通信與信息系統專業博士,擅長機器學習、大數據檢索、人工智慧和模式識別等。
王社偉,河南工業大學副教授,西北工業大學航空宇航製造專業博士,挪威科技大學訪問學者,對數位化製造、企業管理系統、機器學習、數據挖掘等有豐富的實戰經驗。