《統計思維:程式設計師數學之機率統計(第2版)》是2015年人民郵電出版社出版的圖書,作者是[美] 唐尼 ( Allen B. Downey )。
基本介紹
- 中文名:統計思維:程式設計師數學之機率統計(第2版)
- 作者:[美] 唐尼 ( Allen B. Downey )
- 出版社:人民郵電出版社
- 出版時間:2015年9月
- ISBN:978-7-115-40108-3
圖書簡介,目錄結構,
圖書簡介
《統計思維:程式設計師數學之機率統計(第2版)》通過一個案例研究,介紹探索性數據分析的全過程:從收集數據、生成統計信息,到發現模式、驗證假設。同時研究分布、機率規則、可視化和其他多種工具及概念。此外,第2版新增了回歸、時間序列分析、生存分析和分析方法等章節。
目錄結構
第1 章 探索性數據分析 1
1.1 統計學方法 2
1.2 全國家庭增長調查 2
1.3 數據導入 3
1.4 DataFrame 4
1.5 變數 6
1.6 數據變換 6
1.7 數據驗證 8
1.8 解釋數據 9
1.9 練習 10
1.10 術語 11
第2 章 分布 13
2.1 表示直方圖 14
2.2 繪製直方圖 14
2.3 全國家庭增長調查中的變數 15
2.4 離群值 18
2.5 第一胎 18
2.6 分布概述 20
2.7 方差 21
2.8 效應量 21
2.9 報告結果 22
2.10 練習 23
2.11 術語 23
第3 章 機率質量函式 25
3.1 機率質量函式 25
3.2 繪製PMF 26
3.3 繪製PMF 的其他方法 28
3.4 課堂規模悖論 29
3.5 使用DataFrame 進行索引 31
3.6 練習 33
3.7 術語 34
第4 章 累積分布函式 35
4.1 PMF 的局限 35
4.2 百分位數 36
4.3 CDF 37
4.4 表示CDF 38
4.5 比較CDF 39
4.6 基於百分位數的統計量 40
4.7 隨機數 41
4.8 比較百分位秩 42
4.9 練習 43
4.10 術語 44
第5 章 分布建模 45
5.1 指數分布 45
5.2 常態分配 48
5.3 正態機率圖 49
5.4 對數常態分配 51
5.5 Pareto 分布 53
5.6 隨機數生成 56
5.7 為什麼使用模型 56
5.8 練習 57
5.9 術語 59
第6 章 機率密度函式 61
6.1 PDF 61
6.2 核密度估計 63
6.3 分布框架 65
6.4 Hist 實現 65
6.5 Pmf 實現 66
6.6 Cdf 實現 67
6.7 矩 68
6.8 偏度 69
6.9 練習 72
6.10 術語 73
第7 章 變數之間的關係 75
7.1 散點圖 75
7.2 描述關係特徵 78
7.3 相關性 79
7.4 協方差 80
7.5 Pearson 相關性 81
7.6 非線性關係 82
7.7 Spearman 秩相關 82
7.8 相關性和因果關係 83
7.9 練習 84
7.10 術語 85
第8 章 估計 87
8.1 估計遊戲 87
8.2 猜測方差 89
8.3 抽樣分布 90
8.4 抽樣偏倚 93
8.5 指數分布 93
8.6 練習 95
8.7 術語 95
第9 章 假設檢驗 97
9.1 經典假設檢驗 97
9.2 假設檢驗 98
9.3 檢驗均值差 100
9.4 其他檢驗統計量 101
9.5 檢驗相關性 102
9.6 檢驗比例 103
9.7 卡方檢驗 104
9.8 再談第一胎 105
9.9 誤差 106
9.10 功效 107
9.11 復現 108
9.12 練習 109
9.13 術語 109
第10 章 線性最小二乘法 111
10.1 最小二乘法擬合 111
10.2 實現 112
10.3 殘差 113
10.4 估計 114
10.5 擬合優度 116
10.6 檢驗線性模型 118
10.7 加權重抽樣 119
10.8 練習 121
10.9 術語 121
第11 章 回歸 123
11.1 StatsModels 124
11.2 多重回歸 125
11.3 非線性關係 127
11.4 數據挖掘 128
11.5 預測 129
11.6 Logistic 回歸 131
11.7 估計參數 132
11.8 實現 133
11.9 準確度 134
11.10 練習 135
11.11 術語 136
第12 章 時間序列分析 139
12.1 導入和清洗數據 139
12.2 繪製圖形 141
12.3 線性回歸 143
12.4 移動平均值 144
12.5 缺失值 146
12.6 序列相關 148
12.7 自相關 149
12.8 預測 150
12.9 參考書目 154
12.10 練習 154
12.11 術語 155
第13 章 生存分析 157
13.1 生存曲線 157
13.2 危險函式 159
13.3 估計生存曲線 160
13.4 Kaplan-Meier 估計 161
13.5 婚姻曲線 162
13.6 估計生存函式 163
13.7 置信區間 164
13.8 群組效應 166
13.9 外推 168
13.10 預期剩餘生存期 169
13.11 練習 171
13.12 術語 172
第14 章 分析方法 173
14.1 常態分配 173
14.2 抽樣分布 174
14.3 表示常態分配 175
14.4 中心極限定理 176
14.5 檢驗CLT 177
14.6 套用CLT 180
14.7 相關檢驗 181
14.8 卡方檢驗 183
14.9 討論 184
14.10 練習 184
作者介紹 186
封面介紹 186