面向數據科學家的實用統計學

內容簡介

本書解釋了數據科學中至關重要的統計學概念，介紹如何將各種統計方法套用於數據科學。作者以易於理解、瀏覽和參考的方式，引出統計學中與數據科學相關的關鍵概念；解釋各統計學概念在數據科學中的重要性及有用程度，並給出原因。

圖書目錄

前言　xiii

第　1 章探索性數據分析　1

1.1　結構化數據的組成　2

1.2　矩形數據　4

1.2.1　數據框和索引　5

1.2.2　非矩形數據結構　5

1.2.3　拓展閱讀　6

1.3　位置估計　6

1.3.1　均值　7

1.3.2　中位數和穩健估計量　8

1.3.3　位置估計的例子：人口和謀殺率　9

1.3.4　拓展閱讀　10

1.4　變異性估計　10

1.4.1　標準偏差及相關估計值　11

1.4.2　基於百分位數的估計量　13

1.4.3　例子：美國各州人口的變異性估計量　14

1.4.4　拓展閱讀　14

1.5　探索數據分布　14

1.5.1　百分位數和箱線圖　15

1.5.2　頻數表和直方圖　16

1.5.3　密度估計　18

1.5.4　拓展閱讀　20

1.6　探索二元數據和分類數據　20

1.6.1　眾數　21

1.6.2　期望值　22

1.6.3　拓展閱讀　22

1.7　相關性　22

1.7.1　散點圖　25

1.7.2　拓展閱讀　26

1.8　探索兩個及以上變數　26

1.8.1　六邊形圖和等勢線（適用於兩個數值型變數）　26

1.8.2　兩個分類變數　28

1.8.3　分類數據和數值型數據　29

1.8.4　多個變數的可視化　31

1.8.5　拓展閱讀　33

1.9　小結　33

第　2 章數據和抽樣分布　34

2.1　隨機抽樣和樣本偏差　35

2.1.1　偏差　36

2.1.2　隨機選擇　37

2.1.3　數據規模與數據質量：何時規模更重要　38

2.1.4　樣本均值與總體均值　38

2.1.5　拓展閱讀　39

2.2　選擇偏差　39

2.2.1　趨均值回歸　40

2.2.2　拓展閱讀　41

2.3　統計量的抽樣分布　42

2.3.1　中心極限定理　44

2.3.2　標準誤差　44

2.3.3　拓展閱讀　45

2.4　自助法　45

2.4.1　重抽樣與自助法　47

2.4.2　拓展閱讀　48

2.5　置信區間　48

2.6　常態分配　50

2.7　長尾分布　53

面向數據科學家的實用統計學

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條