機率與統計:數據科學視角

機率與統計:數據科學視角

《機率與統計:數據科學視角》是一本2022年機械工業出版社出版的圖書,作者是王彩霞。

基本介紹

  • 中文名:機率與統計:數據科學視角
  • 作者:王彩霞
  • 出版時間:2022年3月1日
  • 出版社機械工業出版社
  • 頁數:252 頁
  • ISBN:9787111628941
  • 開本:16 開
  • 裝幀:平裝
  • 叢書系列:統計學精品譯叢
內容簡介,作者簡介,圖書目錄,

內容簡介

本書從數據科學視角,詳細講解機率分布、期望值、估計等機率統計知識,廣泛使用真實的數據集,同時所有數據分析均由R編碼支持。此外,本書包含許多數據科學套用,如主成分分析、混合分布、隨機圖模型、隱馬爾科夫模型、線性回歸、邏輯回歸和神經網路等。

作者簡介

諾曼·馬特羅夫(Norman Matloff)是加州大學戴維斯分校計算機科學專業教授,並曾擔任該校統計學專業教授。他是 Journal of Statistical Software和The R Journal的編委會成員。他的著作Statistical Regression and Classification: From Linear Models to Machine Learning曾入選2017年國際Ziegel獎。他還是該校傑出教學獎的獲得者。

圖書目錄

前言
作者簡介
第一部分 機率論基礎
第1章 基本的機率模型2
 1.1 示例:公共汽車客流量2
 1.2 “筆記本”視圖:重複實驗的概念3
  1.2.1 理論方法3
  1.2.2 更直觀的方法3
 1.3 我們的定義4
 1.4 “郵寄筒”7
 1.5 示例:公共汽車客流量(續)7
 1.6 示例:ALOHA網路9
  1.6.1 ALOHA網路模型總結10
  1.6.2 ALOHA網路計算10
 1.7 筆記本環境中的ALOHA12
 1.8 示例:一個簡單的棋盤遊戲13
 1.9 貝葉斯法則14
  1.9.1 總則14
  1.9.2 示例:文檔分類15
 1.10 隨機圖模型15
  1.10.1 示例:擇優連線模型16
 1.11 基於組合數學的計算16
  1.11.1 5張牌中哪一種情況更有可能:一張國王還是兩張紅心16
  1.11.2 示例:學生的隨機分組17
  1.11.3 示例:彩票17
  1.11.4 示例:數字之差18
  1.11.5 多項式係數19
  1.11.6 示例:打橋牌時得到4張A的機率19
 1.12 練習20
第2章 蒙特卡羅模擬22
 2.1 示例:擲骰子22
  2.1.1 第一次改進22
  2.1.2 第二次改進23
  2.1.3 第三次改進24
 2.2 示例:骰子問題24
 2.3 使用runif()模擬事件25
 2.4 示例:公共汽車客流量(續)25
 2.5 示例:棋盤遊戲(續)25
 2.6 示例:斷桿26
 2.7 我們應該運行模擬多長時間26
 2.8 計算補充26
  2.8.1 replicate()函式的更多信息26
 2.9 練習27
第3章 離散型隨機變數:期望值28
 3.1 隨機變數28
 3.2 離散型隨機變數28
 3.3 獨立的隨機變數29
 3.4 示例:蒙提霍爾問題29
 3.5 期望值31
  3.5.1 一般性——不只是離散型隨機變數31
  3.5.2 用詞不當31
  3.5.3 定義和筆記本視圖31
 3.6 期望值的性質32
  3.6.1 計算公式32
  3.6.2 期望值的一些性質33
 3.7 示例:公共汽車客流量35
 3.8 示例:預測產品需求36
 3.9 通過模擬求期望值36
 3.10 賭場、保險公司和“總和使用者”與其他情況相比37
 3.11 數學補充38
  3.11.1 性質E的證明38
 3.12 練習38
第4章 離散型隨機變數:方差39
 4.1 方差39
  4.1.1 定義39
  4.1.2 方差概念的核心重要性41
  4.1.3 關於Var(X)大小的直覺41
 4.2 有用的事實42
 4.3 協方差43
 4.4 指示隨機變數及其均值和方差44
  4.4.1 示例:圖書館圖書歸還時間(第一版)44
  4.4.2 示例:圖書館圖書歸還時間(第二版)45
  4.4.3 示例:委員會問題中的指示變數45
 4.5 偏度47
 4.6 數學補充47
  4.6.1 切比雪夫不等式的證明47
 4.7 練習48
第5章 離散參數分布族49
 5.1 分布49
  5.1.1 示例:擲硬幣直到第一次出現正面為止49
  5.1.2 示例:兩個骰子的和49
  5.1.3 示例:Watts-Strogatz隨機圖模型50
 5.2 參數分布族51
 5.3 對我們很重要的案例:pmf的參數族51
 5.4 基於伯努利實驗的分布51
  5.4.1 幾何分布族52
  5.4.2 二項分布族55
  5.4.3 負二項分布族56
 5.5 兩種主要的非伯努利模型58
  5.5.1 泊松分布族58
  5.5.2 冪律分布族59
  5.5.3 根據數據擬合泊松和冪律模型60
 5.6 其他示例62
  5.6.1 示例:公共汽車客流量問題…62
  5.6.2 示例:社交網路分析63
 5.7 計算補充63
  5.7.1 R中的圖形和可視化63
 5.8 練習64
第6章 連續型機率模型66
 6.1 隨機擲鏢遊戲66
 6.2 單值點的機率為零66
 6.3 現在我們有個問題67
 6.4 解決該問題的方法:累積分布函式67
  6.4.1 累積分布函式67
  6.4.2 既非離散也非連續的分布68
 6.5 密度函式69
  6.5.1 密度函式的性質69
  6.5.2 密度的直觀含義70
  6.5.3 期望值71
 6.6 第一個示例71
 6.7 著名的連續分布參數族72
  6.7.1 均勻分布72
  6.7.2 正態(高斯)分布族73
  6.7.3 指數分布族74
  6.7.4 伽馬分布族76
  6.7.5 貝塔分布族77
 6.8 數學補充79
  6.8.1 危險函式79
  6.8.2 指數分布族與泊松分布族的對偶性79
 6.9 計算補充80
  6.9.1 R的integrate()函式80
  6.9.2 從密度函式中抽樣的逆方法…80
  6.9.3 從泊松分布中抽樣81
 6.10 練習81
第二部分 統計基礎
第7章 統計學:序言84
 7.1 本章的重要性84
 7.2 抽樣分布84
  7.2.1 隨機抽樣84
 7.3 樣本均值85
  7.3.1 示例:玩具總體85
  7.3.2 X的期望值和方差86
  7.3.3 同樣的示例:玩具總體87
  7.3.4 解釋87
  7.3.5 筆記本視圖88
 7.4 簡單隨機抽樣情況88
 7.5 樣本方差89
  7.5.1 σ2的直觀估計89
  7.5.2 更易於計算的方法89
  7.5.3 特殊情況:X為指示變數90
 7.6 除以n還是n-190
  7.6.1 統計偏差90
 7.7 “標準誤差”的概念91
 7.8 示例:Pima糖尿病研究91
 7.9 別忘了:樣本≠總體93
 7.10 模擬問題93
  7.10.1 樣本估計93
  7.10.2 無限總體93
 7.11 觀測研究9

相關詞條

熱門詞條

聯絡我們