精通數據科學算法

精通數據科學算法

《精通數據科學算法》是2019年5月人民郵電出版社出版的圖書,作者是[英]戴維·納蒂加(David Natingga)。

基本介紹

  • 中文名:精通數據科學算法
  • 作者:[英]戴維·納蒂加(David Natingga)
  • ISBN:9787115498168
  • 頁數:164頁
  • 定價:59元
  • 出版社:人民郵電出版社
  • 出版時間:2019年5月
  • 裝幀:平裝
  • 開本:小16開
內容簡介,圖書目錄,

內容簡介

數據科學(Data Science)是從數據中提取知識的技術,是一門有關機器學習、統計學與數據挖掘的交叉學科。數據科學包含了多種領域的不同元素,包括信號處理、數學、機率模型技術和理論、計算機編程、統計學等。
本書講解了7種重要的數據分析方法,它們分別是k最近鄰算法、樸素貝葉斯算法、決策樹、隨機森林、k-means聚類、回歸分析以及時間序列分析。全書共7章,每一章都以一個簡單的例子開始,先講解算法的基本概念與知識,然後通過對案例進行擴展以講解一些特殊的分析算法。這種方式有益於讀者深刻理解算法。
本書適合數據分析人員、機器學習領域的從業人員以及對算法感興趣的讀者閱讀。

圖書目錄

第 1 章 用k最近鄰算法解決分類問題
1.1 Mary對溫度的感覺
1.2 實現k最近鄰算法
1.3 義大利地區的示例——選擇k值
1.4 房屋所有權——數據轉換
1.5 文本分類——使用非歐幾里德距離
1.6 文本分類——更高維度的k-NN
1.7 小結
1.8 習題
第 2 章 樸素貝葉斯
2.1 醫療檢查——貝葉斯定理的基本套用
2.2 貝葉斯定理的證明及其擴展
2.3 西洋棋遊戲——獨立事件
2.5 西洋棋遊戲——相關事件
2.6 性別分類——基於連續隨機變數的貝葉斯定理
2.7 小結
2.8 習題
第 3 章 決策樹
3.1 游泳偏好——用決策樹表示數據
3.2 資訊理論 044
3.3 ID3算法——構造決策樹 047
3.4 用決策樹進行分類 054
3.5 小結 060
3.6 習題 060
第 4 章 隨機森林 064
4.1 隨機森林算法概述 064
4.2 游泳偏好——隨機森林分析法 065
4.3 隨機森林算法的實現 071
4.4 下棋實例 075
4.5 購物分析——克服隨機數據的不一致性以及
度量置信水平 082
4.6 小結 084
4.7 習題 084
第 5 章 k-means聚類 089
5.1 家庭收入——聚類為k個簇 089
5.2 性別分類——聚類分類 092
5.3 k-means聚類算法的實現 095
5.4 房產所有權示例——選擇簇的數量 099
5.5 小結 105
5.6 習題 105
第 6 章 回歸分析 114
6.1 華氏溫度和攝氏溫度的轉換——基於完整數據的線性回歸 114
6.2 根據身高預測體重——基於實際數據的線性回歸 117
6.3 梯度下降算法及實現 118
6.4 根據距離預測飛行時長 122
6.5 彈道飛行分析——非線性模型 123
6.6 小 結 125
6.7 習 題 125
第 7 章 時間序列分析 130
7.1 商業利潤——趨勢分析 130
7.2 電子商店的銷售額——季節性分析 132
7.3 小 結 140
7.4 習 題 140
附錄 A 統計 145
A.1 基本概念 145
A.2 貝葉斯推理 146
A.3 分 布 146
A.4 交叉驗證 147
A.5 A/B 測 試 148
附錄 B R參考 149
B.1 介 紹 149
B.2 數據類型 150
B.3 線性回歸 152
附錄 C Python參考 154
C.1 介 紹 154
C.2 數據類型 155
C.3 控 制 流 159
附錄 D 數據科學中的算法和方法術語 163

相關詞條

熱門詞條

聯絡我們