R語言機器學習(原書第2版)

《R語言機器學習(原書第2版)》是2020年機械工業出版社出版的圖書。

基本介紹

  • 中文名:R語言機器學習(原書第2版)
  • 出版時間:2020年1月1日
  • 出版社:機械工業出版社
  • ISBN:9787111641049
內容簡介,圖書目錄,作者簡介,

內容簡介

本書是介紹機器學習技術的綜合指南,從基礎的統計學原理和R語言編程知識,到核心的機器學習理論和算法分析,以及機器學習模型的評估和改進方法,再到機器學習技術在大數據平台上的套用,書中都有詳細介紹。
本書主要在第1版的基礎上增加了兩個部分:第一個是關於時間序列模型的新章節(第 9 章),這是一個源於統計學的傳統主題。第二個新增的章節是深度學習(第 11 章),它是機器學習的一個迅速崛起的子領域。除了增加這兩個章節之外,本書中的文本和代碼會以一種讀者友好的新格式來整體呈現。新版會繼續專注於使用流行的統計程式語言 R 來構建用例。對於深度學習這樣的主題,我們建議採用 Python 語言來配合 TensorFlow 這樣的框架。但是,在第2版中,我們會向讀者展示如何在 TensorFlow 中使用 R 語言編程,因此如果讀者只熟悉 R,可以暫時無須學習 Python。與第1版一樣,我們通過各種實際用例保持了機器學習理論與套用的良好平衡,為讀者提供了一個真正全面的機器學習主題集合。

圖書目錄

譯者序
前言
第1章 機器學習和R語言入門
1.1 了解發展歷程
1.1.1 統計學習
1.1.2 機器學習
1.1.3 人工智慧
1.1.4 數據挖掘
1.1.5 數據科學
1.2 機率與統計
1.2.1 計數和機率的定義
1.2.2 事件和關係
1.2.3 隨機性、機率和分布
1.2.4 置信區間和假設檢驗
1.3 R語言入門
1.3.1 基本組成部分
1.3.2 R語言的數據結構
1.3.3 子集處理
1.3.4 數和Apply系列
1.4 機器學習過程工作流
1.4.1 計畫
1.4.2 探索
1.4.3 構建
1.4.4 評估
1.5 其他技術
1.6 小結
第2章 數據準備和探索
2.1 規劃數據收集
2.1.1 變數類型
2.1.2 數據格式
2.1.3 數據源的類型
2.2 初始數據分析
2.2.1 初步印象
2.2.2 把多個數據源組織到一起
2.2.3 整理數據
2.2.4 補充更多信息
2.2.5 重塑
2.3 探索性數據分析
2.3.1 摘要統計量
2.3.2 矩
2.4 案例研究:信用卡欺詐
2.4.1 數據導入
2.4.2 數據變換
2.4.3 數據探索
2.5 小結
第3章 抽樣與重抽樣技術
3.1 介紹抽樣技術
3.2 抽樣的術語
3.2.1 樣本
3.2.2 抽樣分布
3.2.3 總群體的均值和方差
3.2.4 樣本均值和方差
3.2.5 匯總的均值和方差
3.2.6 抽樣點
3.2.7 抽樣誤差
3.2.8 抽樣率
3.2.9 抽樣偏誤
……
第4章 R語言裡的數據可視化
第5章 特徵工程
第6章 機器學習理論和實踐
第7章 機器學習模型的評估
第8章 模型性能改進
第9章 時間序列模型
第10章 可擴展機器學習和相關技術
第11章 用Keras和Tensorflow進行深度學習

作者簡介

  卡西克·拉瑪蘇布蘭馬尼安(Karthik Ramasubramanian)就職於印度創業技術公司Hike Messenger。他一直為零售、電子商務和技術行業解決跨行業的數據科學問題,開發數據驅動的解決方案並進行原型構建。Karthik對整個數據科學生命周期(從探索數據問題,到創建數據科學模型,以及開發各行業相關產品)都具有豐富的經驗。
  阿布舍克·辛格( Abhishek Singh)領導的數據科學專業團隊正在解決糧食安全、網路安全、自然災害、醫療保健以及更多領域的緊迫問題。他對美國銀行的資產進行了壓力測試,開發了保險定價模型,並最佳化了客戶的電信體驗。他積極參與數據科學分析相關的思想交流、創作、公開演講、會議和培訓。他堅定地支持負責任地使用人工智慧來消除偏見,並堅信合理使用AI將使生活更美好。

相關詞條

熱門詞條

聯絡我們