白話機器學習算法

白話機器學習算法

《白話機器學習算法》是2019年人民郵電出版社出版的書籍,作者是[新加坡] 黃莉婷 / [新加坡] 蘇川集。

基本介紹

  • 書名:白話機器學習算法
  • 作者:[新加坡] 黃莉婷 / [新加坡] 蘇川集
  • 原作品:Numsense! Data Science for the Layman: No Math Added
  • 譯者:武傳海
  • 出版社:人民郵電出版社
  • 出版時間:2019年2月
  • 頁數:128 頁
  • ISBN:9787115506641
內容簡介,圖書目錄,作者簡介,

內容簡介

與使用數學語言或計算機程式語言講解算法的書不同,本書另闢蹊徑,用通俗易懂的人類語言以及大量有趣的示例和插圖講解10多種前沿的機器學習算法。內容涵蓋k均值聚類、主成分分析、關聯規則、社會網路分析等無監督學習算法,以及回歸分析、k最近鄰、支持向量機、決策樹、隨機森林、神經網路等監督學習算法,並概述強化學習算法的思想。任何對機器學習和數據科學懷有好奇心的人都可以通過本書構建知識體系。

圖書目錄

第1章 基礎知識
1.1 準備數據
1.1.1 數據格式
1.1.2 變數類型
1.1.3 變數選擇
1.1.4 特徵工程
1.1.5 缺失數據
1.2 選擇算法
1.2.1 無監督學習
1.2.2 監督學習
1.2.3 強化學習
1.2.4 注意事項
1.3 參數調優
1.4 評價模型
1.4.1 分類指標
1.4.2 回歸指標
1.4.3 驗證
1.5 小結
第2章 k均值聚類
2.1 找出顧客群
2.2 示例:影迷的性格特徵
2.3 定義群組
2.3.1 有多少個群組
2.3.2 每個群組中有誰
2.4 局限性
2.5 小結
第3章 主成分分析
3.1 食物的營養成分
3.2 主成分
3.3 示例:分析食物種類
3.4 局限性
3.5 小結
第4章 關聯規則
4.1 發現購買模式
4.2 支持度、置信度和提升度
4.3 示例:分析雜貨店的銷售數據
4.4 先驗原則
4.4.1 尋找具有高支持度的項集
4.4.2 尋找具有高置信度或高提升度的關聯規則
4.5 局限性
4.6 小結
第5章 社會網路分析
5.1 展現人際關係
5.2 示例:國際貿易
5.3 Louvain方法
5.4 PageRank算法
5.5 局限性
5.6 小結
第6章 回歸分析
6.1 趨勢線
6.2 示例:預測房價
6.3 梯度下降法
6.4 回歸係數
6.5 相關係數
6.6 局限性
6.7 小結
第7章 k最近鄰算法和異常檢測
7.1 食品檢測
7.2 物以類聚,人以群分
7.3 示例:區分紅白葡萄酒
7.4 異常檢測
7.5 局限性
7.6 小結
第8章 支持向量機
8.1 醫學診斷
8.2 示例:預測心臟病
8.3 勾畫最佳分界線
8.4 局限性
8.5 小結
第9章 決策樹
9.1 預測災難倖存者
9.2 示例:逃離鐵達尼號
9.3 生成決策樹
9.4 局限性
9.5 小結
第10章 隨機森林
10.1 集體智慧
10.2 示例:預測犯罪行為
10.3 集成模型
10.4 自助聚集法
10.5 局限性
10.6 小結
第11章 神經網路
11.1 建造人工智慧大腦
11.2 示例:識別手寫數字
11.3 神經網路的構成
11.4 激活規則
11.5 局限性
11.6 小結
第12章 A/B測試和多臂老虎機
12.1 初識A/B測試
12.2 A/B測試的局限性
12.3 epsilon遞減策略
12.4 示例:多臂老虎機
12.5 勝者為先
12.6 epsilon遞減策略的局限性
12.7 小結
附錄A 無監督學習算法概覽
附錄B 監督學習算法概覽
附錄C 調節參數列表
附錄D 更多評價指標
術語表
關於作者

作者簡介

黃莉婷(Annalyn Ng),高級數據分析師,劍橋大學心理測量中心碩士,曾受邀在迪士尼研究中心研究客戶行為科學,並通過數據挖掘技術幫助三星和雅虎等公司制定行銷和人員招聘等方面的策略。
蘇川集(Kenneth Soo),史丹福大學統計學碩士,華威大學高材生,曾從事網路隨機故障下應用程式的雙目標穩健最佳化研究,善於用通俗的語言介紹數據科學。

相關詞條

熱門詞條

聯絡我們