《百面機器學習:算法工程師帶你去面試》是2018年8月人民郵電出版社出版的圖書,作者諸葛越和葫蘆娃。
本書適合人工智慧領域的入門者、從業者和技術管理人員。
基本介紹
- 書名:百面機器學習:算法工程師帶你去面試
- 又名:機器學習面試寶典
- 作者:諸葛越,葫蘆娃
- ISBN:9787115487360
- 類別:人工智慧-機器學習
- 頁數:428
- 定價:89
- 出版社:人民郵電出版社
- 出版時間:2018年8月
- 裝幀:平裝
- 開本:720X960 1/16
作者簡介,主要內容,目錄,
作者簡介
諸葛越:現任Hulu公司全球研發副總裁,中國研發中心總經理。獲美國史丹福大學的計算機碩士與博士學位,紐約州立大學石溪分校的套用數學碩士學位,曾就讀於清華大學計算機科學與技術系。
葫蘆娃:15位Hulu北京創新實驗室的頂尖人才,他們利用擅長的機器學習、深度學習等領域知識和算法模型,建立了一套定製化的機AI平台,改變著推薦引擎、視頻編解碼、內容理解、廣告投放等多項與用戶息息相關的線上業務技術。
主要內容
本書收錄了超過100道機器學習算法工程師的面試題目和解答,其中大部分源於Hulu算法研究崗位的真實場景。本書從日常工作、生活中各種有趣的現象出發,不僅囊括了機器學習的基本知識,而且還包含了成為優秀算法工程師的相關技能,更重要的是凝聚了筆者對人工智慧領域的一顆熱忱之心,旨在培養讀者發現問題、解決問題、擴展問題的能力,建立對機器學習的熱愛,共繪人工智慧世界的宏偉藍圖。
目錄
推薦序
前言
機器學習算法工程師的自我修養
第1章 特徵工程
第1節 特徵歸一化
第2節 類別型特徵
第3節 高維組合特徵的處理
第4節 組合特徵
第5節 文本表示模型
第6節 Word2Vec
第7節 圖像數據不足時的處理方法
第2章 模型評估
第1節 評估指標的局限性
第2節 ROC 曲線
第3節 餘弦距離的套用
第4節 A/B 測試的陷阱
第5節 模型評估的方法
第6節 超參數調優
第7節 過擬合與欠擬合
第3章 經典算法
第1節 支持向量機
第2節 邏輯回歸
第3節 決策樹
第4章 降維
第1節 PCA 最大方差理論
第2節 PCA 最小平方誤差理論
第3節 線性判別分析
第4節 線性判別分析與主成分分析
第5章 非監督學習
第1節 K 均值聚類
第2節 高斯混合模型
第3節 自組織映射神經網路
第4節 非監督學習算法的評估
第6章 機率圖模型
第1節 機率圖模型的聯合機率分布
第2節 機率圖表示
第3節 生成式模型與判別式模型
第4節 馬爾可夫模型
第5節 主題模型
第7章 最佳化算法
第1節 有監督學習的損失函式
第2節 機器學習中的最佳化問題
第3節 經典最佳化算法
第4節 梯度驗證
第5節 隨機梯度下降法
第6節 隨機梯度下降法的加速
第7節 L1 正則化與稀疏性
第8章 採樣
第1節 採樣的作用
第2節 均勻分布隨機數
第3節 常見的採樣方法
第4節 高斯分布的採樣
第5節 馬爾科夫蒙特卡洛採樣法
第6節 貝葉斯網路的採樣
第7節 不均衡樣本集的重採樣
第9章 前向神經網路
第1節 多層感知機與布爾函式
第2節 深度神經網路中的激活函式
第3節 多層感知機的反向傳播算法
第4節 神經網路訓練技巧
第5節 深度卷積神經網路
第6節 深度殘差網路
第10章 循環神經網路
第1節 循環神經網路和卷積神經網路
第2節 循環神經網路的梯度消失問題
第3節 循環神經網路中的激活函式
第4節 長短期記憶網路
第5節 Seq2Seq 模型
第6節 注意力機制
第11章 強化學習
第1節 強化學習基礎
第2節 視頻遊戲裡的強化學習
第3節 策略梯度
第4節 探索與利用
第12章 集成學習
第1節 集成學習的種類
第2節 集成學習的步驟和例子
第3節 基分類器
第4節 偏差與方差
第5節 梯度提升決策樹的基本原理
第6節 XGBoost 與GBDT 的聯繫和區別
第13章 生成式對抗網路
第1節 初識GANs 的秘密
第2節 WGAN:抓住低維的幽靈
第3節 DCGAN:當GANs 遇上卷積
第4節 ALI:包攬推斷業務
第5節 IRGAN:生成離散樣本
第6節 SeqGAN:生成文本序列
第14章 人工智慧的熱門套用
第1節 計算廣告
第2節 遊戲中的人工智慧
第3節 AI 在自動駕駛中的套用
第4節 機器翻譯
第5節 人機互動中的智慧型計算
後記
作者隨筆
參考文獻