美團機器學習實踐

美團機器學習實踐

《美團機器學習實踐》是2018年12月人民郵電出版社出版的圖書,作者是美團算法團隊。

基本介紹

  • 中文名:美團機器學習實踐
  • 作者:美團算法團隊
  • ISBN:9787115484635
  • 頁數:308頁
  • 定價:79元
  • 出版社:人民郵電出版社
  • 出版時間:2018年12月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

人工智慧技術正以一種qian所wei有的速度深刻地改變著我們的生活,引導了第四次工業革命。美團作為國內O2O領域領 先的服務平台,結合自身的業務場景和數據,積極進行了人工智慧領域的套用探索。在美團的搜尋、推薦、計算廣告、風控、圖像處理等領域,相關的人工智慧技術得到廣泛的套用。本書包括通用流程、數據挖掘、搜尋和推薦、計算廣告、深度學習以及算法工程6大部分內容,全面介紹了美團在多個重要方面對機器學習的套用。
本書非常適合有一定機器學習基礎的工程技術人員和在校大學生學習和閱讀。通過本書,有經驗的算法工程師可以了解美團在這方面的做法,在校大學生可以學習機器學習算法如何在具體的業務場景中落地。

圖書目錄

目 錄
第 一部分 通用流程
第1章 問題建模 2
1.1 評估指標 3
1.1.1 分類指標 4
1.1.2 回歸指標 7
1.1.3 排序指標 9
1.2 樣本選擇 10
1.2.1 數據去噪 11
1.2.2 採樣 12
1.2.3 原型選擇和訓練集選擇 13
1.3 交叉驗證 14
1.3.1 留出法 14
1.3.2 K折交叉驗證 15
1.3.3 自助法 16
參考文獻 17
第 2章 特徵工程 18
2.1 特徵提取 18
2.1.1 探索性數據分析 19
2.1.2 數值特徵 20
2.1.3 類別特徵 22
2.1.4 時間特徵 24
2.1.5 空間特徵 25
2.1.6 文本特徵 25
2.2 特徵選擇 27
2.2.1 過濾方法 28
2.2.2 封裝方法 31
2.2.3 嵌入方法 31
2.2.4 小結 32
2.2.5 工具介紹 33
參考文獻 33
第3章 常用模型 35
3.1 邏輯回歸 35
3.1.1 邏輯回歸原理 35
3.1.2 邏輯回歸套用 38
3.2 場感知因子分解機 39
3.2.1 因子分解機原理 39
3.2.2 場感知因子分解機原理 40
3.2.3 場感知因子分解機的套用 41
3.3 梯度提升樹 42
3.3.1 梯度提升樹原理 42
3.3.2 梯度提升樹的套用 44
參考文獻 44
第4章 模型融合 45
4.1 理論分析 46
4.1.1 融合收益 46
4.1.2 模型誤差 分歧分解 46
4.1.3 模型多樣性度量 48
4.1.4 多樣性增強 49
4.2 融合方法 50
4.2.1 平均法 50
4.2.2 投票法 52
4.2.3 Bagging 54
4.2.4 Stacking 55
4.2.5 小結 56
參考文獻 57
D二部分 數據挖掘
第5章 用戶畫像 60
5.1 什麼是用戶畫像 60
5.2 用戶畫像數據挖掘 63
5.2.1 畫像數據挖掘整體架構 63
5.2.2 用戶標識 65
5.2.3 特徵數據 67
5.2.4 樣本數據 68
5.2.5 標籤建模 69
5.3 用戶畫像套用 83
5.3.1 用戶畫像實時查詢系統 83
5.3.2 人群畫像分析系統 87
5.3.3 其他系統 90
5.3.4 線上套用效果 91
5.4 小結 91
參考文獻 91
第6章 POI實體連結 92
6.1 問題的背景與難點 92
6.2 國內jiu店POI實體連結解決方案 94
6.2.1 jiu店POI實體連結 94
6.2.2 數據清洗 96
6.2.3 特徵生成 97
6.2.4 模型選擇與效果評估 100
6.2.5 索引粒度的配置 101
6.3 其他場景的策略調整 101
6.4 小結 103
第7章 評論挖掘 104
7.1 評論挖掘的背景 104
7.1.1 評論挖掘的粒度 105
7.1.2 評論挖掘的維度 105
7.1.3 評論挖掘的整合思考 106
7.2 評論標籤提取 106
7.2.1 數據的獲取及預處理 107
7.2.2 無監督的標籤提取方法 109
7.2.3 基於深度學習的標籤提取方法 111
7.3 標籤情感分析 113
7.3.1 評論標籤情感分析的特殊性 113
7.3.2 基於深度學習的情感分析方法 115
7.3.3 評論標籤情感分析的後續優 化與思考 118
7.4 評論挖掘的未來套用及實踐 119
7.5 小結 119
參考文獻 119
第三部分 搜尋和推薦
第8章 O2O場景下的查詢理解與 用戶引導 122
8.1 現代搜尋引擎原理 123
8.2 jing確理解查詢 124
8.2.1 用戶查詢意圖的定義與識別 125
8.2.2 查詢實體識別與結構化 129
8.2.3 召回策略的變遷 130
8.2.4 查詢改寫 131
8.2.5 詞權重與相關性計算 134
8.2.6 類目相關性與人工標註 135
8.2.7 查詢理解小結 136
8.3 引導用戶完成搜尋 137
8.3.1 用戶引導的產品定義與衡量 標準 137
8.3.2 搜尋前的引導——查詢詞 推薦 140
8.3.3 搜尋中的引導——查詢補全 143
8.3.4 搜尋後的引導——相關搜尋 145
8.3.5 效率提升與效果提升 145
8.3.6 用戶引導小結 149
8.4 小結 149
參考文獻 150
第9章 O2O場景下排序的特點 152
9.1 系統概述 154
9.2 線上排序服務 154
9.3 多層正交A/B測試 155
9.4 特徵獲取 155
9.5 離線調研系統 156
9.6 特徵工程 156
9.7 排序模型 157
9.8 場景化排序 160
9.9 小結 165
第 10章 推薦在O2O場景的套用 166
10.1 典型的O2O推薦場景 166
10.2 O2O推薦場景特點 167
10.2.1 O2O場景的地理位置因素 168
10.2.2 O2O場景的用戶歷史行為 168
10.2.3 O2O場景的實時推薦 169
10.3 美團推薦實踐——推薦框架 169
10.4 美團推薦實踐——推薦召回 170
10.4.1 基於協同過濾的召回 171
10.4.2 基於位置的召回 171
10.4.3 基於搜尋查詢的召回 172
10.4.4 基於圖的召回 172
10.4.5 基於實時用戶行為的召回 172
10.4.6 替補策略 172
10.5 美團推薦實踐——推薦排序 173
10.5.1 排序特徵 173
10.5.2 排序樣本 174
10.5.3 排序模型 175
10.6 推薦評價指標 176
參考文獻 176
第四部分 計算廣告
第 11章 O2O場景下的廣告行銷 178
11.1 O2O場景下的廣告業務特點 178
11.2 商戶、用戶和平台三者利益平衡 180
11.2.1 商戶效果感知 180
11.2.2 用戶體驗 181
11.2.3 平台收益 182
11.3 O2O廣告機制設計 183
11.3.1 廣告位設定 183
11.3.2 廣告召回機制 183
11.3.3 廣告排序機制 184
11.4 O2O推送廣告 187
11.5 O2O廣告系統工具 190
11.5.1 面向開發人員的系統工具 190
11.5.2 面向廣告主和運營人員的 工具 192
11.6 小結 194
參考文獻 194
第 12章 用戶偏好和損失建模 196
12.1 如何定義用戶偏好 196
12.1.1 什麼是用戶偏好 196
12.1.2 如何衡量用戶偏好 196
12.1.3 對不同POI 的偏好 197
12.1.4 用戶對 POI 偏好的衡量 197
12.2 廣告價值與偏好損失的兌換 198
12.2.1 最佳化目標 199
12.2.2 模型建模 199
12.3 Pairwise 模型學習 201
12.3.1 GBRank 202
12.3.2 RankNet 204
參考文獻 205
第五部分 深度學習
第 13章 深度學習概述 208
13.1 深度學習技術發展歷程 209
13.2 深度學習基礎結構 211
13.3 深度學習研究熱點 216
13.3.1 基於深度學習的生成式模型 216
13.3.2 深度強化學習 218
參考文獻 219
第 14章 深度學習在文本領域的套用 220
14.1 基於深度學習的文本匹配 221
14.2 基於深度學習的排序模型 231
14.2.1 排序模型簡介 231
14.2.2 深度學習排序模型的演進 232
14.2.3 美團的深度學習排序模型 嘗試 235
14.3 小結 237
參考文獻 237
第 15章 深度學習在計算機視覺中的 套用 238
15.1 基於深度學習的OCR 238
15.1.1 OCR技術發展歷程 239
15.1.2 基於深度學習的文字檢測 244
15.1.3 基於序列學習的文字識別 248
15.1.4 小結 251
15.2 基於深度學習的圖像智慧型審核 251
15.2.1 基於深度學習的水印檢測 252
15.2.2 明星臉識別 254
15.2.3 色情圖片檢測 257
15.2.4 場景分類 257
15.3 基於深度學習的圖像質量排序 259
15.3.1 圖像美學質量評價 260
15.3.2 面向點擊預測的圖像質量 評價 260
15.4 小結 263
參考文獻 264
第六部分 算法工程
第 16章 大規模機器學習 268
16.1 並行計算編程技術 268
16.1.1 向量化 269
16.1.2 多核並行OpenMP 270
16.1.3 GPU編程 272
16.1.4 多機並行MPI 273
16.1.5 並行編程技術小結 276
16.2 並行計算模型 276
16.2.1 BSP 277
16.2.2 SSP 279
16.2.3 ASP 280
16.2.4 參數伺服器 281
16.3 並行計算案例 284
16.3.1 XGBoost並行庫Rabit 284
16.3.2 MXNet並行庫PS-Lite 286
16.4 美團並行計算機器學習平台 287
參考文獻 289
第 17章 特徵工程和實驗平台 290
17.1 特徵平台 290
17.1.1 特徵生產 290
17.1.2 特徵上線 293
17.1.3 線上特徵監控 301
17.2 實驗管理平台 302
17.2.1 實驗平台概述 302
17.2.2 美團實驗平台——Gemini 304

相關詞條

熱門詞條

聯絡我們