爬蟲實戰:從數據到產品

書籍信息,內容簡介,圖書目錄,

書籍信息

作譯者:賀思聰
出版時間:2019-03千 字 數:290版次:01-01頁 數:244
開本:16開裝幀:I S B N :9787121355080
換版:

內容簡介

本書從多個數據項目實例出發,介紹爬蟲、反爬蟲的各種案例,使讀者了解到數據抓取和分析的完整過程。書中案例的難度由淺入深,以作者原創的代碼為主,不藉助現成的框架,強調在數據採集過程中的發散思維,總結攻克反爬蟲的思維模式,實現以低成本的方式得到想要的數據的願望。最後,用一個“愛飛狗”的例子,為讀者展示如何從0到1地開發一個大數據產品。

圖書目錄

第1章 基礎知識 1
1.1 什麼是爬蟲 1
1.2 數據獲取渠道 2
1.3 抓包分析工具 4
1.4 爬蟲和反爬蟲的鬥爭 5
1.5 數據處理、分析和可視化 20
1.6 延深閱讀 21
第2章 基於位置信息的爬蟲Ⅰ 23
2.1 背景及目標 23
2.2 爬蟲原理 24
2.3 數據來源分析 26
2.4 簡單的矩形區域爬取方式 38
2.5 高級區域爬取方式 46
2.6 坐標轉換 49
2.7 存儲數據的方式 49
2.8 數據導入 51
2.9 基本數據分析 52
2.10 地圖可視化 56
2.11 軌跡可視化 58
2.12 總結 60
第3章 基於位置信息的爬蟲Ⅱ 62
3.1 背景及目標 62
3.2 爬蟲原理 62
3.3 最佳化方案一 71
3.4 最佳化方案二 75
3.5 最佳化方案三 82
3.6 導入數據到資料庫 97
3.7 基本數據分析及可視化 100
3.8 總結 117
第4章 網站信息爬取及可視化 118
4.1 背景及目標 118
4.2 網站API分析 118
4.3 數據爬取 122
4.4 數據導入 129
4.5 數據分析及可視化 133
4.6 總結 173
第5章 基於逆向分析小程式的爬蟲 174
5.1 背景及目標 174
5.2 數據來源分析 176
5.3 數據爬取方案 177
5.4 轉換數據格式 195
5.5 總結 196
第6章 從數據到產品 197
6.1 從一張機票說起 197
6.2 從價值探索到交付落地 201
6.3 數據爬取 203
6.4 爬蟲架構設計 203
6.5 發現數據的價值 211
6.6 創新的不確定性 223
6.7 產品設計 226
6.8 產品交付 235
6.9 總結 236

相關詞條

熱門詞條

聯絡我們