Python數據抓取技術與實戰

基本信息,內容簡介,目錄信息,

基本信息

Python數據抓取技術與實戰
作 譯 者:潘慶和,趙星馳
出版時間:2016-08
千 字 數:410
版 次:01-01
頁 數:256
開 本:16開
I S B N :9787121298844

內容簡介

如何在大數據時代獲得實時的數據信息,分析挖掘、提取出有價值的信息,並以直觀清晰的圖形表示出關鍵的數量關係和概念,是一個值得研究的問題。本書通過數據抓取篇(如何獲得數據信息)、數據分析篇(分析挖掘,提取出有價值的信息)、數據可視化篇(以直觀清晰的圖形表示出關鍵的數量關係和概念)詳細描述數據抓取、分析、展示的整個流程,每一篇自成一體,可以單獨學習掌握。

目錄信息

第1章 Python基礎1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
11 Python安裝1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
12 安裝pip 6 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
13 如何查看幫助7 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
14 第一個程式10 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
15 檔案操作25 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
16 循環28 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
17 異常30 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
18 元組30 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
19 列表32 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
110 字典36 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
111 集合38 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
112 隨機數39 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
113 enumerate的使用40 !!!!!!!!!!!!!!!!!!!!!!!!!!
114 第二個例子41 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
第2章 字元串解析46 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
21 常用函式46 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
22 正則表達式50 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
23 BeautifulSoup 55 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
24 json結構62 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第3章 單機數據抓取77 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
31 單機順序抓取77 !!!!!!!!!!!!!!!!!!!!!!!!!!!
32 requests 107 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
33 並發和並行抓取117 !!!!!!!!!!!!!!!!!!!!!!!!!!
第4章 分散式數據抓取137 !!!!!!!!!!!!!!!!!!!!!!!!!!!
41 RPC的使用138 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
42 Celery系統145 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
第5章 全能的Selenium 159 !!!!!!!!!!!!!!!!!!!!!!!!!!
51 Selenium單機159 !!!!!!!!!!!!!!!!!!!!!!!!!!!
52 Selenium分散式抓取178 !!!!!!!!!!!!!!!!!!!!!!!!
53 Linux無圖形界面使用Selenium 188 !!!!!!!!!!!!!!!!!!!
第6章 神秘的Tor 191 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
61 抓取時IP封鎖的問題191 !!!!!!!!!!!!!!!!!!!!!!!!
62 Tor的安裝與使用192 !!!!!!!!!!!!!!!!!!!!!!!!!
63 Tor多執行緒197 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
64 Tor與Selenium結合205 !!!!!!!!!!!!!!!!!!!!!!!!
第7章 抓取常見問題210 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
71 Flash 210 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
72 桌面程式211 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
73 隨身碟213 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
74 二級三級頁面214 !!!!!!!!!!!!!!!!!!!!!!!!!!!
75 圖片的處理214 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
76 App數據抓取214 !!!!!!!!!!!!!!!!!!!!!!!!!!!
第8章 監控框架221 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
81 框架說明223 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
82 監控系統實例225 !!!!!!!!!!!!!!!!!!!!!!!!!!!
第9章 擁抱大數據229 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
91 Hadoop生態圈229 !!!!!!!!!!!!!!!!!!!!!!!!!!!
92 Cloudera環境搭建231

相關詞條

熱門詞條

聯絡我們