玩轉Python網路爬蟲

詳細介紹

玩轉Python網路爬蟲

作者：黃永祥
　　定價：69元
印次：1-1
ISBN：9787302503286
出版日期：2018.08.01
印刷日期：2018.10.17

圖書簡介

本書站在初學者的角度，從原理到實踐，循序漸進地講述了使用Python開發網路爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網路爬蟲所需的基礎知識，分別是網站分析、數據抓取、數據清洗和數據入庫。網站分析講述如何使用Chrome和Fiddler抓包工具對網路做全面分析；數據抓取介紹了Python爬蟲模組Urllib和Requests的基礎知識；數據清洗主要介紹字元串操作、正則和Beautiful Soup的使用；數據入庫分別講述了MySQL和MongoDB的操作，通過ORM框架SQLAlchemy實現數據持久化，實現企業級開發。實戰篇深入講解了分散式爬蟲、爬蟲軟體開發與套用、12306搶票程式和微博爬取，所舉示例均來自於開發實踐，可幫助讀者快速提升技能，開發實際項目。

作者介紹

黃永祥，信息管理與信息系統專業學士，曾從事過系統開發和自動化開發，精通B/S和C/S自動化測試技術，多年網路爬蟲開發經驗，對反爬蟲機制有獨到的見解，精通Flask、Django等Web框架並有豐富的網站開發經驗。曾就職於廣州易點科技有限公司，擔任Python開發工程師，目前就職於廣東數據集成有限公司。熱愛分享和新技術的探索，在CSDN上發表多篇Python技術文章。

圖書目錄

第1章理解網路爬蟲 1

1.1 爬蟲的定義 1

1.2 爬蟲的類型 2

1.3 爬蟲的原理 3

1.4 爬蟲的搜尋策略 5

1.5 反爬蟲技術及解決方案 6

1.6 本章小結 8

第2章爬蟲開發基礎 9

2.1 HTTP與HTTPS 9

2.2 請求頭 11

2.3 Cookies 13

2.4 HTML 14

2.5 JavaScript 16

2.6 JSON 18

2.7 Ajax 19

2.8 本章小結 20

第3章 Chrome分析網站 21

3.1 Chrome開發工具 21

3.2 Elements標籤 22

玩轉Python網路爬蟲

基本介紹

詳細介紹

圖書簡介

作者介紹

圖書目錄

相關詞條

熱門詞條