從零開始學Scrapy網路爬蟲（視頻教學版）

內容簡介

本書從零開始，循序漸進地介紹了目前最流行的網路爬蟲框架Scrapy。即使你沒有任何編程基礎，閱讀本書也不會有壓力，因為書中有針對性地介紹了Python編程技術。另外，本書在講解過程中以案例為導向，通過對案例的不斷疊代、最佳化，讓讀者加深對知識的理解，並通過14個項目案例，提高讀者解決實際問題的能力。

本書共13章。其中，第1～4章為基礎篇，介紹了Python基礎、網路爬蟲基礎、Scrapy框架及基本的爬蟲功能。第5～10章為進階篇，介紹了如何將爬蟲數據存儲於MySQL、MongoDB和Redis資料庫中；如何實現異步AJAX數據的爬取；如何使用Selenium和Splash實現動態網站的爬取；如何實現模擬登錄功能；如何突破反爬蟲技術，以及如何實現檔案和圖片的下載。第11~13章為高級篇，介紹了使用Scrapy-Redis實現分散式爬蟲；使用Scrapyd和Docker部署分散式爬蟲；使用Gerapy管理分散式爬蟲，並實現了一個搶票軟體的綜合項目。

本書適合爬蟲初學者、愛好者及高校相關專業的學生閱讀，也適合數據爬蟲工程師作為參考讀物，同時還適合各大院校和培訓機構作為教材使用。

圖書目錄

第1篇基礎篇

第1章 Python基礎 2

1.1 Python簡介 2

1.1.1 Python簡史 2

1.1.2 搭建Python環境 3

1.1.3 安裝PyCharm集成開發環境 6

1.2 Python基本語法 7

1.2.1 基本數據類型和運算 7

1.2.2 運算符和表達式 8

1.2.3 條件判斷語句 9

1.2.4 循環語句 10

1.2.5 字元串 12

1.3 Python內置數據結構 14

1.3.1 列表 15

1.3.2 字典 16

1.3.3 元組 17

1.3.4 遍歷對象集合 17

1.4 Python模組化設計 18

1.4.1 函式 18

1.4.2 疊代器（iterator） 20

1.4.3 生成器（Generator） 20

1.4.4 類和對象 22

1.4.5 檔案與異常 23

1.5 本章小結 25

第2章網路爬蟲基礎 26

2.1 HTTP基本原理 26

2.1.1 URL介紹 27

2.1.2 HTTP和HTTPS協定 27

2.1.3 HTTP請求（Request） 27

2.1.4 HTTP回響（Response） 30

2.2 網頁基礎 32

2.2.1 HTML文檔 33

2.2.2 網頁的結構 33

2.2.3 節點樹及節點之間的關係 34

2.3 使用XPath提取網頁信息 36

從零開始學Scrapy網路爬蟲（視頻教學版）

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條