python網路爬蟲從入門到實踐第2版

內容簡介

使用Python編寫網路爬蟲程式獲取網際網路上的大數據是當前的熱門專題。本書內容包括三部分：基礎部分、進階部分和項目實踐。基礎部分（第1~7章）主要介紹爬蟲的三個步驟——獲取網頁、解析網頁和存儲數據，並通過諸多示例的講解，讓讀者能夠從基礎內容開始系統性地學習爬蟲技術，並在實踐中提升Python爬蟲水平。進階部分（第8~13章）包括多執行緒的並發和並行爬蟲、分散式爬蟲、更換IP等，幫助讀者進一步提升爬蟲水平。項目實踐部分（第14~17章）使用本書介紹的爬蟲技術對幾個真實的網站進行抓取，讓讀者能在讀完本書後根據自己的需求寫出爬蟲程式。

圖書目錄

前言

第1章網路爬蟲入門1

1.1 為什麼要學網路爬蟲2

1.1.1 網路爬蟲能帶來什麼好處2

1.1.2 能從網路上爬取什麼數據3

1.1.3 應不應該學爬蟲3

1.2 網路爬蟲是否合法3

1.2.1 Robots協定4

1.2.2 網路爬蟲的約束5

1.3 網路爬蟲的基本議題6

1.3.1 Python爬蟲的流程7

1.3.2 三個流程的技術實現7

第2章編寫個網路爬蟲9

2.1 搭建Python平台10

2.1.1 Python的安裝10

2.1.2 使用pip安裝第三方庫12

2.1.3 使用編輯器Jupyter 編程13

2.1.4 使用編輯器Pycharm編程15

2.2 Python 使用入門18

2.2.1 基本命令18

2.2.2 數據類型19

2.2.3 條件語句和循環語句21

2.2.4 函式23

2.2.5 面向對象編程24

2.2.6 錯誤處理28

2.3 編寫個簡單的爬蟲29

2.3.1 步：獲取頁面29

2.3.2 第二步：提取需要的數據30

2.3.3 第三步：存儲數據32

2.4 Python實踐：基礎鞏固33

2.4.1 Python基礎試題34

2.4.2 參考答案35

2.4.3 自我實踐題38

第3章靜態網頁抓取39

3.1 安裝Requests40

3.2 獲取回響內容40

3.3 定製Requests41

3.3.1 傳遞URL參數41

3.3.2 定製請求頭42

3.3.3 傳送POST請求43

3.3.4 逾時44

3.4 Requests爬蟲實踐：TOP250電影數據44

3.4.1 網站分析45

python網路爬蟲從入門到實踐第2版

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條