Python網路爬蟲技術手冊：基礎·實戰·強化

內容簡介

《Python網路爬蟲技術手冊：基礎·實戰·強化》是“計算機科學與技術手冊系列”圖書之一，該系列圖書內容全面，以理論聯繫實際、能學到並做到為宗旨，以技術為核心，以案例為輔助，引領讀者全面學習基礎技術、代碼編寫方法和具體套用項目，旨在為想要進入相應領域或者已經在該領域深耕多年的技術人員提供新而全的技術性內容及案例。

本書是一本側重編程基礎+實踐的Python爬蟲圖書，從基礎、實戰、強化三個層次循序漸進地介紹了網路爬蟲入門必備知識：基礎篇主要講解網路爬蟲的基礎內容；實戰篇主要講解目前套用最廣的各類資料庫爬蟲相關技術和案例；強化篇結合資料庫、數據分析、可視化等進行大型項目綜合實戰練習。本書內容充實，給讀者提供了較為豐富全面的技術支持和案例強化，通過各種示例將學習與套用相結合，打造輕鬆學習、零壓力學習的環境，通過案例對所學知識進行綜合套用，通過開發實際項目將網路爬蟲的各項技能套用到實際工作中，幫助讀者實現學以致用，快速掌握網路爬蟲的各項技能。

本書提供豐富的資源，包含109個實例、13個實戰案例、2個套用強化項目，力求為讀者打造一本基礎+實戰+強化一體化的、精彩的Python網路爬蟲圖書。

本書不僅適合初學者、數據採集相關技術人員、對數據感興趣的人員，而且適合從事其他崗位想掌握一定的數據採集能力的職場人員閱讀參考。

圖書目錄

第1篇　基礎篇

第1章爬蟲基礎

1.1 什麼是網路爬蟲 2

1.2 網路爬蟲的分類 3

1.3 網路爬蟲的原理 3

1.4 HTTP基本原理 3

1.4.1 什麼是URL 3

1.4.2 HTTP協定 4

1.4.3 HTTP與Web伺服器 4

1.4.4 瀏覽器中的請求和回響 5

1.5 網頁的基本結構 6

1.5.1 了解HTML 6

1.5.2 了解CSS 6

1.5.3 了解JavaScript 8

第2章搭建網路爬蟲開發環境

2.1 Anaconda的安裝 10

2.2 下載與安裝PyCharm 13

2.3 配置PyCharm 16

2.4 測試PyCharm 18

第3章網路請求urllib模組

3.1 了解urllib 20

3.2 傳送網路請求 20

3.2.1 傳送GET請求 21

實例3.1 演示常用的方法與屬性 21

3.2.2 傳送POST請求 22

實例3.2 傳送POST請求 22

3.2.3 請求逾時 22

實例3.3 處理網路逾時 23

3.2.4 設定請求頭 23

實例3.4 設定請求頭 24

3.2.5 獲取與設定Cookie 25

Python網路爬蟲技術手冊：基礎·實戰·強化

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條