python網路爬蟲技術與實戰(2021年機械工業出版社出版的圖書)

內容簡介

本書是一本系統、全面地介紹Python網路爬蟲的實戰寶典。作者融合自己豐富的工程實踐經驗，緊密結合演示套用案例，內容覆蓋了幾乎所有網路爬蟲涉及的核心技術。在內容編排上，一步步地剖析算法背後的概念與原理，提供大量簡潔的代碼實現，助你從零基礎開始編程實現深度學習算法。全書按照學習爬蟲所涉及的核心技術從易到難，再到套用的順序分為14章。第1章介紹Python的安裝配置和基礎語法。第2章介紹爬蟲類型、抓取策略以及網路基礎知識。第3章介紹Python常用庫。第4章介紹正則表達式的語法、匹配規則。第5章講解PIL庫、Tesseract庫和TensorFlow庫的語法、類型和識別方法。第6章介紹抓包利器Fiddler。第7章介紹數據存儲。第8章介紹Scrapy爬蟲框架。第9章介紹多執行緒爬蟲。第10章介紹動態網頁爬蟲。第11章介紹分散式爬蟲。第12章介紹電商網站商品信息爬蟲項目。第13章介紹生活娛樂點評類信息爬蟲。第14章介紹圖片信息類爬蟲項目。

圖書目錄

前言

第1章　Python環境搭建及基礎學習1

1.1　Python 3.6的安裝與配置1

1.1.1　Windows下的安裝1

1.1.2　Linux下的安裝5

1.1.3　macOS下的安裝6

1.2　IDE工具：PyCharm的安裝7

1.3　基礎語法11

1.3.1　個Python程式11

1.3.2　Python命名規範13

1.3.3　行和縮進15

1.3.4　注釋和續行15

1.3.5　Python輸出16

1.4　字元串18

1.4.1　字元串運算符18

1.4.2　字元串內置函式19

1.5　數據結構22

1.5.1　列表22

1.5.2　元組25

1.5.3　集合27

1.5.4　字典29

1.6　控制語句31

1.6.1　條件表達式31

1.6.2　選擇結構32

1.6.3　循環結構33

1.7　函式、模組和包36

1.7.1　函式36

1.7.2　模組40

1.7.3　包42

1.8　檔案的讀寫操作 45

1.8.1　檔案讀寫步驟與打開模式46

1.8.2　檔案的基本操作48

1.8.3　檔案寫入操作52

1.9　面向對象53

1.9.1　類和對象54

1.9.2　封裝性58

1.9.3　繼承性59

1.9.4　多態性60

python網路爬蟲技術與實戰(2021年機械工業出版社出版的圖書)

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條