Python網路爬蟲技術與實戰(趙國生所著書籍)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《Python網路爬蟲技術與實戰》是由2021年1月機械工業出版社出版的圖書。

基本介紹

  • 中文名:Python網路爬蟲技術與實戰
  • 作者:趙國生
  • 出版社:機械工業出版社
  • 出版時間:2021年1月
  • ISBN:9787111674115 
作品簡介,作品目錄,

作品簡介

本書是一本系統、全面地介紹Python網路爬蟲的實戰寶典。作者融合自己豐富的工程實踐經驗,緊密結合演示套用案例,內容覆蓋了幾乎所有網路爬蟲涉及的核心技術。在內容編排上,一步步地剖析算法背後的概念與原理,提供大量簡潔的代碼實現,助你從零基礎開始編程實現深度學習算法。全書按照學習爬蟲所涉及的核心技術從易到難,再到套用的順序分為14章。第1章介紹Python的安裝配置和基礎語法。第2章介紹爬蟲類型、抓取策略以及網路基礎知識。第3章介紹Python常用庫。第4章介紹正則表達式的語法、匹配規則。第5章講解PIL庫、Tesseract庫和TensorFlow庫的語法、類型和識別方法。第6章介紹抓包利器Fiddler。第7章介紹數據存儲。第8章介紹Scrapy爬蟲框架。第9章介紹多執行緒爬蟲。第10章介紹動態網頁爬蟲。第11章介紹分散式爬蟲。第12章介紹電商網站商品信息爬蟲項目。第13章介紹生活娛樂點評類信息爬蟲。第14章介紹圖片信息類爬蟲項目。

作品目錄

前言
第1章 Python環境搭建及基礎學習
1.1 Python 3.6的安裝與配置
1.2 IDE工具:PyCharm的安裝
1.3 基礎語法
1.4 字元串
1.5 數據結構
1.6 控制語句
1.7 函式、模組和包
1.8 檔案的讀寫操作
1.9 面向對象
1.10 本章小結
練習題
第2章 爬蟲原理和網路基礎
2.1 爬蟲是什麼
2.2 爬蟲的意義
2.3 爬蟲的原理
2.4 爬蟲技術的類型
2.5 爬蟲抓取策略
2.6 反爬蟲和反反爬蟲
2.7 網路基礎
2.8 本章小結
練習題
第3章 Python常用庫
3.1 Python庫的介紹
3.2 urllib庫
3.3 request庫
3.4 lxml庫
3.5 Beautiful Soup庫
3.6 實戰案例
3.7 本章小結
練習題
第4章 正則表達式
4.1 概念介紹
4.2 正則表達式語法
4.3 匹配規則
4.4 re模組常用函式
4.5 本章小結
練習題
第5章 驗證碼
5.1 PIL庫
5.2 Tesseract庫
5.3 TensorFlow庫
5.4 4種驗證碼的解決思路
5.5 OCR處理驗證碼
5.6 實戰案例
5.7 本章小結
練習題
第6章 抓包利器Fiddler
6.1 Fiddler簡介
6.2 Fiddler的安裝和配置
6.3 Fiddler捕獲會話
6.4 QuickExec命令行的使用
6.5 Fiddler斷點功能
6.6 Fiddler的實用工具
6.7 實戰案例
6.8 本章小結
練習題
第7章 數據存儲
7.1 數據的基本存儲
7.2 數據存儲至MySQL資料庫
7.3 數據存儲至MongoDB資料庫
7.4 數據存儲至XML
7.5 常見數據存儲方式的比較
7.6 本章小結
練習題
第8章 Scrapy爬蟲框架
8.1 Scrapy框架介紹
8.2 Scrapy框架詳解
8.3 Scrapy框架中的Selector
8.4 Beautiful Soup庫的使用
8.5 CrawlSpider的使用
8.6 Scrapy Shell的使用
8.7 Scrapyrt的使用
8.8 Scrapy對接Selenium
8.9 實戰案例
8.10 本章小結
練習題
第9章 多執行緒爬蟲
9.1 多執行緒和Threading模組
9.2 使用Thread類創建實例
9.3 多執行緒方法的使用
9.4 Queue執行緒安全佇列
9.5 實戰案例
9.6 本章小結
練習題
第10章 動態網頁爬蟲
10.1 瀏覽器開發者工具
10.2 異步載入技術
10.3 表單互動與模擬登錄
10.4 Selenium模擬瀏覽器
10.5 實戰案例
10.6 本章小結
練習題
第11章 分散式爬蟲
11.1 分散式爬蟲概述
11.2 Scrapy-redis分散式組件
11.3 redis資料庫
11.4 Scrapy-redis源碼分析
11.5 通過scrapy_redis實現分散式爬蟲
11.6 實戰案例
11.7 本章小結
練習題
第12章 電商網站商品信息爬蟲項目
12.1 商品信息爬蟲功能分析
12.2 商品信息爬蟲實現思路
12.3 電商網站商品信息編寫實戰
12.4 pyquery解析電商網站商品信息
12.5 運行代碼
12.6 本章小結
練習題
第13章 生活娛樂點評類信息爬蟲項目
13.1 功能分析
13.2 請求-回響關係
13.3 請求頭和請求體
13.4 通過Selenium模擬瀏覽器抓取
13.5 實戰演練Scrapy框架實例
13.6 調試與運行
13.7 本章小結
練習題
第14章 圖片信息類爬蟲項目
14.1 功能分析
14.2 實現思路
14.3 程式執行
14.4 實戰演練圖片驗證碼
14.5 調試運行
14.6 本章小結
練習題
練習題答案

相關詞條

熱門詞條

聯絡我們