Python數據爬取技術與實戰手冊

內容簡介

海量數據的產生和大數據的高價值利用，讓數據爬取變得日益重要。本書為讀者介紹了如何使用Python編寫網路爬蟲批量採集網際網路數據，如何處理與保存採集到的信息，以及如何從眾多紛亂的數據中提取到真正有用的信息。本書末尾介紹了幾種常用的數據可視化工具。讓讀者能夠從頭到尾完整地完成網路數據的採集與分析項目。

本書理論與實例並重，既能夠幫助數據從業者快速提升工作效率，又可以幫助大數據愛好者用網路爬蟲方便生活。

圖書目錄

第1章最佳拍檔：網路爬蟲與Python語言

1.1 什麼是網路爬蟲 1

1.1.1 網路爬蟲的定義 2

1.1.2 網路爬蟲的工作流程 2

1.1.3 網路爬蟲的分類 3

1.1.4 為什麼選擇用Python編寫網路爬蟲 4

1.1.5 編寫爬蟲的注意事項 4

1.2 Python環境配置 5

1.2.1 Python的安裝 5

1.2.2 Python第三方庫的安裝 6

【示例1-1】使用包管理器安裝科學計算庫numpy 6

【示例1-2】原始碼方式安裝xlrd庫（使用setup.py檔案） 7

【示例1-3】原始碼方式安裝xlrd庫（使用whl檔案） 8

1.2.3 Python開發工具的選擇 8

【示例1-4】將文本編輯器配置成Python開發工具（以Notepad++為例） 12

1.3 Python基本語法 13

1.3.1 Python書寫規則 13

1.3.2 Python基本數據類型 18

【示例1-5】以列表a = ['a','a','b','c','d','d','e']為例講解List的基本操作 21

【示例1-6】以列表a = [1,2,3,4,5,6,7,8]為例講解數據型列表的屬性分析 23

【示例1-7】以字典a為例，講解字典的基本操作 25

1.3.3 Python獨有數據生成方式：推導式 29

1.3.4 函式 30

【示例1-8】局部變數與全局變數重名的運行結果與解決方案 31

1.3.5 條件與循環 34

1.3.6 類與對象 35

【示例1-9】請輸出學生信息中某學生的班級、姓名和總分數 35

1.3.7 Python 2代碼轉為Python 3代碼 36

【示例1-10】以檔案test.py為例，介紹Python 2代碼到Python 3代碼的轉化 37

第2章應知應會：網路爬蟲基本知識

2.1 網頁的構成 38

Python數據爬取技術與實戰手冊

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條