Python數據分析與挖掘(微課視頻版)

Python數據分析與挖掘(微課視頻版)

《Python數據分析與挖掘(微課視頻版)》是2023年清華大學出版社出版的圖書,作者是王麗麗、戎麗霞、於學斗、鄭文艷、蔣勇、裴霞。

基本介紹

  • 中文名:Python數據分析與挖掘(微課視頻版)
  • 作者:王麗麗、戎麗霞、於學斗、鄭文艷、蔣勇、裴霞
  • 出版時間:2023年5月1日
  • 出版社:清華大學出版社
  • ISBN:9787302631873 
  • 定價:59.80 元
內容簡介,圖書目錄,

內容簡介

本書在介紹Python語言基本知識的基礎上,著重介紹了Python語言在數據獲取、數據分析與數據挖掘等方面的套用。本書設定一個實戰項目貫穿全書內容,每章引導讀者綜合運用本章知識點解決或改進本項目的某些任務,從數據的獲取、處理、分析、可視化到知識的挖掘,逐步完成一個數據分析與挖掘項目。這是一本適應新工科、套用型人才培養的數據分析與挖掘的案例式圖書。 本書共9章,包括Python語言概述、Python編程基礎、Python爬蟲技術、科學計算庫(Numpy)、數據分析處理庫(Pandas)、數據展示庫(Matplotlib)、數據挖掘基礎、Scikitlearn數據挖掘實戰、初識深度學習等內容。本書體系完整,重點突出,資源豐富。

圖書目錄

目錄
第1章Python語言概述1
1.1Python簡介1
1.1.1Python語言的特點2
1.1.2Python語言的套用2
1.2Python開發工具3
1.2.1Python代碼編輯器3
1.2.2Python集成開發環境3
1.3Python編程規範4
1.4使用Spyder創建 Python 程式5
1.4.1Anaconda5
1.4.2標準庫、擴展庫的安裝和升級7
1.4.3標準庫、擴展庫對象的導入7
1.4.4編寫第一個Python程式8
1.5綜合實戰項目介紹10
1.6本章知識要點11
1.7習題11
第2章Python編程基礎12
2.1變數及數據類型14
2.1.1數字14
2.1.2字元串14
2.1.3列表、元組、字典、集合15
2.2運算符、表達式和內置函式16
2.3列表20
2.3.1列表的創建20
2.3.2列表的基本操作21
2.3.3切片操作24
2.3.4列表推導式24
2.4元組26
2.4.1元組的創建26
2.4.2元組的基本操作26
2.4.3序列解包27
2.4.4生成器表達式27
2.5字典28
2.5.1字典的創建28
2.5.2字典的基本操作28
2.5.3字典推導式30
2.6集合31
2.6.1集合的創建31
2.6.2集合的基本操作31
2.6.3集合的運算32
2.6.4集合推導式33
2.7字元串34
2.7.1字元串的格式化34
2.7.2字元串的常用方法36
2.8選擇結構、循環結構39
2.8.1選擇結構39
2.8.2循環結構41
2.9函式43
2.9.1函式的定義與調用44
2.9.2函式的參數傳遞45
2.9.3lambda表達式47
2.10本章知識要點48
2.11習題48
第3章Python爬蟲技術50
3.1案例導入51
3.2認識爬蟲51
3.2.1爬蟲的基本概念51
3.2.2爬蟲的工作流程53
3.2.3爬蟲的合法性與robots協定53
3.3網頁下載器54
3.3.1HTTP的請求信息54
3.3.2Requests庫的安裝56
3.3.3Requests庫的請求和回響56
3.4網頁解析器59
3.4.1lxml庫的安裝59
3.4.2XPath常用語法60
3.4.3lxml庫套用實例62
3.5案例實現63
3.6多執行緒數據獲取70
3.7本章知識要點72
3.8習題73
第4章科學計算庫(Numpy)74
4.1數組對象ndarray75
4.1.1數組的創建75
4.1.2數組的屬性77
4.1.3索引與切片77
4.2ndarray數組的操作78
4.2.1數組元素的修改78
4.2.2數組形狀的修改79
4.2.3數組的排序80
4.2.4數組的合併與分割81
4.3ndarray數組的運算82
4.3.1數組與標量的運算82
4.3.2數組與數組的運算83
4.3.3統計函式84
4.3.4布爾運算85
4.3.5分段函式85
4.3.6數組的集合運算86
4.4矩陣的常用操作87
4.4.1矩陣的生成87
4.4.2矩陣的統計方法87
4.4.3矩陣的轉置88
4.4.4計算逆矩陣89
4.4.5計算方差、協方差及相關係數矩陣89
4.5Numpy套用案例90
4.5.1案例說明90
4.5.2案例分析91
4.5.3線性插值91
4.5.4實現代碼91
4.6本章知識要點93
4.7習題93
第5章數據分析處理庫(Pandas)95
5.1案例導入97
5.2Pandas常用數據類型97
5.2.1Series類型97
5.2.2DataFrame類型101
5.3讀寫外部數據102
5.3.1CSV檔案的讀取102
5.3.2CSV檔案的寫入104
5.4數據查看與篩選105
5.5統計分析109
5.6數據預處理111
5.6.1重複值處理112
5.6.2缺失值處理113
5.6.3異常值處理117
5.6.4類型轉換120
5.6.5標準化數據121
5.6.6數據合併與連線122
5.7排序與分組125
5.7.1排序125
5.7.2分組與匯總127
5.8透視表與交叉表129
5.8.1透視表129
5.8.2交叉表130
5.9案例實現131
5.10本章知識要點136
5.11習題136
第6章數據展示庫(Matplotlib)138
6.1案例導入139
6.2Matplotlib簡介140
6.3使用Matplotlib庫繪製各種圖形140
6.3.1繪製折線圖140
6.3.2繪製柱狀圖142
6.3.3繪製散點圖143
6.3.4繪製餅圖144
6.3.5繪製箱線圖146
6.3.6繪製六邊形分箱圖148
6.4切分繪圖區域149
6.5設定圖例樣式151
6.6保存繪圖結果153
6.7詞雲圖154
6.8案例實現156
6.9本章知識要點158
6.10習題159
第7章數據挖掘基礎160
7.1數據挖掘的基本概念161
7.1.1數據挖掘的常用術語162
7.1.2數據挖掘的流程164
7.2Scikitlearn簡介165
7.2.1Scikitlearn常用方法165
7.2.2Scikitlearn常用數據集170
7.3本章知識要點172
7.4習題173
第8章Scikitlearn數據挖掘實戰174
8.1構建並評估回歸模型175
8.1.1案例導入——房屋租金回歸分析175
8.1.2線性回歸算法原理176
8.1.3線性回歸算法評估177
8.1.4Scikitlearn實現線性回歸177
8.1.5案例實現180
8.2構建並評估分類模型186
8.2.1案例導入——鳶尾花分類186
8.2.2KNN算法原理187
8.2.3決策樹算法原理188
8.2.4分類算法評估190
8.2.5Scikitlearn實現KNN和決策樹分類191
8.2.6案例實現194
8.3構建並評估聚類模型198
8.3.1案例導入——客戶聚類198
8.3.2Kmeans聚類算法原理199
8.3.3DBSCAN算法原理200
8.3.4聚類算法評估201
8.3.5Scikitlearn實現Kmeans和DBSCAN聚類201
8.3.6案例實現207
8.4構建並評估關聯規則模型212
8.4.1案例導入——超市購物籃分析212
8.4.2Apriori算法原理213
8.4.3關聯規則的評價指標215
8.4.4案例實現216
8.5本章知識要點222
8.6習題223
第9章初識深度學習225
9.1案例導入226
9.2卷積神經網路228
9.2.1人工神經網路228
9.2.2卷積230
9.2.3池化231
9.2.4激活函式231
9.2.5損失函式233
9.3經典卷積神經網路模型234
9.3.1LeNet234
9.3.2AlexNet235
9.3.3VGGNet235
9.3.4GoogLeNet236
9.3.5ResNet237
9.3.6DenseNet239
9.4Keras框架及其套用示例240
9.4.1TensorFlow的安裝240
9.4.2Keras的安裝243
9.4.3Keras常用模組及套用示例244
9.5案例實現250
9.6本章知識要點256
9.7習題257
附錄A常用Python標準庫和擴展庫及其方法258
附錄B綜合實訓項目參考265
參考文獻267

相關詞條

熱門詞條

聯絡我們