內容簡介
本書從邏輯上可分為兩大部分。 第一部分是Python編程基礎(第1~4章),介紹了Python環境搭建、Python基礎語法、控制語句、函式、面向對象編程等。第1章旨在讓讀者從全局把握Python,了解利用Python進行智慧型數據分析的優勢,並詳細介紹了Python環境搭建與配置,同時還對兩個常用集成開發環境做了詳細介紹。第2章先對Python固定語法做了介紹,包括編碼聲明、注釋、縮進等;而後介紹了Python常見的數據類型,包括str、list、tuple、dict、set等;還介紹了Python常用運算符,包括算術運算符、邏輯運算符、成員運算符、位運算符等。第3章主要對控制語句做了詳細介紹,包括條件語句和循環語句,同時還介紹了和條件語句類似的異常處理try-except-else語句。第4章主要介紹了Python的內置函式、自定義函式、面向對象編程以及第三方庫的安裝與使用方法。 第二部分是數據分析編程(第5~9章),主要對數據分析中常用的第三方庫做了詳細介紹,強調在Python中對應函式的使用方法及其結果的解釋說明。內容涵蓋數值分析庫NumPy,數據處理庫pandas,繪圖庫Matplotlib、Seaborn、Bokeh,機器學習與數據分析建模庫scikit-learn。這一部分涉及數據讀取、數據預處理、模型構建、模型評價、結果可視化,幾乎涵蓋了整個數據分析過程,充分而又詳細地說明了Python數據分析的常用操作,相信在本書的指導下,讀者能夠從零開始快速數據入門分析。 李明江 資深大數據專家,貴州省計算機學會常務理事,黔南州大數據專家委員會委員,黔南州計算機學會會長,黔南州教育信息化建設專家庫專家,黔南民族師範學院計算機與信息學院院長,全國高校大數據教育聯盟理事。主持過多項省廳級科研項目,並在《計算機套用研究》《科技通報》上發表過多篇大數據分析與數據挖掘相關技術的研究論文,著有《數據挖掘的套用與實踐:案例與探析》《計算機網路技術與套用》等。 張良均 資深大數據挖掘與分析專家、模式識別專家、AI技術專家。有10餘年大數據挖掘與分析經驗,擅長Python、R、Hadoop、Matlab等技術實現的數據挖掘與分析,對機器學習等AI技術驅動的數據分析也有深入研究。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗非常豐富。華南師範大學、中南財經政...(展開全部) 李明江 資深大數據專家,貴州省計算機學會常務理事,黔南州大數據專家委員會委員,黔南州計算機學會會長,黔南州教育信息化建設專家庫專家,黔南民族師範學院計算機與信息學院院長,全國高校大數據教育聯盟理事。主持過多項省廳級科研項目,並在《計算機套用研究》《科技通報》上發表過多篇大數據分析與數據挖掘相關技術的研究論文,著有《數據挖掘的套用與實踐:案例與探析》《計算機網路技術與套用》等。
圖書目錄
前言
第1章 Python概述 1
1.1 Python語言介紹 1
1.1.1 Python的發展史 1
1.1.2 Python特性 2
1.1.3 Python套用領域 3
1.1.4 Python機器學習優勢 6
1.2 Python環境配置 8
1.2.1 Python 2還是Python 3 8
1.2.2 Anaconda簡介 8
1.2.3 安裝Anaconda 3 9
1.3 Python的解釋器與IDE 12
1.3.1 Python的解釋器 13
1.3.2 Python各IDE比較 13
1.3.3 PyCharm的安裝與使用 16
1.3.4 Jupyter Notebook的使用 26
小結 32
課後習題 33
第2章 Python基礎知識 34
2.1 固定語法 34
2.1.1 聲明與注釋 34
2.1.2 縮進與多行語句 36
2.1.3 保留字元與賦值 38
2.2 運算符 40
2.2.1 算術運算符 40
2.2.2 賦值運算符 41
2.2.3 比較運算符 43
2.2.4 邏輯運算符 44
2.2.5 按位運算符 44
2.2.6 身份運算符 45
2.2.7 成員運算符 46
2.2.8 運算符優先權 47
2.3 數據類型 48
2.3.1 基礎數據類型 48
2.3.2 複合數據類型 55
2.4 Python I/O 63
2.4.1 input與print 64
2.4.2 檔案I/O 67
小結 70
課後習題 70
第3章 控制語句 72
3.1 條件語句 72
3.1.1 if、elif與else 73
3.1.2 try、except與else 76
3.2 循環語句 80
3.2.1 for 81
3.2.2 while 83
3.2.3 break、continue與pass 85
3.2.4 列表推導式 89
小結 91
課後習題 91
第4章 函式與對象 94
4.1 函式 94
4.1.1 內置函式 94
4.1.2 自定義函式 101
4.1.3 匿名函式 107
4.2 對象 109
4.2.1 面向對象簡介 109
4.2.2 屬性與方法 110
4.2.3 裝飾器 116
4.2.4 繼承和多態 119
4.3 Python常用庫安裝 126
4.3.1 第三方庫安裝 126
4.3.2 第三方庫導入 130
4.3.3 第三方庫創建 131
小結 132
課後習題 133
第5章 NumPy數值計算 135
5.1 ndarray創建與索引 135
5.1.1 創建ndarray對象 135
5.1.2 ndarray的索引與切片 142
5.2 ndarray的基礎操作 145
5.2.1 變換ndarray的形態 145
5.2.2 排序與搜尋 151
5.2.3 字元串操作 156
5.3 ufunc 159
5.3.1 ufunc的廣播機制 159
5.3.2 常用ufunc 160
5.4 matrix與線性代數 169
5.4.1 創建NumPy矩陣 169
5.4.2 矩陣的屬性和基本運算 170
5.4.3 線性代數運算 172
5.5 NumPy檔案讀寫 175
5.5.1 二進制檔案讀寫 175
5.5.2 檔案列表形式數據讀寫 178
小結 180
課後習題 180
第6章 pandas基礎 182
6.1 pandas常用類 182
6.1.1 Series 182
6.1.2 DataFrame 187
6.1.3 Index 191
6.2 DataFrame基礎操作 193
6.2.1 索引 193
6.2.2 排序 201
6.2.3 合併 204
6.3 其他數據類型操作 210
6.3.1 時間操作 210
6.3.2 文本操作 220
6.3.3 category操作 223
小結 227
課後習題 227
作者簡介
張良均 資深大數據挖掘與分析專家、模式識別專家、AI技術專家。有10餘年大數據挖掘與分析經驗,擅長Python、R、Hadoop、Matlab等技術實現的數據挖掘與分析,對機器學習等AI技術驅動的數據分析也有深入研究。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗非常豐富。華南師範大學、中南財經政法大學、廣東工業大學、西安理工大學、廣西科技大學、重慶交通大學、桂林電子科技大學等校外碩導。撰寫了《Python數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》《數據挖掘:實用案例分析》《Hadoop大數據分析與挖掘實戰》等多部暢銷書,累計銷量近20萬冊。