Python數據分析與數據挖掘

Python數據分析與數據挖掘

《Python數據分析與數據挖掘》是2023年10月1日清華大學出版社出版的圖書,作者:王潔,李曉。

基本介紹

  • 中文名:Python數據分析與數據挖掘
  • 作者:王潔、李曉
  • 出版時間:2023年10月1日
  • 出版社:清華大學出版社
  • ISBN:9787302625728
  • 定價:59.8 元
  • 印次:1-1
  • 印刷日期:2023.09.11
內容簡介,圖書目錄,

內容簡介

本書採用理論知識與全過程案例解析相結合的方式,深入淺出地介紹運用Python進行數據分析與挖掘的基本概念與方法。全書共13章,分為四部分: Python基礎知識、數據分析相關庫、數據挖掘理論與算法套用、綜合案例。全書本著循序漸進、理論聯繫實際的原則,每個知識點及每章均選擇了接近實際套用並具有典型性的豐富案例,引導讀者更好地理解數據分析與挖掘的知識,並能快速開展編程實踐,是一本實踐性極強、深淺適度、重在套用、著重實戰能力培養的教材。 本書可作為高等學校大數據管理與套用、數據科學與大數據技術、計算機科學與技術等相關專業的教材,也可作為數據分析與挖掘相關從業人員的參考書。

圖書目錄

目錄
源碼下載
第一部分Python基礎知識
第1章Python概述
1.1Python簡介
1.2Python的特點和套用領域
1.2.1Python的特點
1.2.2Python的套用領域
1.3Python開發環境的搭建
1.3.1Python的下載
1.3.2Python的安裝
1.4Anaconda的下載與安裝
1.5Anaconda中的Python開發環境
1.5.1Jupyter的使用
1.5.2Spyder的使用
1.5.3使用Conda管理包
1.5.4第三方包管理的例子
1.6使用百度AI Studio雲計算編程環境
1.6.1登錄AI Studio平台
1.6.2創建項目
1.6.3啟動並運行項目
1.7Python的運行原理
1.8Python的編寫規範
1.8.1行和縮進
1.8.2多行語句
1.8.3Python引號
1.8.4Python注釋
1.9本章小結
第2章Python基礎語法
2.1標識符與變數
2.1.1Python標識符
2.1.2Python關鍵字
2.1.3變數與賦值
2.2輸入與輸出
2.2.1數據的輸入
2.2.2數據的輸出
2.2.3輸入和輸出實戰例題
2.3Python數據結構
2.3.1標量——基本數據類型
2.3.2序列類型——列表、元組和字元串
2.3.3映射類型——字典
2.3.4集合類型
2.3.5Python數據結構實戰例題
2.4運算符與表達式
2.5Python流程控制
2.5.1順序結構
2.5.2選擇結構
2.5.3循環結構
2.6本章實戰例題
2.7本章小結
2.8本章習題
第3章函式
3.1函式概述
3.1.1模組和包
3.1.2什麼是函式
3.2函式的定義
3.3參數傳遞
3.3.1實參變數指向不可變對象
3.3.2實參變數指向可變對象
3.4函式參數的設定
3.4.1函式參數的類型
3.4.2位置參數
3.4.3默認參數
3.4.4關鍵字參數
3.4.5可變參數
3.5匿名函式
3.6遞歸函式
3.7本章實戰例題
3.8本章小結
3.9本章習題
第4章類與對象
4.1面向對象
4.2類與對象的聯繫
4.3類的定義與使用
4.4屬性
4.4.1實例屬性和類屬性
4.4.2公有屬性和私有屬性
4.5方法
4.5.1實例方法
4.5.2類方法
4.5.3靜態方法
4.6繼承
4.6.1隱性繼承
4.6.2覆蓋
4.6.3super繼承
4.6.4多重繼承
4.7運算符重載
4.8本章實戰例題
4.9本章小結
4.10本章習題
第二部分數據分析相關庫
第5章NumPy基礎與套用
5.1NumPy簡介
5.2NumPy數組基礎
5.2.1數組的屬性
5.2.2創建數組
5.2.3數組的數據類型
5.2.4數組的疊代
5.2.5數組的索引和切片
5.2.6數組的合併與拆分
5.3數組的相關操作
5.3.1統計相關操作
5.3.2形狀相關操作
5.3.3數組的四則運算、點乘與比較操作
5.4數組的讀/寫
5.4.1數組的讀取
5.4.2數組的寫入
5.5本章實戰例題
5.6本章小結
5.7本章習題
第6章Pandas基礎與套用
6.1Pandas簡介
6.1.1Pandas的主要特點
6.1.2Pandas的安裝
6.2Pandas中的數據結構
6.2.1Series
6.2.2DataFrame
6.3Pandas中數據的基本操作
6.3.1數據的導入和導出
6.3.2數據的選取
6.3.3數據的編輯
6.3.4數據的合併
6.4數據運算與分析
6.4.1數據的算術運算和比較運算
6.4.2數據排序
6.4.3統計分析
6.4.4分組與聚合
6.4.5透視表與交叉表
6.5本章實戰例題
6.6本章小結
6.7本章習題
第7章Matplotlib 基礎及套用
7.1Matplotlib簡介
7.1.1Matplotlib的主要特點
7.1.2Matplotlib的安裝
7.2Matplotlib的基礎知識
7.2.1導入Matplotlib
7.2.2Matplotlib中圖形(Figure)的構成
7.2.3Matplotlib的中文設定
7.3Pyplot的使用
7.3.1plt.plot()函式的使用
7.3.2子圖
7.4Pyplot中的常用圖形
7.4.1散點圖
7.4.2柱狀圖
7.4.3直方圖
7.4.4餅圖
7.4.53D圖
7.5本章實戰例題
7.6本章小結
7.7本章習題
第三部分數據挖掘理論與算法套用
第8章分類
8.1分類概述
8.1.1分類的基本概念
8.1.2常用的分類算法
8.1.3分類算法的評價指標
8.2分類的理論知識
8.2.1信息熵
8.2.2信息增益
8.2.3基尼係數
8.3決策樹
8.3.1決策樹的基本概念
8.3.2決策樹的算法過程
8.3.3scikitlearn中決策樹的套用
8.4樸素貝葉斯分類器
8.4.1樸素貝葉斯分類器的基本介紹
8.4.2樸素貝葉斯分類器的算法過程
8.4.3scikitlearn中樸素貝葉斯分類器的套用
8.5支持向量機
8.5.1支持向量機簡介
8.5.2支持向量機的算法過程
8.5.3scikitlearn中支持向量機的套用
8.6梯度提升決策樹
8.6.1梯度提升決策樹的基本概念
8.6.2梯度提升決策樹的算法過程
8.6.3scikitlearn中梯度提升決策樹的套用
8.7Python中分類預測模型的小結
8.8本章實戰例題
8.9本章小結
8.10本章習題
第9章聚類
9.1聚類概述
9.1.1聚類的基本概念
9.1.2聚類中距離的度量
9.1.3聚類的常用算法
9.1.4聚類的評估
9.2基於劃分的KMeans聚類算法
9.2.1KMeans的基本概念
9.2.2KMeans的算法過程
9.2.3scikitlearn中KMeans的套用
9.3基於層次分析的聚類
9.3.1基於層次分析的聚類的基本原理
9.3.2基於層次分析的聚類過程
9.3.3scikitlearn中Birch的套用
9.4基於密度的聚類
9.4.1基於密度的聚類的基本原理
9.4.2基於密度的聚類過程
9.4.3scikitlearn中DBSCAN的套用
9.5本章實戰例題
9.6本章小結
9.7本章習題
第10章回歸分析
10.1回歸概述
10.1.1常用的回歸模型
10.1.2回歸分析的步驟
10.1.3回歸的相關係數
10.1.4回歸模型的評價指標
10.2線性回歸
10.2.1線性回歸的原理
10.2.2線性回歸的套用
10.2.3一元線性回歸
10.2.4多元線性回歸
10.3邏輯回歸
10.3.1邏輯回歸的原理
10.3.2LogisticRegression的套用
10.3.3邏輯回歸的套用
10.4其他回歸
10.4.1多項式回歸
10.4.2嶺回歸
10.4.3Lasso回歸
10.5本章實戰例題
10.6本章小結
10.7本章習題
第四部分綜 合 案 例
第11章實戰案例: 電商消費者數據分析
11.1案例背景
11.2數據載入和預處理
11.2.1載入需要的庫及讀入數據
11.2.2數據信息初步分析
11.2.3數據預處理
11.3探索性數據分析
11.3.1各國訂單情況分析
11.3.2客戶情況分析
11.3.3產品情況分析
11.3.4按時間分析銷售數據
11.4本章小結
第12章實戰案例: 乳腺癌數據分析與預測
12.1案例背景
12.2數據載入和預處理
12.2.1載入需要的庫及讀入數據
12.2.2數據信息初步分析
12.2.3數據預處理
12.3探索性數據分析
12.3.1診斷結果列的分布
12.3.2數據分布的可視化分析
12.3.3相關性分析
12.4分類模型
12.4.1LogisticRegression模型
12.4.2決策樹模型
12.4.3SVM模型
12.5提升預測準確率的策略
12.5.1數據標準化或規範化
12.5.2特徵選擇
12.5.3參數調優
12.6本章小結
第13章實戰案例: 鑽石數據分析與預測
13.1案例背景
13.2數據載入和預處理
13.2.1載入需要的庫及讀入數據
13.2.2數據信息初步分析
13.2.3數據預處理
13.3探索性數據分析
13.3.1類別特徵分析
13.3.2數值特徵分析
13.3.3相關性分析
13.4回歸模型的預測
13.5本章小結
參考文獻

相關詞條

熱門詞條

聯絡我們