Python快樂編程——數據分析與實戰

Python快樂編程——數據分析與實戰

《Python快樂編程——數據分析與實戰》是清華大學出版社出版圖書,作者是千鋒教育高教產品研發部。

基本介紹

  • 書名:Python快樂編程——數據分析與實戰
  • 作者:千鋒教育高教產品研發部
  • 出版社:清華大學出版社
  • 出版時間:2021年4月1日
  • 定價:69.90 元
  • ISBN:9787302563785
內容簡介,圖書目錄,

內容簡介

本書從數據挖掘的套用出發,以電力、航空、醫療、網際網路、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。本書以數據挖掘建模工具Python語言來展開,先介紹案例背景提出挖掘目標,再闡述分析方法與過程,最後完成模型構建,在介紹建模過程中穿插操作訓練,把相關的知識點嵌入相應的操作過程中,使讀者輕鬆理解並掌握相關的理論和知識點。本書適用於對數據分析有濃厚興趣但不知從何下手的初學者,也可以作為本科生、研究生以及科研人員學習Python的基礎教材。

圖書目錄

第1章數據分析概述
1.1初步認識數據分析
1.2數據分析的基本流程
1.3Python數據分析的工具
1.4Jupyter Notebook的基本使用
1.4.1下載與安裝
1.4.2功能界面
1.4.3工作原理
1.4.4基本使用
1.4.5高級操作
小結
習題
第2章IPython的使用
2.1IPython基礎
2.1.1IPython簡介
2.1.2IPython使用技巧
2.1.3IPython魔術命令
2.2IPython中的開發工具
2.2.1調試器
2.2.2性能分析
小結
習題
第3章NumPy的使用
3.1數組的使用
3.1.1數組的創建
3.1.2數組的屬性
3.1.3數組的運算
3.1.4數組的索引
3.1.5數組的變換
3.2矩陣的使用
3.2.1矩陣的創建
3.2.2矩陣的合併
3.2.3矩陣的運算
3.2.4矩陣的屬性
3.3NumPy實用技巧
3.3.1通用函式的使用
3.3.2數據的保存和讀取
3.3.3隨機數生成
3.3.4NumPy與數據統計
小結
習題
第4章Pandas的使用
4.1Pandas的數據結構
4.1.1Series對象的創建
4.1.2Series對象的屬性
4.1.3DataFrame對象的創建
4.1.4DataFrame對象的屬性
4.2Pandas的索引對象
4.2.1Series 索引的基本使用
4.2.2重建索引
4.2.3索引的基本選取和過濾
4.3Pandas的基本計算
4.3.1算術運算和數據對齊
4.3.2自定義函式
4.3.3排序
4.3.4重複索引的基本使用
4.4Pandas的統計功能
4.4.1統計使用的基本函式
4.4.2常用統計方法
4.5Pandas的數據缺陷處理
4.5.1dropna處理Series數據缺陷
4.5.2dropna處理DataFrame數據缺陷
4.5.3fill進行數據添加
4.6Pandas的層次化索引
4.6.1基本創建
4.6.2重排分級
4.6.3根據級別進行匯報
4.6.4DataFrame數據列的使用
4.7Pandas的檔案讀取
4.7.1讀取/存儲Excel檔案
4.7.2讀取/存儲CSV檔案
4.7.3讀寫資料庫
4.7.4讀取HDF5檔案
小結
習題
第5章Matplotlib的使用
5.1Matplotlib繪圖流程
5.2Matplotlib基本使用
5.2.1創建畫布
5.2.2添加子圖
5.2.3規定刻度與標籤
5.2.4添加圖例
5.2.5顯示
5.3Matplotlib常用技巧
5.3.1配置檔案
5.3.2rc參數的基本配置
5.3.3中文顯示配置
5.4Matplotlib基本圖形
5.4.1Matplotlib繪製散點圖
5.4.2Matplotlib繪製直方圖
5.4.3Matplotlib繪製餅狀圖
5.4.4Matplotlib繪製折線圖
5.4.5Matplotlib繪製箱型圖
小結
習題
第6章時間序列分析
6.1時間對象——Timestamp
6.1.1創建時間戳
6.1.2指定與轉換時區
6.1.3最小時間/最大時間
6.1.4常用屬性
6.2時間對象——Period
6.2.1Period對象的創建
6.2.2Period對象的屬性
6.2.3Period對象的方法
6.3時間對象——Timedelta
6.3.1Timedelta對象的創建
6.3.2Timedelta對象的屬性
6.3.3Timedelta對象的方法
6.3.4時間間隔的基本運算
6.4DateTimeIndex對象
6.4.1DateTimeIndex對象的創建
6.4.2DateTimeIndex對象的屬性
6.4.3DateTimeIndex對象的方法
6.5PeriodIndex對象
6.5.1PeriodIndex對象的創建
6.5.2PeriodIndex對象的屬性
6.5.3PeriodIndex對象的方法
6.6TimedeltaIndex對象
6.6.1TimedeltaIndex對象的創建
6.6.2TimedeltaIndex對象的屬性
6.6.3TimedeltaIndex對象的方法
6.7採樣
6.7.1採樣的基本方法
6.7.2降採樣
6.7.3升採樣
小結
習題
第7章數據處理的基本手段
7.1合併數據集
7.1.1主鍵合併數據
7.1.2軸向數據合併
7.1.3重疊數據的合併
7.1.4索引鍵的合併
7.2數據清洗
7.2.1重複值的處理
7.2.2異常值的處理
7.2.3缺失值的處理
7.3數據標準化
7.3.1最小最大標準化
7.3.2Zscore標準化
7.3.3按小數定標標準化
7.4數據類型的轉換
7.4.1離散化連續數據
7.4.2啞變數處理類型數據
小結
習題
第8章基於文本的自然語言分析
8.1基於文本的自然語言處理概述
8.2Jieba基本介紹和使用
8.2.1基本介紹
8.2.2安裝
8.2.3基本使用
8.3NLTK的基本介紹和使用
8.3.1NLTK的基本介紹
8.3.2NLTK的安裝
8.3.3NLTK基本使用
8.4文本相似度
8.4.1相似度分析
8.4.2基於NLTK的文本相似度分析
8.4.3基於Gensim的文本相似度分析
8.5情感分析
8.5.1情感分析概述
8.5.2基於樸素貝葉斯的分析
8.5.3基於情感詞典的分析
8.6文本分類
小結
習題
第9章ScikitLearn數據建模
9.1數據建模的基本概述
9.1.1ScikitLearn的基本介紹
9.1.2數據建模的基本流程
9.2回歸模型的套用與評價
9.2.1回歸模型的套用
9.2.2回歸模型的評價
9.2.3回歸模型的可視化
9.3聚類模型的套用與評價
9.3.1聚類模型的創建
9.3.2聚類模型的評價
9.3.3聚類模型可視化
9.4分類模型的套用與評價
9.4.1創建分類模型
9.4.2分類模型的評價
小結
習題
第10章數據可視化進階
10.1Seaborn
10.1.1安裝
10.1.2可視化數據集
10.1.3分類數據集
10.2Bokeh
10.2.1安裝
10.2.2柱狀圖
10.2.3散點圖
10.2.4折線圖
10.2.5時間軸
10.3Pyecharts
10.3.1安裝
10.3.2基本配置
10.3.3儀表圖繪製
10.3.4關係圖
10.3.5平行坐標系
10.3.6餅狀圖
10.3.7詞雲圖
10.3.8地理地圖
10.4空間可視化
10.4.1空間散點圖
10.4.2空間柱狀體
小結
習題
第11章數據分析案例——就業分析
11.1項目案例分析
11.2數據獲取
11.3數據處理
11.3.1數據類型的轉換
11.3.2去除重複值
11.3.3缺失值處理
11.4數據分析
小結

相關詞條

熱門詞條

聯絡我們