數據分析與可視化(2022年機械工業出版社出版書籍)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《數據分析與可視化》是機械工業出版社於2022年出版的書籍,作者是張濤。

基本介紹

  • 書名:數據分析與可視化
  • 作者:張濤
  • 出版社機械工業出版社
  • 出版時間:2022年8月12日
  • 定價:65.0 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111710233
  • 字數:357 千字
內容簡介,目錄,

內容簡介

《數據分析與可視化》主要介紹目前非常流行的數據分析和數據可視化工具,首先介紹數據分析“三劍客”,即NumPy、Matplotlib和Pandas。NumPy側重於科學計算,Matplotlib側重於數據可視化,Pandas側重於數據分析。然後介紹微軟推出的互動式數據分析和可視化工具Power BI。 《數據分析與可視化》分為上篇和下篇,上篇介紹使用Python實現數據的分析和可視化,通過4個項目介紹NumPy、Matplotlib和Pandas的使用。下篇共4個項目,介紹使用微軟的Power BI Desktop實現數據的分析和可視化。 《數據分析與可視化》適合作為高職院校大數據、人工智慧等專業數據分析和可視化課程的教材,也可作為《人工智慧數據處理》1+X證書的學習用書,同時也適合數據分析初學者、數據分析愛好者、數據分析工程師以及相關培訓機構學員學習。

目錄

前言
上篇 Python數據分析與可視化
項目1 使用NumPy分析空氣品質狀況
任務1.1 項目需求分析
任務1.2 環境搭建
1.2.1 開發環境介紹
1.2.2 Anaconda下載和安裝
1.2.3 PyCharm集成開發環境下載和安裝
任務1.3 數據獲取
1.3.1 通過網路爬蟲爬取
1.3.2 直接從網站下載
任務1.4 數據預處理
1.4.1 讀取數據
1.4.2 合併多個數據集
1.4.3 ndarray數據結構
1.4.4 去除冗餘數據
1.4.5 數據持久化存儲
任務1.5 科學計算
1.5.1 獲取任意範圍的樣本數據
1.5.2 計算特徵的最小值、最大值和平均值
1.5.3 統計不同空氣品質等級的天數
1.5.4 預測空氣品質
小結
課後習題
項目2 使用Matplotlib實現空氣品質數據可視化
任務2.1 項目需求分析
任務2.2 折線圖:展現AQI走勢
2.2.1 實現AQI走勢折線圖
2.2.2 圖形的最佳化和美化
2.2.3 添加注釋
任務2.3 條形圖:展現PM2.5走勢
2.3.1 條形圖:某月PM2.5的走勢情況
2.3.2 堆疊條形圖:相鄰月份PM2.5值的比較
2.3.3 並排條形圖:PM2.5和PM10的比較
任務2.4 散點圖:展現內在相關性
任務2.5 子圖:展現圖表的多樣性
任務2.6 餅圖:展現部分和整體的關係
小結
課後習題
項目3 使用Pandas分析股票交易數據
任務3.1 項目需求分析
任務3.2 數據獲取和存儲
3.2.1 數據獲取
3.2.2 數據存儲
任務3.3 數據讀取
3.3.1 讀取CSV檔案中的數據
3.3.2 讀取Excel檔案中的數據
3.3.3 獲取MySQL資料庫中的數據
任務3.4 數據簡單處理
3.4.1 常用屬性
3.4.2 查找數據
3.4.3 組裝數據
3.4.4 添加數據
3.4.5 修改數據
3.4.6 刪除數據
任務3.5 數據深度處理
3.5.1 數據去重
3.5.2 缺失值處理
3.5.3 數據轉換
任務3.6 統計分析
3.6.1 匯總統計
3.6.2 groupby:數據分組聚合
3.6.3 agg:數據聚合
3.6.4 apply:數據聚合
3.6.5 transform:數據轉換
小結
課後習題
項目4 使用Pandas實現股票交易數據可視化
任務4.1 項目需求分析
任務4.2 折線圖:展現股價走勢
任務4.3 散點圖:展現股價影響因素
任務4.4 條形圖:展現同比成交量
任務4.5 餅圖:展現成交量占比關係
任務4.6 K線圖:展現股價走勢
小結
課後習題
下篇 Power BI數據分析與可視化
項目5 空氣品質狀況分析
任務5.1 項目需求分析
任務5.2 環境搭建
5.2.1 Power BI介紹
5.2.2 Power BI Desktop的下載和安裝
5.2.3 Power BI Desktop操作界面介紹
任務5.3 數據預處理
5.3.1 導入數據
5.3.2 篩選數據
5.3.3 添加列
5.3.4 合併列
任務5.4 數據分析和可視化
5.4.1 折線圖:空氣品質走勢
5.4.2 數據鑽取
5.4.3 條形圖:空氣品質走勢比較
5.4.4 餅圖:空氣品質優良占比
5.4.5 關鍵影響者圖:影響AQI的因素
5.4.6 編輯互動
5.4.7 篩選器
5.4.8 切片器
小結
課後習題
項目6 企業財務報表數據分析
任務6.1 項目需求分析
任務6.2 數據獲取
任務6.3 數據預處理
6.3.1 導入數據
6.3.2 刪除數據
6.3.3 處理缺失值
6.3.4 逆透視數據表
6.3.5 轉換數據
6.3.6 處理股票交易數據
任務6.4 數據建模
6.4.1 新建項目名稱表
6.4.2 使用DAX新建日期表
6.4.3 創建表之間的關聯
任務6.5 數據分析和可視化
6.5.1 度量值:計算關鍵指標
6.5.2 卡片圖:展示關鍵指標數據
6.5.3 矩陣圖:羅列關鍵數據
6.5.4 瀑布圖:分析營業總成本
6.5.5 K線圖:展現走勢與趨勢
小結
課後習題
項目7 銀行客戶行銷分析
任務7.1 項目需求分析
任務7.2 數據預處理
任務7.3 數據分析和可視化
7.3.1 儀錶盤:訂閱率
7.3.2 折線和堆積柱形圖:影響訂閱率的因素
7.3.3 簇狀柱形圖:是否回頭客因素對訂閱率的影響
7.3.4 關鍵影響者圖:影響訂閱率的因素
7.3.5 問答系統
小結
課後習題
項目8 電商App用戶購物行為分析
任務8.1 項目需求分析
任務8.2 下載並安裝MySQL資料庫伺服器
任務8.3 將數據導入到MySQL資料庫中
任務8.4 數據獲取
任務8.5 數據預處理
任務8.6 數據分析和可視化
8.6.1 多行卡:關鍵指標數據
8.6.2 漏斗圖:從瀏覽到購買的轉化率
8.6.3 折線圖:不同時段的瀏覽量和購買量
8.6.4 環形圖:RFM模型
小結
課後習題
附錄
附錄A NumPy常用屬性和函式
附錄B Pandas常用屬性和函式
附錄C DAX常用函式

相關詞條

熱門詞條

聯絡我們