Python數據分析與可視化項目實戰

Python數據分析與可視化項目實戰

《Python數據分析與可視化項目實戰》是2023年清華大學出版社出版的圖書,作者是王振麗。

基本介紹

  • 中文名:Python數據分析與可視化項目實戰
  • 作者:王振麗
  • 出版時間:2023年12月1日
  • 出版社:清華大學出版社
  • ISBN:9787302649045 
  • 定價:89 元
內容簡介,圖書目錄,

內容簡介

《Python數據分析與可視化項目實戰》由淺入深地講解了使用Python語言實現大型商業案例項目數據分析的知識,幾乎覆蓋了當今主流的數據分析行業。全書共9章,分別講解了電影產業市場數據分析和可視化系統,電商客戶數據分析和可視化系統,房產信息數據分析和可視化系統,城市智慧型交通數據分析和可視化系統,NBA球星技術統計信息數據分析和可視化系統,股票數據分析和可視化系統,民宿信息數據分析和可視化系統,足球數據可視化分析和機器學習預測系統,網路輿情數據分析和可視化系統等。

圖書目錄

目錄
第1章 電影產業市場數據分析和可視化系統(Flask+FastAPI+Vue+Echarts) 1
1.1 電影產業介紹 2
1.2 電影市場的需求分析 2
1.2.1 市場需要高質量作品 2
1.2.2 國內電影市場的變化 3
1.3 系統架構 3
1.4 準備數據 4
1.5 後端數據分析模組 5
1.5.1 後端系統配置 5
1.5.2 註冊FastAPI訪問 6
1.5.3 URL錯誤處理 9
1.5.4 後端數據分析 11
1.5.5 後端主檔案 15
1.5.6 日誌處理 16
1.6 前端數據可視化模組 18
1.6.1 前端系統配置 18
1.6.2 前台主頁 19
1.6.3 電影時長占比圖 28
1.6.4 電影上映年份趨勢圖 33
1.6.5 各國及地區電影出產量統計圖 37
1.6.6 電影類別排行統計圖 41
1.6.7 電影語言使用統計圖 46
1.6.8 各國及地區電影評分展示統計圖 52
第2章 電商客戶數據分析和可視化系統(Jupyter Notebook+Scikit-Learn+Matplotlib+Pandas) 59
2.1 電商行業發展介紹 60
2.1.1 國內電商市場現狀分析 60
2.1.2 電商行業發展趨勢介紹 60
2.2 需求分析 61
2.2.1 電商的商業模式 61
2.2.2 核心指標需求分析 62
2.2.3 指標體系需求分析 63
2.2.4 數據分析方法 65
2.2.5 電商平台“人”的指標思維導圖 66
2.3 系統架構 66
2.4 準備數據 67
2.5 數據分析 68
2.5.1 數據清洗 68
2.5.2 數據分析 73
2.5.3 數據建模 78
第3章 房產信息數據分析和可視化系統(網路爬蟲+MySQL+pylab實現) 85
3.1 背景介紹 86
3.1.1 行業發展現狀 86
3.1.2 房地產行業市場調查 86
3.2 需求分析 87
3.3 系統架構 87
3.4 系統設定 88
3.4.1 選擇版本 88
3.4.2 保存日誌信息 89
3.4.3 設定創建的檔案名稱 89
3.4.4 設定爬取城市 91
3.4.5 處理區縣信息 93
3.4.6 處理日期和時間 95
3.5 破解反爬機制 95
3.5.1 定義爬蟲基類 96
3.5.2 瀏覽器用戶代理 97
3.5.3 線上IP代理 98
3.6 爬蟲爬取信息 99
3.6.1 設定解析元素 99
3.6.2 爬取二手房信息 99
3.6.3 爬取樓盤信息 103
3.6.4 爬取小區信息 107
3.6.5 爬取租房信息 110
3.7 數據可視化 115
3.7.1 爬取數據並保存到資料庫 115
3.7.2 可視化濟南市房價最貴的4個小區 120
3.7.3 可視化濟南市主要地區的房價均價 121
3.7.4 可視化濟南市主要地區的房源數量 123
3.7.5 可視化濟南市各區的房源數量所占百分比 124
第4章 城市智慧型交通數據分析和可視化系統(Pandas+Matplotlib+Numpy) 127
4.1 背景介紹 128
4.2 需求分析 128
4.2.1 城市交通存在的問題 128
4.2.2 智慧型交通建設的必要性 129
4.2.3 項目目標 130
4.3 系統架構 131
4.4 從CSV檔案讀取數據 132
4.4.1 讀取並顯示CSV檔案中的前3條騎行數據 132
4.4.2 讀取並顯示CSV檔案中指定列的數據 134
4.4.3 用統計圖可視化CSV檔案中的數據 135
4.4.4 選擇指定數據 136
4.5 日期相關操作 142
4.5.1 統計每個月的騎行數據 142
4.5.2 展示某街道前5天的騎行數據信息 143
4.5.3 統計周一到周日每天的數據 145
4.5.4 使用Matplotlib圖表可視化展示統計數據 146
第5章 NBA球星技術統計信息數據分析和可視化系統(網路爬蟲+Referer反爬+JSON+Matplotlib+Pandas) 149
5.1 背景介紹 150
5.1.1 NBA介紹 150
5.1.2 NBA的全球化 150
5.2 需求分析 151
5.3 系統架構 151
5.4 球員特徵可視化 152
5.4.1 爬取球員得分信息 152
5.4.2 球員數據聚類分析 155
5.5 球員數據可視化雷達圖 161
5.5.1 分析季後賽杜蘭特的數據 161
5.5.2 分析季後賽庫里的數據 166
5.6 球星命中數據信息可視化 167
5.6.1 繪製籃球場 168
5.6.2 爬取球星庫里的投籃信息:Referer反爬 171
5.6.3 庫里投籃信息的可視化 174
5.6.4 杜蘭特投籃信息的可視化 175
第6章 股票數據分析和可視化系統(網路爬蟲+Selenium+TuShare+Matplotlib+Scikit-Learn) 177
6.1 背景介紹 178
6.2 需求分析 178
6.2.1 股票歷史數據分析的目的與意義 178
6.2.2 股票數據分析 179
6.3 系統架構 179
6.4 爬取股票實時漲幅榜信息 180
6.4.1 準備Selenium環境 180
6.4.2 爬取數據 181
6.4.3 獲取指定股票所屬行業信息 182
6.4.4 獲取漲幅榜和跌幅榜信息 183
6.4.5 將漲幅榜前10和跌幅榜前10股票數據保存到Excel檔案 184
6.5 AI選股系統 186
6.5.1 準備TuShare 186
6.5.2 跟蹤熱點板塊 187
6.5.3 數據建模和評估分析 199
第7章 民宿信息數據分析和可視化系統(網路爬蟲+Django+Echarts可視化) 219
7.1 背景介紹 220
7.2 系統架構 221
7.3 爬蟲爬取信息 221
7.3.1 系統配置 221
7.3.2 Item處理 222
7.3.3 具體爬蟲 223
7.3.4 破解反爬字型加密 232
7.3.5 下載器中間件 235
7.3.6 保存爬蟲信息 239
7.4 數據可視化 244
7.4.1 資料庫設計 244
7.4.2 登錄驗證表單 247
7.4.3 視圖顯示 248
第8章 足球數據可視化分析和機器學習預測系統(Matplotlib+Pandas+Seaborn+Scikit-Learn實現) 259
8.1 歐洲足球五大聯賽 260
8.2 系統架構 261
8.3 準備數據 261
8.4 數據可視化分析 262
8.4.1 事件收集 262
8.4.2 射門數據可視化 266
8.4.3 球隊和球員數據可視化 268
8.4.4 聯賽數據可視化 275
8.4.5 巴塞隆納隊的進球數據百分比餅圖 279
8.4.6 紅牌和黃牌數據可視化 280
8.4.7 進球數據可視化 285
8.4.8 梅西和C羅的數據可視化 292
8.4.9 五大聯賽的球員數量可視化 295
8.5 比賽預測 296
8.5.1 讀取數據 296
8.5.2 清洗數據 299
8.5.3 邏輯回歸算法 300
8.5.4 梯度提升模型 301
8.5.5 隨機森林 302
8.5.6 深度學習 303
第9章 網路輿情數據分析和可視化系統(Scikit-Learn+Tornado+Celery+FastAPI+Pandas+Vue) 305
9.1 系統介紹 306
9.1.1 輿情數據分析的意義 306
9.1.2 輿情熱度分析 306
9.2 架構設計 307
9.2.1 模組分析 307
9.2.2 系統架構 308
9.3 微博爬蟲 309
9.3.1 系統配置 309
9.3.2 批量賬號模擬登錄 309
9.3.3 爬取信息 311
9.4 系統後端 322
9.4.1 系統配置 322
9.4.2 數據結構設計 323
9.4.3 數據處理 327
9.4.4 微博話題分析 334
9.5 系統前端 341
9.5.1 API導航 341
9.5.2 博文詳情 342

相關詞條

熱門詞條

聯絡我們