大數據基礎與Python機器學習

《大數據基礎與Python機器學習》是清華大學出版社於2022年出版的書籍,作者是高靜、申志軍、姜新華、陳俊傑

基本介紹

  • 中文名:大數據基礎與Python機器學習
  • 作者:高靜、申志軍、姜新華、陳俊傑
  • 出版社:清華大學出版社
  • 出版時間:2022年5月1日 
  • 定價:69.80 元
  • ISBN:9787302602392
內容簡介,目錄,

內容簡介

本書全面介紹與大數據和人工智慧相關的數據採集、數據存儲、並行計算等技術體系,以及Python編程基礎、數據處理分析和可視化、機器學習算法和深度學習模型的原理與套用。 全書共分4部分:第1部分(第1章)為大數據基礎,主要介紹與大數據套用相關的數據採集、數據存儲、並行計算等技術體系;第2部分(第2章)為Python編程基礎,主要介紹Python的基本語法,為讀者學習後續的數據處理分析、可視化、機器學習算法和深度學習模型等內容提供基礎知識;第3部分(第3、4章)為數據處理分析和可視化,主要介紹基於Pandas的數據處理分析方法和基於Matplotlib的數據可視化方法;第4部分(第5~9章)為機器學習和深度學習,其中,第5~8章主要介紹回歸、聚類、分類等機器學習算法及套用,第9章主要介紹深度學習模型及建模套用。

目錄

第1章數據與大數據導論1
1.1大數據概述1
1.1.1大數據的來源1
1.1.2大數據的定義和特徵3
1.1.3數據結構類型4
1.1.4數據分析流程5
1.2大數據採集和預處理6
1.2.1大數據採集設備6
1.2.2大數據採集方法7
1.2.3大數據預處理技術7
1.3大數據的存儲20
1.3.1數據存儲設備20
1.3.2傳統大數據存儲22
1.3.3數據中心與雲存儲23
1.3.4大數據存儲26
1.3.5數據倉庫31
1.4雲計算與大數據並行計算32
1.4.1雲計算與雲計算平台32
1.4.2MapReduce計算模型35
1.4.3Hadoop36
1.4.4Spark37
1.5大數據分析38
1.5.1大數據分析概念38
1.5.2大數據分析方法39
1.5.3機器學習與特徵選擇42
1.5.4機器學習算法45
1.5.5深度學習算法47
1.6大數據可視化51
1.6.1數據可視化概述51
1.6.2數據可視化技術51
1.6.3數據可視化工具54
1.6.4數據可視化案例56
1.7大數據套用及挑戰58
1.7.1大數據套用58
1.7.2大數據帶來的挑戰60
思考題61第2章Python基礎62
2.1Python編程環境62
2.1.1Anaconda概述62
2.1.2Anaconda的安裝63
2.1.3Anaconda的包管理63
2.1.4運行Python代碼或程式64
2.2變數和內置數據類型66
2.2.1變數和變數賦值66

相關詞條

熱門詞條

聯絡我們