大數據技術基礎(2022年高等教育出版社出版的圖書)

本詞條是多義詞,共5個義項
更多義項 ▼ 收起列表 ▲

《大數據技術基礎》是由唐九陽、趙翔主編,高等教育出版社於2022年9月18日出版的教材。

基本介紹

  • 中文名:大數據技術基礎
  • 作者:唐九陽 趙翔
  • 出版時間:2022年9月18日
  • 出版社:高等教育出版社
  • ISBN:9787040579628 
內容簡介,圖書目錄,

內容簡介

  《大數據技術基礎》系統、全面地介紹了大數據的概念、基本原理、平台技術和分析技術。
  全書共分11章,分別為大數據概述、大數據系統生態、大數據存儲與管理、計算與處理、數據獲取技術、數據預處理、大數據分析技術、可視化展現以及《西遊記》文本分析案例、旅遊網站大數據分析案例、線上用戶行為分析案例。
  《大數據技術基礎》既可以滿足大數據管理與套用、數據科學與大數據技術、計算機科學與技術、大數據技術與套用等多個專業老師、學生的教學與自學需要,也可作為大數據科學家、分析員及工程師的參考書。

圖書目錄

第1章 大數據概述
1.1 數據
1.2 大數據的成因
1.2.1 數據的產生
1.2.2 信息的存儲
1.2.3 傳輸的技術
1.2.4 信息的處理
1.3 大數據的內涵與特徵
1.3.1 大數據的內涵
1.3.2 大數據的特徵
1.4 大數據的結構類型
1.4.1 結構化數據
1.4.2 半結構化數據
1.4.3 非結構化數據
1.5 大數據時代的新理念
1.6 大數據套用場景
1.7 典型企業大數據解決方案
1.8 大數據平台技術
1.9 大數據分析技術
關鍵術語
本章小結
即測即評
第2章 大數據系統生態
2.1 並行計算技術
2.1.1 並行計算的思想
2.1.2 高性能計算系統
2.1.3 分散式計算系統
2.1.4 並行計算的系統支持
2.2 Hadoop 生態系統
2.2.1 系統概述
2.2.2 Hadoop 的核心組件
2.2.3 Hadoop 的部署
2.3 Spark 生態系統
2.3.1 Spark 簡介
2.3.2 Spark 的核心組件
2.3.3 Spark 的部署
關鍵術語
本章小結
即測即評
第3章 大數據存儲與管理
3.1 大數據物理存儲
3.1.1 物理存儲技術
3.1.2 網路化存儲
3.1.3 雲存儲和數據中心
3.2 分散式檔案系統
3.2.1 概述
3.2.2 HDFS 的概念
3.2.3 HDFS 的工作原理
3.3 NoSQL 資料庫
3.3.1 概述
3.3.2 列族資料庫
3.3.3 鍵值資料庫
3.3.4 文檔資料庫
3.3.5 圖資料庫
關鍵術語
本章小結
即測即評
第4章 計算與處理
4.1 批處理
4.1.1 批處理概念
4.1.2 批處理關鍵框架
4.1.3 批處理關鍵技術
4.2 流處理
4.2.1 從批處理到流處理的演變
4.2.2 典型流計算平台
4.3 互動式分析
4.3.1 互動式分析的需求
4.3.2 HBase 互動式分析的業務流程
4.3.3 互動式分析的典型平台
4.4 案例分析
關鍵術語
本章小結
即測即評
第5章 數據獲取技術
5.1 數據分類
5.2 內部數據獲取
5.2.1 內部數據獲取流程
5.2.2 內部數據獲取工具
5.2.3 內部數據獲取注意事項
5.3 外部數據獲取
5.3.1 外部數據獲取渠道
5.3.2 外部數據獲取流程
5.3.3 外部數據獲取工具
5.3.4 外部數據獲取代碼示例
5.4 外部數據採集案例分析
5.4.1 小說網站爬取案例
5.4.2 微信公眾號爬取案例
5.4.3 新聞網站爬取案例
關鍵術語
本章小結
即測即評
第6章 數據預處理
6.1 數據質量
6.1.1 數據質量的問題根源
6.1.2 數據質量評估
6.2 數據清洗
6.2.1 缺失數據處理
6.2.2 噪聲數據處理
6.3 數據集成
6.3.1 模式識別和對象匹配
6.3.2 數據冗餘處理
6.3.3 衝突檢測與處理
6.4 數據變換
6.4.1 數據規範化
6.4.2 數據離散化
6.4.3 數據泛化
6.4.4 數據脫敏
6.5 數據歸約
6.5.1 維歸約
6.5.2 數值歸約
關鍵術語
本章小結
即測即評
第7章 大數據分析技術
7.1 大數據分析基礎
7.2 回歸分析
7.2.1 線性回歸
7.2.2 廣義線性回歸
7.3 分類分析
7.3.1 決策樹分類方法
7.3.2 貝葉斯分類方法
7.4 聚類分析
7.4.1 k- 均值聚類
7.4.2 高斯混合模型
7.5 深度學習
7.5.1 卷積神經網路
7.5.2 循環神經網路
7.6 酒店數據分析案例
7.6.1 問題背景
7.6.2 任務描述
7.6.3 實驗步驟
關鍵術語
本章小結
即測即評
第8章 可視化展現
8.1 可視化主要類型
8.1.1 科學可視化
8.1.2 信息可視化
8.1.3 可視分析學
8.2 可視化基本模型
8.2.1 線性模型
8.2.2 循環模型
8.2.3 分析模型
8.3 數據交流常用方法
8.3.1 視覺編碼
8.3.2 統計圖表
8.3.3 圖論方法
8.3.4 視覺隱喻
8.3.5 面向領域的方法
8.4 典型數據可視化生成方式
8.4.1 入門級工具
8.4.2 信息圖表工具
8.4.3 地圖工具
8.4.4 時間線工具
8.4.5 高級分析工具
8.5 可視化典型案例
8.5.1 實時推文
8.5.2 世界語言分布圖
8.5.3 全球變暖的成因
8.5.4 美國風力圖
8.5.5 名人作息安排
8.5.6 年度新聞趨勢圖
8.5.7 社交網路聯繫圖
8.6 案例分析
關鍵術語
本章小結
即測即評
第9章 《 西遊記》文本分析案例
9.1 案例目標
9.2 案例準備
9.2.1 環境準備
9.2.2 數據預處理
9.2.3 構建全文索引
9.2.4 製作字典
9.2.5 分詞算法
9.3 案例實戰
9.3.1 詞頻統計
9.3.2 篩選特徵詞
9.3.3 主成分分析(PCA)
9.4 小結
第10章 旅遊網站大數據分析案例
10.1 案例目標
10.2 案例準備
10.3 案例實戰
10.3.1 實驗數據
10.3.2 數據抓取
10.3.3 數據存儲
10.3.4 數據分析
10.3.5 數據可視化
10.4 小結
第11章 線上用戶行為分析案例
11.1 案例目標
11.2 案例準備
11.3 案例實戰
11.3.1 數據抽取
11.3.2 數據探索分析
11.3.3 數據預處理
11.3.4 模型構建
11.3.5 上機實驗
11.3.6 拓展思考
11.4 小結
參考文獻

相關詞條

熱門詞條

聯絡我們