大數據導論(2019年人民郵電出版社出版的圖書)

大數據導論(2019年人民郵電出版社出版的圖書)

本詞條是多義詞,共12個義項
更多義項 ▼ 收起列表 ▲

《大數據導論》是2019年人民郵電出版社出版的圖書。

基本介紹

  • 中文名:大數據導論
  • 作者:孟憲偉 、許桂秋 
  • 出版時間:2019年 
  • 出版社:人民郵電出版社
  • ISBN:9787115503459
內容簡介,圖書目錄,

內容簡介

本書從系統的角度出發,按照大數據處理流程的順序,全面介紹了大數據技術的基礎知識,提升讀者對大數據的認知。全書分3個邏輯層次,共9章。
本書作為大數據技術的基礎教材,目的不在於讓讀者對具體的某個技術平台細節有很深的理解,而是儘量讓讀者體會整個大數據處理的技術流程,使讀者能夠掌握大數據技術的整體框架,能夠在未來的學習和工作中通過系統化的大數據思維能力為所遇到的問題提供解決思路和方案。

圖書目錄

第1章 什麼是大數據 1
1.1 人類信息文明的發展 1
1.2 大數據時代的來臨 2
1.2.1 信息技術的發展 3
1.2.2 數據產生方式的變革 5
1.3 大數據的主要特徵 7
1.3.1 大數據的數據特徵 8
1.3.2 大數據的技術特徵 10
1.4 大數據的社會價值 11
習題 12
本章參考文獻 13
第2章 大數據技術基礎 14
2.1 計算機作業系統 14
2.1.1 什麼是作業系統 14
2.1.2 Linux作業系統 16
2.2 程式語言 18
2.2.1 程式語言的發展與種類 18
2.2.2 Python語言 21
2.3 資料庫 23
2.3.1 SQL資料庫的發展與成熟 24
2.3.2 NoSQL資料庫及其特點 25
2.3.3 NoSQL資料庫的分類 27
2.3.4 NewSQL資料庫 30
2.4 算法 30
2.4.1 什麼是算法 30
2.4.2 大數據時代的算法 32
2.5 大數據系統 33
2.5.1 Hadoop平台 33
2.5.2 Spark平台 35
2.6 大數據的數據類型 37
2.6.1 結構化數據 38
2.6.2 半結構化數據 38
2.6.3 非結構化數據 39
2.7 大數據套用的開發流程 40
2.8 數據科學算法的套用流程 41
習題 42
本章參考文獻 43
第3章 數據採集與預處理 44
3.1 大數據的來源 44
3.1.1 傳統商業數據 45
3.1.2 網際網路數據 45
3.1.3 物聯網數據 46
3.2 數據的採集方法 47
3.2.1 系統日誌的採集方法 47
3.2.2 網頁數據的採集方法 52
3.2.3 其他數據的採集方法 55
3.3 數據預處理 56
3.3.1 影響數據質量的因素 56
3.3.2 數據預處理的目的 59
3.3.3 數據預處理的流程 60
習題 67
本章參考文獻 67
第4章 大數據存儲與管理 68
4.1 數據存儲概述 68
4.1.1 數據的存儲介質 68
4.1.2 數據的存儲模式 72
4.2 大數據時代的存儲管理系統 76
4.2.1 檔案系統 76
4.2.2 分散式檔案系統 77
4.2.3 資料庫 80
4.2.4 鍵-值資料庫 82
4.2.5 分散式資料庫 82
4.2.6 關係型資料庫 84
4.2.7 數據倉庫 85
4.2.8 文檔資料庫 87
4.2.9 圖形資料庫 89
4.2.10 雲存儲 90
習題 93
本章參考文獻 93
第5章 大數據計算框架 94
5.1 計算框架 94
5.1.1 批處理框架 94
5.1.2 流式處理框架 95
5.1.3 互動式處理框架 96
5.2 MapReduce 96
5.2.1 MapReduce編程的特點 97
5.2.2 MapReduce的計算模型 97
5.2.3 MapReduce的資源管理框架 101
5.3 Spark 105
5.3.1 Spark的基本知識 105
5.3.2 Spark的生態系統 107
5.3.3 Spark的架構與原理 109
5.3.4 Spark RDD的基本知識 111
習題 115
本章參考文獻 115
第6章 數據挖掘 116
6.1 什麼是數據挖掘 116
6.2 數據挖掘的對象與價值 119
6.2.1 數據挖掘的對象 119
6.2.2 數據挖掘的價值 121
6.3 數據挖掘常用的技術 123
6.3.1 關聯分析 123
6.3.2 分類分析 126
6.3.3 聚類分析 129
6.4 數據挖掘常用的工具 132
6.4.1 RapidMiner 133
6.4.2 WEKA 133
6.4.3 Orange 134
6.4.4 R語言 134
6.4.5 Mining 135
6.5 數據挖掘的典型套用 137
6.5.1 社交媒體領域的套用 137
6.5.2 市場行銷領域的套用 137
6.5.3 科學研究領域的套用 138
6.5.4 電信領域的套用 138
6.5.5 教育領域的套用 138
6.5.6 醫學領域的套用 139
習題 140
本章參考文獻 140
第7章 數據可視化 141
7.1 什麼是可視化 141
7.1.1 可視化的含義 141
7.1.2 可視化的發展歷程 142
7.1.3 可視化的作用 143
7.2 數據可視化及其分類 144
7.2.1 科學可視化 144
7.2.2 信息可視化 146
7.2.3 可視化分析學 147
7.3 數據可視化工具 147
7.3.1 入門級工具 148
7.3.2 信息圖表工具 149
7.3.3 地圖工具 152
7.3.4 高級分析工具 155
7.4 數據可視化案例 157
7.4.1 數字美食 157
7.4.2 空中的間諜 157
習題 158
本章參考文獻 158
第8章 大數據與雲計算 160
8.1 什麼是雲計算 160
8.1.1 雲計算的概念與特點 160
8.1.2 雲計算的分類 162
8.1.3 雲計算與分散式計算的區別 163
8.1.4 雲計算的體系架構 163
8.1.5 雲計算需要解決的問題 165
8.1.6 具有代表性的雲計算廠商 166
8.2 大數據與雲計算的關係 167
8.2.1 雲計算將改變大數據分析 168
8.2.2 大數據與雲計算的區別和
聯繫 168
8.2.3 大數據與雲計算未來的發展
方向和趨勢 169
8.2.4 大數據與雲計算在生產生活中的
套用 171
習題 173
本章參考文獻 174
第9章 大數據與人工智慧 175
9.1 什麼是人工智慧 175
9.1.1 人工智慧的發展歷史 176
9.1.2 人工智慧的研究方向和方法 182
9.1.3 人工智慧面臨的問題 184
9.2 數據驅動的智慧型時代 185
9.2.1 人工智慧與大數據 185
9.2.2 產業戰略 187
習題 188
本章參考文獻 188

相關詞條

熱門詞條

聯絡我們