大數據教程：大數據技術與編程基礎

內容簡介

“大數據”近年成為IT領域的熱點話題，人們每天都會通過網際網路、移動設備等產生大量數據。如何管理大數據、掌握大數據的核心技術、理解大數據相關的生態系統等，是作為大數據開發者必須學習和熟練掌握的。本系列書以“大數據開發者”應掌握的技術為主線，共分兩卷，以7個模組分別介紹如何管理大數據生態系統、如何存儲和處理數據、如何利用Hadoop工具、如何利用NoSQL與Hadoop協同工作，以及如何利用Hadoop商業發行版和管理工具。本系列書涵蓋了大數據開發工作的核心內容，全面且詳盡地涵蓋了大數據開發的各個領域。本書為第1卷，共4個模組，分別介紹大數據基礎知識、大數據生態系統的管理、HDFS和MapReduce以及Hadoop工具（如Hive、Pig和Oozie等）。本書適用於想成為大數據開發者以及所有對大數據開發感興趣的技術人員和決策者閱讀。

圖書目錄

模組1　大數據入門

第　1講大數據簡介　3

1.1　什麼是大數據　4

1.1.1　大數據的優勢　5

1.1.2　挖掘各種大數據源　6

1.2　數據管理的歷史——大數據的演化　7

1.3　大數據的結構化　9

1.4　大數據要素　13

1.4.1　數據量　13

1.4.2　速度　14

1.4.3　多樣性　14

1.5　大數據在商務環境中的套用　14

1.6　大數據行業中的職業機會　16

1.6.1　職業機會　17

1.6.2　所需技能　17

1.6.3　大數據的未來　19

練習　20

備忘單　22

第　2講大數據在商業上的套用　23

2.1　社交網路數據的重要性　24

2.2　金融欺詐和大數據　30

2.3　保險業的欺詐檢測　32

2.4　在零售業中套用大數據　36

練習　40

備忘單　42

第3講　處理大數據的技術　43

3.1　大數據的分散式和並行計算　44

3.1.1　並行計算技術　46

3.1.2　虛擬化及其對大數據的重要性　47

3.2　Hadoop簡介　47

3.3　雲計算和大數據　50

3.3.1　大數據計算的特性　50

3.3.2　雲部署模型　51

3.3.3　雲交付模型　52

3.3.4　大數據云　52

3.3.5　大數據云市場中的供應商　53

3.3.6　使用雲服務所存在的問題　54

3.4　大數據記憶體計算技術　54

練習　56

備忘單　58

第4講　了解Hadoop生態系統　59

4.1　Hadoop生態系統　60

大數據教程：大數據技術與編程基礎

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條