大數據原理與實戰

內容簡介

《大數據原理與實戰》一書覆蓋完整的大數據生態圈體系，包括 Hadoop 生態圈體系、Spark 生態圈體系、Flink 生態圈體系、NoSQL 資料庫及相關組件。本書側重動手實操，提供完整詳細的實驗步驟，可以讓讀者真實模擬大數據平台體系的運行環境，在虛擬機上構建自己的大數據集群；同時，本書也兼顧必要的理論講解，深入淺出，讓讀者在了解大數據基本架構和原理機制的基礎上，能夠通過實驗真正掌握大數據平台體系中的技術組件。

《大數據原理與實戰》適合具有一定 Java 編程基礎的人員閱讀，如平台架構師、開發人員、運維管理人員等。本書內容詳盡，不僅可以作為初學者的學習用書，而且可以作為開發人員等工作中的參考手冊。

圖書目錄

第 1 章大數據核心理論基礎與架構 1

1.1 大數據概述 1

1.1.1 大數據的基本概念和特性 1

1.1.2 大數據平台所要解決的核心問題 2

1.1.3 數據倉庫與大數據 4

1.2 大數據的理論基礎 6

1.2.1 Google 檔案系統 6

1.2.2 MapReduce 分散式計算模型 10

1.2.3 BigTable 分散式資料庫 13

1.3 大數據生態圈組件 15

1.3.1 Hadoop 生態圈 15

1.3.2 Spark 生態圈 16

1.3.3 Flink 生態圈 17

1.4 基於大數據組件的平台架構 18

第 2 章部署大數據環境 21

2.1 準備大數據平台環境 21

2.1.1 安裝 Linux 作業系統 22

2.1.2 配置 Linux 環境 28

2.2 部署 Hadoop 環境 31

2.2.1 Hadoop 的目錄結構 31

2.2.2 部署 Hadoop 本地模式 32

2.2.3 部署 Hadoop 偽分布模式…… 33

大數據原理與實戰

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條