Hadoop大數據平台構建與套用

內容簡介

本書基於Hadoop大數據平台，講解大數據平台的搭建與運維、大數據的採集與存儲、大數據的處理、數據的分析、數據的可視化等完整的大數據套用案例，全面詳細地講述Hadoop、MapReduee、HDFS、Hive、Spark和Zookeeper等技術的相關知識；還詳細介紹了Hadoop大數據集群環境配置與搭建、部署配置Hadoop HA模式等內容。本書具有較強的實用性和可操作性，語言精練，通俗易懂，操作步驟描述詳盡，並配有大量操作圖例。

圖書目錄

第1章大數據與Hadoop平台技術 1

1.1 大數據時代 1

1.2 大數據關鍵技術 2

1.3 大數據涉及的主要軟體 3

1.4 Hadoop平台技術的生態 4

第2章 Ubuntu系統的安裝與使用 7

2.1 Linux系統簡介 7

2.2 Ubuntu系統安裝 8

2.2.1 下載虛擬機軟體VMware並安裝 8

2.2.2 在虛擬機中安裝Ubuntu系統 14

2.2.3 切換中英文輸入法 27

2.2.4 安裝VMware Tools 28

2.2.5 apt更新與更新源更換 30

2.2.6 安裝vim編輯器並使用 32

2.3 虛擬機聯網問題及其他 34

第3章 Linux基礎知識及相關軟體的基本使用 39

3.1 Linux基礎知識 39

3.1.1 Linux目錄結構 39

3.1.2 Shell介紹 40

3.1.3 超級用戶——root用戶 41

3.1.4 sudo命令和su命令 41

3.1.5 創建與刪除普通用戶 42

3.1.6 目錄標記規則 43

3.1.7 目錄許可權 43

3.1.8 安裝SSH 44

3.2 Linux常用軟體與命令 45

3.2.1 修改主機名 45

3.2.2 目錄操作 45

3.2.3 查看檔案內容和清屏 46

3.2.4 檔案操作 46

3.2.5 檔案解壓 47

3.2.6 進程與連線埠查看命令 48

3.2.7 系統管理命令 49

3.2.8 數據流重定向和管道的使用 50

3.2.9 其他使用技巧介紹 51

3.3 在Ubuntu中安裝Eclipse 51

3.3.1 通過軟體中心下載安裝Eclipse 51

Hadoop大數據平台構建與套用

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條