Hadoop大數據挖掘從入門到進階實戰

內容簡介

本書採用“理論+實戰”的形式編寫，全面介紹了Hadoop大數據挖掘的相關知識。本書秉承循序漸進、易於理解、學以致用和便於查詢的講授理念，講解時結合了大量實例和作者多年積累的一線開發經驗。本書作者擁有豐富的視頻製作與線上教學經驗，曾經與極客學院合作開設過線上視頻教學課程。為了幫助讀者高效、直觀地學習本書內容，作者特意為本書錄製了配套教學視頻，這些教學視頻和本書配套原始碼檔案讀者都可以免費獲取。

本書共分為13章，涵蓋的主要內容有：集群及開發環境搭建；快速構建一個Hadoop項目併線上運行；Hadoop套件實戰；Hive編程——使用SQL提交MapReduce任務到Hadoop集群；遊戲玩家的用戶行為分析——特徵提取；Hadoop平台管理與維護；Hadoop異常處理解決方案；初識Hadoop核心源碼；Hadoop通信機制和內部協定；Hadoop分散式檔案系統剖析；ELK實戰案例——遊戲套用實時日誌分析平台；Kafka實戰案例——實時處理遊戲用戶數據；Hadoop拓展——Kafka剖析。

本書通俗易懂，案例豐富，實用性強，不但適合初學者系統學習Hadoop的各種基礎語法和開發技巧，而且也適合有開發經驗的程式設計師進階提高。另外，本書還適合社會培訓機構和相關院校作為教材或者教學參考書。

圖書目錄

第1章集群及開發環境搭建 1

1.1 環境準備 1

1.1.1 基礎軟體下載 1

1.1.2 準備Linux作業系統 2

1.2 安裝Hadoop 4

1.2.1 基礎環境配置 4

1.2.2 Zookeeper部署 7

1.2.3 Hadoop部署 9

1.2.4 效果驗證 21

1.2.5 集群架構詳解 24

1.3 Hadoop版Hello World 25

1.3.1 Hadoop Shell介紹 25

1.3.2 WordCount初體驗 27

1.4 開發環境 28

1.4.1 搭建本地開發環境 28

1.4.2 運行及調試預覽 31

1.5 小結 34

第2章實戰：快速構建一個Hadoop項目併線上運行 35

2.1 構建一個簡單的項目工程 35

2.1.1 構建Java Project結構工程 35

2.1.2 構建Maven結構工程 36

2.2 操作分散式檔案系統（HDFS） 39

2.2.1 基本的套用接口操作 39

2.2.2 在高可用平台上的使用方法 42

2.3 利用IDE提交MapReduce作業 43

2.3.1 在單點上的操作 43

2.3.2 在高可用平台上的操作 46

2.4 編譯應用程式並打包 51

2.4.1 編譯Java Project工程並打包 51

Hadoop大數據挖掘從入門到進階實戰

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條