大數據平台架構

大數據平台架構

《大數據平台架構》是2022年電子工業出版社出版的圖書,作者是李昉。

基本介紹

  • 書名:大數據平台架構
  • 作者:李昉
  • 出版社:電子工業出版社
  • 出版時間:2022年4月1日
  • 頁數:320 頁
  • 定價:89 元 
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787121430671
內容簡介,圖書目錄,作者簡介,

內容簡介

對於企業而言,大數據的重要性不言而喻,如何構建、實施和套用大數據系統是很複雜的。
本書將為大家全面而深入地介紹Hadoop、Spark和NoSQL平台的構建,深入淺出地講解Hadoop、Spark和NoSQL的基礎知識、架構方案與實戰技巧等。通過閱讀本書,讀者可以對大數據平台架構有一個明確、清晰的認識,掌握Hadoop、Spark、NoSQL平台的使用技巧,從而搭建一個安全可靠的大數據集群平台,來滿足企業的實際需求。
本書共15章,可分為五大部分。第一部分(第1章)為大數據平台架構概述,講述大數據平台的基本概念與實際套用:第二部分(第2章~第6章)主要講解Hadoop的基本使用方法,以及Hadoop生態圈的其他組件:第三部分(第7章)主要介紹NoSQL:第四部分(第8章~第10章)主要介紹Spark生態圈與Spark實戰案例:第五部分(第11章~第15章)講解如何構建大數據平台,闡述大數據平台的幾個核心模組,以及大數據平台的未來發展趨勢。
本書可作為各類IT企業和研發機構的大數據工程師、架構師、軟體設計師、程式設計師,以及相關專業在校學生的參考書。

圖書目錄

第1章 大數據平台架構概述
1.1 大數據平台的產生與套用
1.1.1 大數據平台的產生
1.1.2 大數據平台的套用
1.2 大數據平台架構
1.3 大數據處理系統經典架構
1.3.1 什麼是Lambda架構
1.3.2 Lambda架構
1.3.3 Kappa架構
1.3.4 適用場景
第2章 大數據與Hadoop
2.1 Hadoop簡介
2.1.1 Hadoop起源
2.1.2 Hadoop特點
2.1.3 Hadoop版本
2.2 Hadoop生態系統
2.2.1 Hadoop生態系統概況
2.2.2 Hadoop生態系統組成詳解
2.3 Hadoop套用案例
2.3.1 Hadoop套用案例1:全球最大超市沃爾瑪
2.3.2 Hadoop套用案例2:全球最大拍賣網站eBay
2.3.3 Hadoop套用案例3:全球最大信用卡公司Visa
2.4 Hadoop在國內的現狀與未來
2.4.1 國內最早的Hadoop交流平台:Hadoop in China
2.4.2 國內Hadoop發展現狀
2.4.3 國內Hadoop前景展望
第3章 開始使用Hadoop集群
3.1 Hadoop初探
3.1.1 使用Hadoop的先決條件
3.1.2 安裝環境
3.1.3 安裝並運行Hadoop
3.1.4 運行模式
3.1.5 Hadoop單機模式
3.1.6 Hadoop偽分散式模式
3.1.7 Hadoop完全分散式模式
3.1.8 Hadoop命令手冊解讀
3.2 HDFS基礎和許可權管理
3.2.1 HDFS特點
3.2.2 HDFS基本構成
3.2.3 HDFS使用原理
3.2.4 HDFS許可權管理
3.3 MapReduce Job開發、運行與管理
3.3.1 為什麼需要 MapReduce
3.3.2 MapReduce 1.X和MapReduce 2.X
3.3.3 MapReduce開發
3.3.4 MapReduce運行與管理
3.4 YARN管理
3.4.1 YARN簡介
3.4.2 主要組件
3.4.3 ResourceManager組件
3.4.4 NodeManager組件
3.4.5 ApplicationMaster組件
3.4.6 Container組件
3.4.7 套用提交過程分析
第4章 Hadoop集群性能最佳化和維護
第5章 高可用配置
第6章 Hadoop其他組件
第7章 NoSQL
第8章 Spark生態系統
第9章 Spark SQL實戰案例
第10章 Spark Streaming
第11章 數據同步收集
第12章 任務高度系統設計
第13章 高度系統選擇
第14章 數據安全管理
第15章 大數據面臨的挑戰、發展趨勢及典型案例

作者簡介

李昉,畢業於東北大學自動化系,擁有世界500強企業多年研發、架構經驗,隨後加入網際網路創業公司,2013年開始帶領研發團隊將大數據分析運用於“預訂電商”價格分析預測(《IT經理世界》2013年第6期);譯有多部作品;目前在中體彩彩票運營管理有限公司從事大數據方面工作,也是集智俱樂部成員。

相關詞條

熱門詞條

聯絡我們