《現代數據平台架構(影印版英文版)》是2020年東南大學出版社出版的圖書,作者是[美] Jan、Kunigk、Ian、Buss、Paul。
基本介紹
- 中文名:現代數據平台架構(影印版英文版)
- 作者:Jan、Kunigk、Ian、Buss、Paul
- 出版社:東南大學出版社
- 出版時間:2020年5月1日
- ISBN:9787564188245
內容簡介,圖書目錄,
內容簡介
關於大數據技術的信息非常豐富,但將所有這些技術無縫拼接成端到端的企業數據平台卻是一項艱巨的任務,一直以來沒有引起廣泛的討論。通過這本實用指南,你將了解如何在企業內部和雲計算平台中構建大數據基礎設施,並成功地構建出現代數據平台。
對於企業架構師、IT經理、應用程式架構師和數據工程師來說,《現代數據平台架構(影印版 英文版)》是一本理想讀物,它為你展示了如何克服Hadoop項目中出現的諸多挑戰。在深入研究以下內容之前,你還將通過一個透徹的技術入門教程探索Hadoop和大數據領域可用工具的廣闊前景。
基礎設施:查看現代數據平台的所有組件層,從伺服器到數據中心,為企業數據奠定堅實基礎。
平台:學習平台部署、操作、安全性、高可用性和災難恢復的各個方面,了解將平台與企業IT的其他部分集成所需的一切知識。
將Hadoop加入雲計算:了解在雲計算中運行大數據平台的重要體系結構,同時保證企業數據的安全性和高可用性。
圖書目錄
Foreword
Preface
1.Big DataTechnologyPrimer
A Tour of the Landscape
Core Components
Computational Frameworks
Analytical SQL Engines
Storage Engines
Ingestion
Orchestration
Summary
Part Ⅰ.Infrastructure
2.Clusters
Reasons for Multiple Clusters
Multiple Clusters for Resiliency
Multiple Clusters for Software Development
Multiple Clusters for Workload Isolation
Multiple Clusters for Legal Separation
Multiple Clusters and Independent Storage and Compute
Multitenancy
Requirements for Multitenancy
Sizing Clusters
Sizing by Storage
Sizing by Ingest Rate
Sizing by Woddoad
Cluster Growth
The Drivers of Cluster Growth
Implementing Cluster Growth
Data Replication
Replication for Software Development
Replication and Workload Isolation
Summary
3.Computeand Storage
Computer Architecture for Hadoop
Commodity Servers
Server CPUs and RAM
Nonuniform Memory Access
CPU Specifications
RAM
Commoditized Storage Meets the Enterprise
Modularity of Compute and Storage
Everything Is Java
Replication or Erasure Coding?
Alternatives
Hadoop and the Linux Storage Stack
User Space
Important System CalIs
The Linux Page Cache
Short-Circuit and Zero-Copy Reads
……