大數據技術入門到商業實戰Hadoop+Spark+Flink全解析

內容簡介

本書全面詳細地介紹了大數據生態系統中的主流技術。全書共10章，主要包括大數據生態系統概述、大數據採集技術、大數據存儲技術、大數據分析處理技術等內容，書中涵蓋了Hadoop、Hive、Hbase、Kafka、Spark、Flink等技術的原理和實踐，其中重點介紹了Hadoop技術、Spark技術及Flink技術。

本書詳細介紹了主流大數據技術框架的基本原理、環境搭建、操作使用和在典型行業中的具體套用，使讀者不僅能夠在巨觀上全面認知大數據生態系統，而且還能在微觀上深入理解大數據技術細節。

本書不僅適合大數據技術初學者閱讀，還可以幫助金融、電信、電商、能源、政府部門的大數據套用決策和技術人員，以及IT經理、CTO、CIO等快速學習大數據技術，並能作為大數據相關崗位培訓的教程。

圖書目錄

前言

●第1章初識大數據

1.1什麼是大數據

1.2大數據行業套用

1.3什麼是Hadoop

1.4Hadoop產生背景

1.5Hadoop的架構模組介紹

1.6Hadoop在大數據、雲計算中的

位置和關係

1.7國內外Hadoop套用案例介紹

1.8Hadoop生態圈以及各組成部分

簡介

1.9本章小結

●第2章Hadoop之分散式檔案系統

HDFS

2.1構建Hadoop集群

2.1.1集群簡介

2.1.2Hadoop集群部署

2.2Hadoop集群啟動和停止

2.2.1Hadoop集群啟動

2.2.2Hadoop集群停止

2.3HDFS的Shell命令行客戶端

操作

2.4HDFS的工作機制

2.4.1HDFS概述

2.4.2HDFS的重要特性

2.4.3HDFS寫數據流程

2.4.4HDFS讀數據流程

2.5NameNode和SecondaryNameNode

功能剖析

2.5.1NameNode與SecondaryNameNode

解析

2.5.2元數據的checkpoint的條件

2.5.3fsimage與edits詳解

2.5.4fsimage和edits檔案信息查看

2.6DataNode的工作機制及存儲

2.6.1DataNode工作機制

2.6.2數據完整性保證

2.6.3DataNode掉線判斷時限參數

2.7HDFS的安全模式

大數據技術入門到商業實戰Hadoop+Spark+Flink全解析

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條