構建Apache Kafka流數據套用

內容簡介

Apache Kafka是一個流行的分散式流平台，充當訊息佇列或企業訊息傳遞系統。它用來發布和訂閱數據流，並在發生錯誤時以容錯方式處理它們。

本書共13章，全面介紹使用Apache Kafka等大數據工具設計和構建企業級流套用方面的內容，包括構建流應用程式的最佳實踐，並解決了一些常見的挑戰，例如如何高效地使用Kafka輕鬆處理高容量數據。完成本書的學習後，讀者能使用Kafka設計高效的流數據應用程式。

本書既適合Kafka初學者、大數據套用開發人員、大數據套用運維人員閱讀，也適合高等院校與培訓學校相關專業的師生教學參考。

圖書目錄

其他生產者配置 40

Java程式語言：Kafka生產者示例 42

常見的訊息發布模式 44

最佳實踐 46

總結 48

第4章深入研究Kafka消費者 49

Kafka消費者內部機制 50

理解Kafka消費者的職責 50

Kafka消費者API 52

消費者配置 52

訂閱和輪詢 54

提交和輪詢 56

其他配置 59

利用Java實現Kafka消費者 60

利用Scala實現Kafka消費者 62

Rebalance listeners 64

常用的訊息消費模式 64

最佳實踐 67

總結 68

第5章集成Kafka 構建Spark Streaming套用 69

Spark介紹 70

Spark架構 70

Spark的核心 72

Spark生態系統 73

Spark Streaming 75

Receiver-based集成 75

Receiver-based approach的缺點 77

Receiver-based集成的Java示例 77

Receiver-based集成的Scala示例 79

Direct approach 80

Direct approach的Java示例 82

Direct approach的Scala示例 83

日誌處理用例—欺詐IP檢測 84

Maven 85

生產者 89

Reader屬性 89

生產者代碼 90

欺詐IP查找 92

暴露Hive表 93

Streaming代碼 94

總結 97

構建Apache Kafka流數據套用

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條