流式架構:Kafka與MapR Streams數據流處理

流式架構:Kafka與MapR Streams數據流處理

《流式架構:Kafka與MapR Streams數據流處理》是2017年電子工業出版社出版的書籍,作者是【美】Ted Dunning(泰德敦寧) 【美】 Ellen Friedman (艾倫弗里德曼)。

基本介紹

  • 中文名:流式架構:Kafka與MapR Streams數據流處理
  • 作者:【美】Ted Dunning(泰德敦寧) 【美】 Ellen Friedman (艾倫弗里德曼)
  • 譯者:唐李洋
  • 出版社:電子工業出版社
  • 出版時間:2017年7月
  • 頁數:140 頁
  • 定價:55.00
  • 開本:16 開
  • ISBN:9787121317224
內容提要,作者簡介,目錄,

內容提要

所有連續的事件流都可以稱為數據流。對連續數據流設計和構建流式數據架構,能夠實現實時或近實時套用,提升整個組織的效率。《流式架構:Kafka與MapR Streams數據流處理》以Apache Kafka 和MapRStreams為例,重點講解如何確定使用流數據的時機、如何為多用戶系統設計流式架構、為什麼要求訊息傳遞層具備某些特定功能,以及為什麼需要微服務,並且描述了目前最符合流式設計需求的訊息傳遞和流分析工具,適合架構師、大數據科學家及IT工程師閱讀。

作者簡介

唐李洋,博士,研究方向為雲計算、並行計算、數據挖掘與分析等。曾經在Cisco從事過數據架構方面的設計與分析工作。

目錄

第1 章 為什麼使用流1
飛機、火車和汽車:車聯網和物聯網 3
流數據:這才是現實世界 6
什麼時候需要流 8
不止是實時:流架構的更多優勢11
流架構的最佳實踐13
醫療數據流案例 14
流數據:架構設計的核心17
第2 章 流式架構 19
狹義視角:實時套用 20
通用流式架構的關鍵問題21
訊息傳遞技術的重要性 24
實時分析工具 28
Apache Storm 30
Apache Spark Streaming 31
Apache Flink 32
Apache Apex 33
流分析功能比較33
小結 36
第3 章 流架構:微服務的理想平台 37
為什麼需要微服務 38
微服務需要哪些支撐 41
關於微服務的更多詳情42
設計流架構:以線上視頻服務為例 45
新設計:支持訊息傳遞的基礎設施47
通用微架構的重要性 49
命名問題50
為什麼使用分散式檔案和NoSQL 資料庫52
視頻服務的新設計 52
小結:綜合平台視角 54
第4 章 使用Kafka 進行流傳輸 57
Kafka 的動機 57
Kafka 的創新 58
Kafka 的基本概念60
排序61
持久化 62
Kafka API 62
KafkaProducer API63
KafkaConsumer API 66
遺留API70
Kafka 實用程式 71
負載均衡 71
鏡像 72
Kafka 的陷阱 73
產品環境下的Kafka 73
主題和分區的數目有限 74
手動均衡分區負載 75
沒有固有的序列化機制 76
鏡像的不足77
小結 78
第5 章 MapR Streams79
MapR Streams 的創新79
MapR 流系統的歷史和情境82
MapR Streams 的工作原理 84
配置MapR Streams 86
地理分散式複製 89
MapR Streams 的陷阱 91
第6 章 基於流數據的欺詐檢測 93
刷卡速度 94
快速回響決策:“這是欺詐嗎”95
多用途流數據98
欺詐檢測器的向上擴展 99
小結 101
第7 章 地理分散式數據流 103
利益相關者 104
設計目標 106
設計選擇 106
我們的設計 108
數據 108
控制誰能訪問流數據109
基於流的地理分散式複製的優勢 110
第8 章 總結113
流式架構的優勢 115
過渡到流架構116
小結 119
附錄A 附加資源121
作者簡介125

相關詞條

熱門詞條

聯絡我們