精通Azure數據分析

精通Azure數據分析

《精通azure數據分析》是2018年中國電力出版社出版的圖書,作者是Zoiner Tejada、馬睿。本書將機器學習與你的數據管道相集成。數據資產的管理、治理和安全。使用示例代碼,這些代碼由C#、Scala、Java,以及現代數據分析管道中各種服務所使用的原生語言編寫。

基本介紹

  • 書名:精通azure數據分析
  • 作者:Zoiner Tejada、馬睿
  • 出版社:中國電力出版社
  • ISBN:9787519820978
內容簡介,圖書目錄,作者簡介,

內容簡介

理解如何存儲超大規模數據。設計並實施可提供快速“熱”查詢和精確“冷”結果的解決方案。以批量數據處理、實時微批量或一次處理一個元組的方式處理實時數據。將機器學習與你的數據管道相集成。數據資產的管理、治理和安全。使用示例代碼,這些代碼由C#、Scala、Java,以及現代數據分析管道中各種服務所使用的原生語言編寫。

圖書目錄

目錄
序1
前言3
第1章 企業數據分析基礎7
數據分析管道7
數據湖8
Lambda架構9
Kappa架構11
在Lambda和Kappa間進行選擇12
Azure分析管道12
數據分析場景介紹15
示例代碼和示例數據集16
小結21
第2章 將數據導入Azure22
攝取載入層22
批量數據載入24
硬碟傳送24
流數據載入78
小結80
第3章 在Azure中存儲攝取的數據81
檔案存儲81
佇列存儲97
小結124
第4章 Azure中的實時數據處理125
流處理125
在Azure中每次處理一個元組131
小結174
第5章 Azure中的實時微批處理176
Azure中的微批處理176
小結207
第6章 Azure中的批處理208
HDInsight上的MapReduce批處理210
HDInsight上的Hive批處理214
HDInsight上的Pig批處理228
HDInsight上的Spark批處理229
使用SQL數據倉庫的批處理237
使用數據湖分析的批處理247
Azure Batch批處理258
小結260
第7章 Azure中的互動式查詢261
Azure SQL數據倉庫的可互動式查詢263
Hive和Tez互動式查詢269
Spark SQL互動式查詢277
USQL互動式查詢281
小結284
第8章 Azure中的冷\熱訪問服務層285
Azure Redis快取287
Document DB294
SQL 資料庫300
SQL數據倉庫308
HDInsight上的HBase309
Azure搜尋314
小結315
第9章 智慧型和機器學習316
Azure機器學習319
HDInsight上的R服務321
SQL R服務321
Microsoft認知服務322
小結334
第10章 Azure中的元數據管理335
使用Azure數據目錄管理元數據335
小結350
第11章 保護在Azure中的數據351
身份和訪問管理351
數據保護353
審計355
小結356
第12章 執行數據分析357
使用Power BI進行分析357
在藍色天際機場場景中使用Power BI批量分析報表368
展望372

作者簡介

Zoiner Tejada,架構師,擁有超過18年軟體行業諮詢經驗,在雲計算、大數據、數據分析和機器學習方面擁有卓越見解。鑒於他在Azure和數據平台(Data Platform)兩個方面的貢獻,Microsoft在這兩個領域都向他授予了MVP(Microsoft有價值專家)稱號。

相關詞條

熱門詞條

聯絡我們