《Greenplum:從大數據戰略到實現》是一部從大數據戰略到實現,深度解讀開源MPP大數據平台的著作,由機械工業出版社出版。
基本介紹
- 書名:Greenplum:從大數據戰略到實現
- 作者:馮雷 姚延棟 高小明 楊瑜 著
- ISBN:978-7-111-63216-0
- 頁數:392頁
- 定價:119.00元
- 出版社:機械工業出版社
- 出版時間:2019.8
- 裝幀:平裝
- 開本:32開
內容簡介
這是一本系統剖析Greenplum開源大數據平台的書籍,也是大數據戰略制定與落地的實戰型指導書!
本書圍繞數字原生和雲計算、大數據、人工智慧驅動的企業數位化轉型的核心訴求,從商業和技術實戰視角分享了業界領先企業大數據戰略的深刻思考,並提供了大數據戰略從制定到落地的全面指導。既有高階數位化戰略高度對大數據的解讀,又有技術實戰角度對使用 Greenplum 大數據和機器學習平台實現大數據戰略的實踐指南。
本書作者來自Greenplum 核心研發團隊,致力於以開源、開放的理念和先進的技術推進大數據產業生態,助力企業以更低的成本、更高的效率實現數位化轉型,並基於Greenplum 開源社區培養大數據產業更多人才。
本書分為四個部分。
● 第一部分介紹大數據戰略。其中,第 1 章將分享作者對於人工智慧、大數據和
雲計算之間關係的理解以及對人和人工智慧的思考。第 2 章將介紹進取型企業為什
么需要大數據戰略以及如何建立大數據戰略。
● 第二部分介紹大數據平台。其中,第 3 章將以數據平台演進歷史和未來趨勢為主
題,描述三次整合的背景及影響,介紹選擇大數據平台需要考慮的因素,以及為什麼
Greenplum 是理想的大數據平台。第 4 章將介紹 Greenplum 資料庫快速入門指南。第 5
章將介紹 Greenplum 架構的主要特點和核心引擎。第 6 章將介紹數據載入、數據聯邦
和數據虛擬化。第 7 章將介紹 Greenplum 的資源管理以及對混合負載的支持。
● 第三部分介紹機器學習。其中,第 8 章介紹 Greenplum 的各種過程化程式語言(用戶
自定義函式),用戶可以使用 Python、R、Java 等實現用戶自定義函式,還可以通過
容器化技術實現自定義函式的安全性和隔離性。第 9 章將介紹 Greenplum 內建的機器
學習庫 MADlib,數據科學家可以使用內建的 50 多種機器學習算法用 SQL 對數據進
行高級分析,並介紹如何擴展 MADlib 以實現新算法。第 10 章和第 11 章將分別介紹
Greenplum 如何對文本數據和時空數據(GIS)進行存儲、計算和分析。第 12 章將介紹
Greenplum 豐富的圖計算能力。
● 第四部分介紹運維管理和數據遷移。其中,第 13 章會介紹各種監控和管理工具及相關
企業級產品。第 14 章介紹資料庫備份和恢復。第 15 章和第 16 章將分別介紹如何從
Oracle 和 Teradta 遷移到 Greenplum。