Python大數據架構全棧開發與套用

內容簡介

《Python大數據架構全棧開發與套用》介紹了如何使用Python實現企業級的大數據全棧式開發、設計和編程工作，涉及的知識點包括數據架構整體設計、數據源和數據採集、數據同步、訊息佇列、關係資料庫、NoSQL資料庫、批處理、流處理、圖計算、人工智慧、數據產品開發。

第1章數據架構整體設計 1

1.1 數據架構概述 1

1.2 數據架構設計的8個考慮因素 1

1.2.1 適用性 2

1.2.2 延伸性 2

1.2.3 安全性 3

1.2.4 易用性 3

1.2.5 高性能 4

1.2.6 成本限制 5

1.2.7 套用需求 5

1.2.8 運維管理 5

1.3 數據架構設計的4個核心內容 6

1.3.1 物理架構 6

1.3.2 邏輯架構 10

1.3.3 技術架構 13

1.3.4 數據流架構 15

1.4 常見的6種數據架構 17

1.4.1 簡單資料庫支撐的數據架構 17

1.4.2 傳統數倉支撐的數據架構 18

1.4.3 傳統大數據架構 20

1.4.4 流式大數據架構 22

1.4.5 流批一體大數據架構 23

1.4.6 存算分離的流批一體大數據架構 25

1.5 案例：某B2B企業的數據架構選型 26

1.5.1 企業背景 26

1.5.2 套用預期 27

1.5.3 數據現狀 27

1.5.4 選型分析 27

1.5.5 選型方案 28

1.5.6 未來拓展 29

1.6 常見問題 29

第2章數據源和數據採集 32

2.1 數據源概述 32

2.1.1 常見的3種數據類型 32

2.1.2 常見的8種數據源 33

2.2 企業內部流量數據採集技術選型 33

2.2.1 企業內部流量數據採集常用的技術 34