《大數據處理與存儲技術》是2019年2月清華大學出版社出版的圖書,作者是葛維春。
基本介紹
- 書名:大數據處理與存儲技術
- 作者:葛維春
- ISBN:9787302517207
- 定價:79元
- 出版社:清華大學出版社
- 出版時間:2019年2月
內容簡介,圖書目錄,
內容簡介
本書歸納和總結了主流資料庫軟體和常用數據處理工具的常見問題與套用技巧,為大數據技術與傳統數據存儲和轉換技術相結合提供了技術參考,為促進大數據技術的發展,為資料庫和ETL開發人員、運維人員提供了技術支撐。
本書分為3篇,共5章,主要內容包括Oracle資料庫套用、MySQL資料庫套用、Informatica PowerCenter工具套用、Kettle工具套用、資料庫調優與ETL工具套用技巧。本書分別從數據存儲軟體、數據抽取與清洗軟體等方面,向讀者展示了Oracle、MySQL、Informatica和Kettle的常見問題、最佳化與提升的技巧。
本書所涉及的內容均為生產實踐中必要的過程和階段,講解由淺入深、通俗易懂,適合從事資料庫開發、維護、管理、最佳化任務和高可用設計的工程技術人員及從事ETL開發、最佳化的工程技術人員使用或參考。
圖書目錄
第一篇 資料庫軟體篇
第1章 Oracle資料庫套用 2
1.1 Oracle簡介 ·3
1.1.1 產品歷史 3
1.1.2 支撐的平台 4
1.1.3 資料庫特點 4
1.2 安裝配置 5
1.2.1 安裝環境 5
1.2.2 系統配置 5
1.2.3 Oracle安裝 ·8
1.3 資料庫函式 20
1.3.1 常用函式 20
1.3.2 數字函式 21
1.3.3 預定義函式 22
1.3.4 字元函式 23
1.3.5 日期函式 26
1.4 常用查詢命令 29
1.5 常見問題參考 47
1.5.1 事務處理 47
1.5.2 索引 49
1.5.3 觸發器 53
大數據處理與存儲技術
1.5.4 存儲過程 53
1.5.5 參數設定 55
1.5.6 訊息號 82
1.5.7 表級操作 86
1.5.8 鎖操作 92
1.5.9 歸檔的開啟與關閉 93
1.5.10 數據的導入與導出 94
1.5.11 其他 94
第2章 MySQL資料庫套用102
2.1 MySQL簡介 ·103
2.1.1 產品歷史 103
2.1.2 套用環境 104
2.1.3 資料庫特點 105
2.2 安裝配置 106
2.3 資料庫函式 107
2.3.1 數學函式 107
2.3.2 字元串函式 110
2.3.3 日期函式 114
2.3.4 條件判斷函式 118
2.3.5 系統信息函式 119
2.3.6 加密函式 120
2.3.7 其他函式 121
2.4 常見問題參考 122
2.4.1 資料庫創建 122
2.4.2 資料庫刪除 123
2.4.3 資料庫連線 123
2.4.4 數據表操作 125
2.4.5 索引操作 127
2.4.6 其他 127
VII
第二篇 ETL工具篇
第3章 Informatica PowerCenter工具套用 132
3.1 Informatica簡介 ·133
3.2 安裝配置 133
3.2.1 準備安裝環境 133
3.2.2 Informatica軟體安裝 ·137
3.3 常見問題參考 144
3.3.1 軟體安裝 144
3.3.2 軟體啟動 144
3.3.3 目標庫表 145
3.3.4 資料庫連線 147
3.3.5 組件套用 148
3.3.6 其他 149
第4章 Kettle工具套用 150
4.1 Kettle簡介 151
4.2 安裝配置 151
4.3 常見問題 152
4.3.1 連線資源庫報錯 152
4.3.2 日誌級別設定 ·153
4.3.3 時間格式問題 153
4.3.4 打開資源庫後頁面空白 153
4.3.5 Kettle連線Oracle報錯 ·153
第三篇 高級調優篇
第5章 資料庫調優與ETL工具套用技巧 156
5.1 Oracle調優 157
5.1.1 最大限度使用索引 157
大數據處理與存儲技術
5.1.2 SQL最佳化 162
5.1.3 hint用法 ·170
5.2 MySQL調優 ·175
5.2.1 最大限度使用索引 175
5.2.2 最佳化提升 179
5.3 Informatica套用技巧 194
5.3.1 元數據解析 194
5.3.2 資料庫操作 209
附錄A Oracle錯誤信息表 ·213
附錄B MySQL錯誤信息表 ·287
附錄C PowerCenter錯誤信息表 ·310