大數據管理系統原理與技術

大數據管理系統原理與技術

《大數據管理系統原理與技術》是2020年機械工業出版社出版的圖書,作者是王宏志、何震瀛、王鵬、李春靜。

基本介紹

  • 中文名:大數據管理系統原理與技術
  • 作者:王宏志、何震瀛、王鵬、李春靜
  • 出版社:機械工業出版社
  • ISBN:9787111636779
內容簡介,圖書目錄,作者簡介,

內容簡介

《大數據管理系統原理與技術》介紹了多種資料庫管理系統的基本概念以及代表性資料庫管理系統的使用和最佳化方法,覆蓋了傳統的關係資料庫、數據倉庫,以及列族、鍵值、文檔、圖等NoSQL資料庫系統。
  通過閱讀《大數據管理系統原理與技術》,讀者可以較全面地了解支撐大數據套用所需的資料庫管理系統的概念、特徵和相關技術,並且可以學習代表性關係資料庫系統的使用方法,將理論和實際相結合。
  《大數據管理系統原理與技術》可作為大數據相關專業本科生和研究生教材,也可供從事大數據相關工作的工程技術人員參考使用。
  要進行有效的大數據處理和計算,選擇適當的資料庫管理系統並對其進行配置、編程和調優是非常關鍵的環節。在大數據場景下,單一的資料庫管理系統無法滿足所有類型數據管理的需要,因此大數據相關專業的學生和從業者需要了解不同類型的資料庫管理系統,以解決不同場景下的實際問題。
  《大數據管理系統原理與技術》基於作者多年的教學和工程經驗編寫而成,旨在幫助讀者掌握面向大數據的資料庫管理系統的原理和套用方法。

圖書目錄

本書編委會
前言
第1章 緒論
1.1 大數據的基本概念
1.2 資料庫管理系統
1.2.1 資料庫管理系統的基本概念
1.2.2 資料庫管理系統的發展歷史
1.2.3 資料庫管理系統的要素
1.3 大數據對資料庫管理系統的需求和挑戰
1.4 本書結構
第2章 關係型資料庫管理系統
2.1 關係資料庫概述
2.1.1 關係模型
2.1.2 關係數據的存儲
2.1.3 關係資料庫的索引
2.1.4 關係資料庫中的查詢處理算法
2.1.5 並發控制
2.1.6 資料庫恢復
2.2 關係資料庫MySQL概述
2.3 MySQL套用
2.3.1 SQL概述
2.3.2 數據定義語句
2.3.3 數據處理語句
2.3.4 事務和鎖定聲明
2.3.5 其他
2.4 存儲過程
2.4.1 概述
2.4.2 建立存儲過程
2.4.3 調用存儲過程
2.4.4 查詢存儲過程
2.4.5 刪除存儲過程
2.5 視圖
2.6 分區
2.7 複製
2.8 MySQL的Java客戶端JDBC
2.8.1 JDBC概述
2.8.2 JDBCAPI
2.8.3 Java通過JDBCAPI操作MySQL
第3章 數據倉庫Hive
3.1 數據倉庫概述
3.1.1 數據倉庫的概念和特徵
3.1.2 數據倉庫的體系結構
3.1.3 數據倉庫的模型
3.1.4 數據倉庫關鍵技術
3.1.5 數據倉庫與大數據
3.2 Hive概述
3.2.1 Hive存儲結構
3.2.2 Hive體系結構
3.2.3 Hive的任務執行流程
3.3 Hive的特徵
3.3.1 一致性
3.3.2 可擴展性
3.3.3 事務
3.4 Hive的基本概念
3.4.1 基本數據類型
3.4.2 數據類型轉換
3.4.3 複雜數據類型
3.4.4 文本檔案數據編碼
3.4.5 數據讀取模式
3.4.6 檔案格式與壓縮
3.4.7 Hive壓縮
3.4.8 Hive關鍵字
3.5 Hive的使用
3.5.1 Hive命令
3.5.2 HiveDDL
3.5.3 HiveDML
3.5.4 HiveQL基本查詢
3.5.5 Hive函式
3.5.6 HiveQL高級查詢
3.6 面向大數據的最佳化策略
3.6.1 分桶
3.6.2 視圖和索引
3.6.3 模式設計
3.7 Hive的調優
3.7.1 使用EXPLAIN查看執行計畫
3.7.2 Hive配置管理
3.7.3 限制調整
3.7.4 JOIN最佳化
3.7.5 本地模式
3.7.6 並行執行
3.7.7 嚴格模式
3.7.8 調整Mapper和Reducer個數
3.7.9 JVM重用
3.7.10 動態分區調整
3.7.11 推測執行
3.7.12 單個MapReduce中的多個GROUPBY
3.7.13 虛擬列
3.8 Java通過JDBC操作Hive
……
第4章 NoSQL概述
第5章 鍵值資料庫
第6章 列族資料庫
第7章 非關係型文檔資料庫
第8章 非關係型圖資料庫

作者簡介

王宏志,哈爾濱工業大學計算機科學與技術學院教授、博士生導師,英才學院副院長。研究方向為大數據、數據科學、數據管理與分析。在VLDB、SIGMOD等國內外重要會議和期刊上發表學術論文200餘篇,出版學術專著兩本,其論文被SCI收錄50餘次,他引千餘次。獲黑龍江省自然科學一等獎和教育部高等學校科技進步一等獎各一項,獲黑龍江省青年科技獎、寶鋼優秀教師獎等。先後主持10餘個國家自然科學基金重點項目、國家支撐計畫課題、國家博士後特別資助項目等。主講的MOOC課程“大數據算法”入選第一批全國精品線上開放課程。主要社會兼職有ACMSIGMOD中國秘書長、ACM數據科學學科標準編寫組專家、中國計算機學會資料庫專業委員會常務委員、黑龍江省數據科學與大數據技術專業委員會副主任委員、中國計算機學會大數據專家委員會委員等。
  何震瀛,博士,復旦大學計算機科學學院副教授,中國計算機學會資料庫專業委員會委員、大數據專業委員會通信委員。主要研究興趣是數據管理和數據分析等。主持和參加20餘項預研、核高基、863、國家自然科學基金項目。多年來,在數據管理、數據分析等方面進行了大量研究工作,發表論文70餘篇。在海量數據管理和分析方面,作為獨立開發者完成並行海量信息查詢和分析系統的開發,實現了海量信息的秒級分析;該軟體連同硬體平台一起,獲得國家科技進步二等獎。參與研發的資料庫系統已套用在國家海洋局某重大專項中(作為數據的保險箱)。
  王鵬,畢業於哈爾濱工業大學軟體工程專業,研究生學歷。曾就職於中國普天信息技術研究院,並擔任架構師、技術總監等職使。曾代表企業主導網路存儲國家行業標準制定,擁有相關專利3項。2013年開始從事大數據領域的技術研發工作。現就職於北京華育興業科技有限公司,任首席技術官,主要從事金融、電信、電力及教育等行業海量數據分析挖掘工作。主要社會兼職包括中國大數據與智慧型計算產業聯盟副秘書長、甲骨文大數據專家、黑龍江省人工智慧學會理事、四川省計算機協會理事等,致力於幫助全國高校進行大數據及人工智慧專業的建設與諮詢工作。
  李春靜,工學碩士,現任北京華育興業科技有限公司大數據講師,並承擔高校大數據技術與套用資源建設工作。主要從事Hadoop、HBase、Hive、Spark、大資料庫、機器學習等課程研發工作。研究興趣為大數據套用、機器學習和智慧型自動化。曾以首作者在國核心心期刊上發表論文2篇,參與大型煤礦信息化項目1個、國家醫療大數據項目2個。參與編寫大數據教材1本。

相關詞條

熱門詞條

聯絡我們