資料庫系統概論(新技術篇)課程是中國人民大學於2017年05月08日首次在中國大學MOOC開設的慕課課程、國家精品線上開放課程。該課程授課教師為王珊、杜小勇、陳紅、文繼榮、李翠平、張孝、張延松、周烜、秦波、覃雄派、陳躍國、趙鑫、竇志成、魏哲巍、盧衛、劉家俊、盧志武、焦敏、張曉瑩。據2021年3月中國大學MOOC官網顯示,該課程已開課9次。
資料庫系統概論(新技術篇)課程共22個模組,包括資料庫新技術概述、記憶體資料庫、資料庫一體機、數據倉庫與OLAP關鍵技術、新一代OLAP分析、開源資料庫系統、理解大數據、大數據處理平台Hadoop&Spark及其生態系統、大數據與機器學習、社交網路大數據分析等內容。
基本介紹
- 中文名:資料庫系統概論(新技術篇)
- 類別:慕課、國家精品線上開放課程
- 提供院校:中國人民大學
- 授課老師:王珊、杜小勇、陳紅、文繼榮、李翠平、張孝、張延松、周烜、秦波、覃雄派、陳躍國、趙鑫、竇志成、魏哲巍、盧衛、劉家俊、盧志武、焦敏、張曉瑩
- 授課平台:中國大學MOOC
- 開課時間:2017年05月08日(首次)
課程性質
課程背景
課程定位
適應對象
開課信息
開課次數 | 開課時間 | 授課教師 | 學時安排 | 參與人數 |
---|---|---|---|---|
第1次開課 | 2017年05月08日~2017年08月07日 | 王珊、杜小勇、陳紅、文繼榮、李翠平、張孝、張延松、周烜、秦波、覃雄派、陳躍國、趙鑫、竇志成、魏哲巍、盧衛、劉家俊、盧志武、焦敏、張曉瑩 | 2~3小時每周 | 19242人 |
第2次開課 | 2017年10月23日~2018年01月14日 | 10289人 | ||
第3次開課 | 2018年03月19日~2018年07月15日 | 3~5小時每周 | 11485人 | |
第4次開課 | 2018年10月08日~2018年12月31日 | 11207人 | ||
第5次開課 | 2019年03月19日~2019年07月15日 | 2~3小時每周 | 9282人 | |
第6次開課 | 2019年09月30日~2020年01月15日 | 11325人 | ||
第7次開課 | 2020年03月16日~2020年07月15日 | 12526人 | ||
第8次開課 | 2020年09月28日~2021年01月15日 | 6622人 | ||
第9次開課 | 2021年03月22日~2021年07月15日 | 待定 |
課程簡介
課程大綱
第一部分 傳統資料庫技術的創新與發展 第1講 資料庫新技術概述 回顧資料庫技50年的成就和寶貴啟示、面臨的挑戰; 概要介紹《新技術篇》的主要內容。 第2講 記憶體資料庫 介紹記憶體資料庫的基本概念、套用領域、套用架構和代表性產品; 講解新型存儲技術、新型處理器技術對記憶體資料庫發展的推動作用; 分析基於MonetDB和Vectorwise的列處理模型和向量處理模型的查詢處理技術; 記憶體資料庫技術的發展歷程和發展趨勢。 第3講 資料庫一體機 介紹資料庫一體機的概念、產品形態和技術方向; 通過例子對軟硬體結合的資料庫一體機技術進行深入淺出的介紹。 第4講 數據倉庫與OLAP關鍵技術 講解數據倉庫的基本概念; 數據倉庫與OLAP關鍵技術,包括多維數據模型、CUBE計算、實體化視圖、精簡數據方體、索引。 第5講 新一代OLAP分析 講解記憶體OLAP與多核OLAP; 基於協處理器的OLAP與實時數據倉庫。 第6講 數據挖掘 介紹數據挖掘的基本概念; 講解經典數據挖掘技術,包括分類、聚類、頻繁模式挖掘。 第7講 資料庫安全性新技術 介紹資料庫安全事件,資料庫安全的需求與策略,當前資料庫安全面臨的挑戰; 講解細粒度訪問控制技術,加密資料庫查詢技術; 隱私保護數據發布技術、隱私保護統計數據發布技術。 第8講 開源資料庫系統 介紹開源資料庫系統的特色及幾種開源資料庫; 以PostgreSQL為例介紹學習、使用與定製開源資料庫方法; 圍繞PostgreSQL,分析主要實現技術,包括體系架構、存儲、緩衝區、查詢分析器、多版本並發控制。 第二部分 大數據管理技術與系統的研究與開發 第9講 理解大數據 介紹大數據的數據特徵、系統特徵、套用特徵。 第10講大數據思維和方法 介紹大數據的思維方式、解決問題的基本方法和實例、以及大數據管理的生命周期。 第11講大數據處理平台Hadoop&Spark及其生態系統 介紹Hadoop1.0生態系統及其套用場景; | Hadoop2.0支持的計算模型、主要優勢; 介紹Spark及其生態系統,介紹Hadoop/Spark在未來數據倉庫系統中的角色。 第12講 SQL on Hadoop Systems 介紹SQL的優勢與SQL on Hadoop系統的分類; Hive on MapReduce到Hive on Tez; 介紹HDFS上的列存儲系統,以及典型的SQL on Hadoop系統。 第13講 KEY-VALUE資料庫 介紹鍵值對(KEY-VALUE)資料庫系統的概念、套用場景、基本原理和典型實現案例。 第14講 流數據分析與處理 介紹流數據的基本概念、流數據分析與處理的典型系統,比較流數據管理系統與傳統資料庫系統、比較流分析系統與批處理系統。 第15講 MongoDB文檔資料庫 介紹MongoDB資料庫及其功能,以及MongoDB基本數據操作。 第16講 圖資料庫 當前圖數據管理與套用面臨的挑戰、大數據時代面向圖數據管理技術發展概述; 講解面向事務處理的圖資料庫管理功能、存儲模型、選型和性能評價; 介紹面向分析型的分散式圖處理系統及其實現原理、選型和性能評價。 第17講 大數據近似算法 大數據近似算法:概論與採樣; 基於計數的近似算法:多數問題與MG摘要; 基於哈希的近似算法:布隆過濾器與略圖。 第18講 大數據與機器學習 機器學習的基本概念、發展歷程、前沿方向; 大數據機器學習的基本概念、實現平台;大數據機器學習的總結與反思。 第19講 社交網路大數據分析 社交媒體數據以及常用數據處理技術; 講解典型任務與解決方法,包括數據質量清洗、用戶輿情分析、用戶畫像構建、用戶興趣學習。 第20講文本大數據分析及套用案例 介紹文本大數據分析的套用場景、文本分析(自然語言處理)技術; 基於solr的文本檢索與分析系統實例。 第21講 多媒體大數據分析 介紹多媒體大數據的發展現狀、技術挑戰; 多媒體大數據的實際套用和當前的研究方向。 第22講 數據可視化與可視分析 介紹數據可視化的過程、原則、實例和可視化工具簡介。 |
第1講 資料庫新技術概述 資料庫技術50年發展回顧與啟示 新技術篇簡介 第2講 記憶體資料庫 記憶體資料庫概述 新硬體推動記憶體資料庫技術發展 記憶體資料庫查詢處理技術示例分析 第2講 記憶體資料庫(續) 記憶體資料庫發展歷程 記憶體資料庫發展趨勢 MMDB相關論文 第3講 資料庫一體機 資料庫一體機 資料庫一體機技術分析 資料庫一體機相關論文 第4講 數據倉庫與OLAP關鍵技術 數據倉庫的基本概念 數據倉庫與OLAP關鍵技術1 數據倉庫與OLAP關鍵技術2 第5講 新一代OLAP分析 記憶體OLAP與多核OLAP 基於協處理器的OLAP與實時數據倉庫 第6講 數據挖掘 數據挖掘概述 分類技術 聚類技術 頻繁模式挖掘 第7講 資料庫安全性新技術 資料庫安全基礎 細粒度訪問控制 加密資料庫查詢 隱私保護數據發布 隱私保護統計數據發布 總結與展望 第8講 開源資料庫系統 概述 PostgreSQL的學習、使用與定製 PostgreSQL的主題分析 第9講 理解大數據 大數據的數據特徵 大數據的系統特徵 大數據的套用特徵 《廉潔文化公開課》:大數據與治國理政 | 第10講 大數據思維和方法 什麼是大數據 大數據方法及實例 大數據管理的生命周期 第11講 大數據處理平台Hadoop&Spark及其生態系統 大數據處理平台Hadoop&Spark及其生態系統 第12講 SQL on Hadoop Systems SQL on Hadoop Systems 第13講 KEY-VALUE資料庫 KEY-VALUE資料庫 第14講 流數據分析與處理 流數據分析與處理 第15講 MongoDB文檔資料庫 MongoDB文檔資料庫 第16講 圖資料庫 圖數據管理概述 圖資料庫 分散式圖處理系統 第17講 大數據近似算法 大數據近似算法:概論與採樣 大數據近似算法:計數 大數據近似算法:哈希 第18講 大數據與機器學習 機器學習概述 大數據機器學習 第19講 社交網路大數據分析 社交媒體概覽 典型任務與方法 1 典型任務與方法 2 第20講 文本大數據分析 引言 時事探針系統 文本處理 分析系統 第21講 多媒體大數據管理與分析 多媒體大數據時代的挑戰 多媒體大數據關鍵技術與套用 多媒體大數據若干相關研究領域 第22講 數據可視化與可視分析 數據可視化與可視分析 數據可視化與可視分析 |
課前預備
預備知識
學習資料
書名 | 作者 | ISBN | 出版時間 | 出版社 |
---|---|---|---|---|
《資料庫系統概論(第5版)》 | 王珊,薩師煊 | 978-7-04-040664-1 | 2014年9月 | 高等教育出版社 |
《數據倉庫和數據分析教程》 | 王珊,李翠平 | 978-7-04-034130-0 | 2012年8月 | |
《記憶體資料庫技術與實現》 | 張延松,王珊 | 978-7-04-045120-7 | 2016年5月 |