資料庫系統概論(新技術篇)

資料庫系統概論(新技術篇)

資料庫系統概論(新技術篇)課程是中國人民大學於2017年05月08日首次在中國大學MOOC開設的慕課課程、國家精品線上開放課程。該課程授課教師為王珊、杜小勇、陳紅、文繼榮、李翠平、張孝、張延松、周烜、秦波、覃雄派、陳躍國、趙鑫、竇志成、魏哲巍、盧衛、劉家俊、盧志武、焦敏、張曉瑩。據2021年3月中國大學MOOC官網顯示,該課程已開課9次。

資料庫系統概論(新技術篇)課程共22個模組,包括資料庫新技術概述、記憶體資料庫、資料庫一體機、數據倉庫與OLAP關鍵技術、新一代OLAP分析、開源資料庫系統、理解大數據、大數據處理平台Hadoop&Spark及其生態系統、大數據與機器學習、社交網路大數據分析等內容。

基本介紹

  • 中文名:資料庫系統概論(新技術篇)
  • 類別:慕課、國家精品線上開放課程
  • 提供院校:中國人民大學
  • 授課老師:王珊、杜小勇、陳紅、文繼榮、李翠平、張孝、張延松、周烜、秦波、覃雄派、陳躍國、趙鑫、竇志成、魏哲巍、盧衛、劉家俊、盧志武、焦敏、張曉瑩
  • 授課平台:中國大學MOOC
  • 開課時間:2017年05月08日(首次)
課程性質,課程背景,課程定位,適應對象,開課信息,課程簡介,課程大綱,課前預備,預備知識,學習資料,所獲榮譽,教師簡介,

課程性質

課程背景

大數據時代,資料庫技術面臨空前挑戰。資料庫系統概論(新技術篇)課程將從數據管理和數據分析的角度來討論資料庫新技術與大數據技術。資料庫系統概論(新技術篇)課程講解了傳統資料庫技術的新發展,大數據管理與系統的新概念、新技術和新套用。

課程定位

資料庫系統概論(新技術篇)課程不僅可以作為高等學校計算機類專業高年級本科生和研究生資料庫課程的教學內容,而且能為學員和科技人員提供參考。

適應對象

資料庫系統概論(新技術篇)課程適合高年級學生、研究生、教師和科技人員學習。

開課信息

開課次數
開課時間
授課教師
學時安排
參與人數
第1次開課
2017年05月08日~2017年08月07日
王珊、杜小勇、陳紅、文繼榮、李翠平、張孝、張延松、周烜、秦波、覃雄派、陳躍國、趙鑫、竇志成、魏哲巍、盧衛、劉家俊、盧志武、焦敏、張曉瑩
2~3小時每周
19242人
第2次開課
2017年10月23日~2018年01月14日
10289人
第3次開課
2018年03月19日~2018年07月15日
3~5小時每周
11485人
第4次開課
2018年10月08日~2018年12月31日
11207人
第5次開課
2019年03月19日~2019年07月15日
2~3小時每周
9282人
第6次開課
2019年09月30日~2020年01月15日
11325人
第7次開課
2020年03月16日~2020年07月15日
12526人
第8次開課
2020年09月28日~2021年01月15日
6622人
第9次開課
2021年03月22日~2021年07月15日
待定
(註:表格內容參考資料

課程簡介

資料庫系統概論(新技術篇)課程介紹了資料庫新技術概述、大數據技術概論、大數據算法與分析、大數據近似算法、文本大數據分析、多媒體大數據管理與分析、數據可視化與可視分析、大數據基本概念、大數據技術架構和大數據套用、大數據平台等內容。

課程大綱

第1-4次開課大綱
第一部分 傳統資料庫技術的創新與發展
第1講 資料庫新技術概述
回顧資料庫技50年的成就和寶貴啟示、面臨的挑戰;
概要介紹《新技術篇》的主要內容。
第2講 記憶體資料庫
介紹記憶體資料庫的基本概念、套用領域、套用架構和代表性產品;
講解新型存儲技術、新型處理器技術對記憶體資料庫發展的推動作用;
分析基於MonetDB和Vectorwise的列處理模型和向量處理模型的查詢處理技術;
記憶體資料庫技術的發展歷程和發展趨勢。
第3講 資料庫一體機
介紹資料庫一體機的概念、產品形態和技術方向;
通過例子對軟硬體結合的資料庫一體機技術進行深入淺出的介紹。
第4講 數據倉庫與OLAP關鍵技術
講解數據倉庫的基本概念;
數據倉庫與OLAP關鍵技術,包括多維數據模型、CUBE計算、實體化視圖、精簡數據方體、索引。
第5講 新一代OLAP分析
講解記憶體OLAP與多核OLAP;
基於協處理器的OLAP與實時數據倉庫。
第6講 數據挖掘
介紹數據挖掘的基本概念;
講解經典數據挖掘技術,包括分類、聚類、頻繁模式挖掘。
第7講 資料庫安全性新技術
介紹資料庫安全事件,資料庫安全的需求與策略,當前資料庫安全面臨的挑戰;
講解細粒度訪問控制技術,加密資料庫查詢技術;
隱私保護數據發布技術、隱私保護統計數據發布技術。
第8講 開源資料庫系統
介紹開源資料庫系統的特色及幾種開源資料庫;
以PostgreSQL為例介紹學習、使用與定製開源資料庫方法;
圍繞PostgreSQL,分析主要實現技術,包括體系架構、存儲、緩衝區、查詢分析器、多版本並發控制。
第二部分 大數據管理技術與系統的研究與開發
第9講 理解大數據
介紹大數據的數據特徵、系統特徵、套用特徵。
第10講大數據思維和方法
介紹大數據的思維方式、解決問題的基本方法和實例、以及大數據管理的生命周期。
第11講大數據處理平台Hadoop&Spark及其生態系統
介紹Hadoop1.0生態系統及其套用場景;
Hadoop2.0支持的計算模型、主要優勢;
介紹Spark及其生態系統,介紹Hadoop/Spark在未來數據倉庫系統中的角色。
第12講 SQL on Hadoop Systems
介紹SQL的優勢與SQL on Hadoop系統的分類;
Hive on MapReduce到Hive on Tez;
介紹HDFS上的列存儲系統,以及典型的SQL on Hadoop系統。
第13講 KEY-VALUE資料庫
介紹鍵值對(KEY-VALUE)資料庫系統的概念、套用場景、基本原理和典型實現案例。
第14講 流數據分析與處理
介紹流數據的基本概念、流數據分析與處理的典型系統,比較流數據管理系統與傳統資料庫系統、比較流分析系統與批處理系統。
第15講 MongoDB文檔資料庫
介紹MongoDB資料庫及其功能,以及MongoDB基本數據操作。
第16講 圖資料庫
當前圖數據管理與套用面臨的挑戰、大數據時代面向圖數據管理技術發展概述;
講解面向事務處理的圖資料庫管理功能、存儲模型、選型和性能評價;
介紹面向分析型的分散式圖處理系統及其實現原理、選型和性能評價。
第17講 大數據近似算法
大數據近似算法:概論與採樣;
基於計數的近似算法:多數問題與MG摘要;
基於哈希的近似算法:布隆過濾器與略圖。
第18講 大數據與機器學習
機器學習的基本概念、發展歷程、前沿方向;
大數據機器學習的基本概念、實現平台;大數據機器學習的總結與反思。
第19講 社交網路大數據分析
社交媒體數據以及常用數據處理技術;
講解典型任務與解決方法,包括數據質量清洗、用戶輿情分析、用戶畫像構建、用戶興趣學習。
第20講文本大數據分析及套用案例
介紹文本大數據分析的套用場景、文本分析(自然語言處理)技術;
基於solr的文本檢索與分析系統實例。
第21講 多媒體大數據分析
介紹多媒體大數據的發展現狀、技術挑戰;
多媒體大數據的實際套用和當前的研究方向。
第22講 數據可視化與可視分析
介紹數據可視化的過程、原則、實例和可視化工具簡介。
(註:課程大綱排版從左到右列
第5-9次開課大綱
第1講 資料庫新技術概述
資料庫技術50年發展回顧與啟示
新技術篇簡介
第2講 記憶體資料庫
記憶體資料庫概述
新硬體推動記憶體資料庫技術發展
記憶體資料庫查詢處理技術示例分析
第2講 記憶體資料庫(續)
記憶體資料庫發展歷程
記憶體資料庫發展趨勢
MMDB相關論文
第3講 資料庫一體機
資料庫一體機
資料庫一體機技術分析
資料庫一體機相關論文
第4講 數據倉庫與OLAP關鍵技術
數據倉庫的基本概念
數據倉庫與OLAP關鍵技術1
數據倉庫與OLAP關鍵技術2
第5講 新一代OLAP分析
記憶體OLAP與多核OLAP
基於協處理器的OLAP與實時數據倉庫
第6講 數據挖掘
數據挖掘概述
分類技術
聚類技術
頻繁模式挖掘
第7講 資料庫安全性新技術
資料庫安全基礎
細粒度訪問控制 加密資料庫查詢
隱私保護數據發布 隱私保護統計數據發布 總結與展望
第8講 開源資料庫系統
概述
PostgreSQL的學習、使用與定製
PostgreSQL的主題分析
第9講 理解大數據
大數據的數據特徵
大數據的系統特徵
大數據的套用特徵
《廉潔文化公開課》:大數據與治國理政
第10講 大數據思維和方法
什麼是大數據
大數據方法及實例
大數據管理的生命周期
第11講 大數據處理平台Hadoop&Spark及其生態系統
大數據處理平台Hadoop&Spark及其生態系統
第12講 SQL on Hadoop Systems
SQL on Hadoop Systems
第13講 KEY-VALUE資料庫
KEY-VALUE資料庫
第14講 流數據分析與處理
流數據分析與處理
第15講 MongoDB文檔資料庫
MongoDB文檔資料庫
第16講 圖資料庫
圖數據管理概述
圖資料庫
分散式圖處理系統
第17講 大數據近似算法
大數據近似算法:概論與採樣
大數據近似算法:計數
大數據近似算法:哈希
第18講 大數據與機器學習
機器學習概述
大數據機器學習
第19講 社交網路大數據分析
社交媒體概覽
典型任務與方法 1
典型任務與方法 2
第20講 文本大數據分析
引言
時事探針系統
文本處理
分析系統
第21講 多媒體大數據管理與分
多媒體大數據時代的挑戰
多媒體大數據關鍵技術與套用
多媒體大數據若干相關研究領域
第22講 數據可視化與可視分析
數據可視化與可視分析
數據可視化與可視分析
(註:課程大綱排版從左到右列

課前預備

預備知識

學習資料庫系統概論(新技術篇)課程需具備某一種電腦程式設計方法和語言、數據結構、離散數學、作業系統、資料庫系統概論(基礎篇)、資料庫系統概論(高級篇)等知識。

學習資料

書名
作者
ISBN
出版時間
出版社
《資料庫系統概論(第5版)》
王珊,薩師煊
978-7-04-040664-1
2014年9月
高等教育出版社
《數據倉庫和數據分析教程》
王珊,李翠平
978-7-04-034130-0
2012年8月
《記憶體資料庫技術與實現》
張延松,王珊
978-7-04-045120-7
2016年5月
(註:表格內容參考資料

所獲榮譽

2017年12月26日,該課程被中華人民共和國教育部認定為首批“國家精品線上開放課程”。

教師簡介

該課程授課教師均來自中國人民大學教學團隊。
王珊、杜小勇、陳紅、陳躍國、李翠平、文繼榮、竇志成均為中國人民大學教授。
張延松、周烜、張孝、秦波、趙鑫、魏哲巍、盧衛、劉家俊、盧志武均為中國人民大學信息學院副教授。
覃雄派:中國人民大學講師,工學博士,碩士生導師。
焦敏、張曉瑩:高級工程師。

相關詞條

熱門詞條

聯絡我們