大數據算法

大數據算法

大數據算法是哈爾濱工業大學於2014年6月30日首次在中國大學MOOC開設的慕課課程,是國家精品線上開放課程。該課程授課教師是王宏志。據2020年11月中國大學MOOC官網顯示,該課程已開課4次。

大數據算法課程講授大數據上的基本算法設計思想等內容,課程共設計十講,包含有大數據算法概述、亞線性算法、亞線性算法例析等。

基本介紹

  • 中文名:大數據算法
  • 提供院校:哈爾濱工業大學
  • 類別:慕課、國家精品線上開放課程
  • 授課老師:王宏志
  • 授課平台:中國大學MOOC
  • 開課時間:2014年6月30日(首次)
課程性質,課程背景,適用對象,開課信息,課程簡介,課程大綱,課前預備,預備知識,學習資料,授課目標,所獲榮譽,教師簡介,

課程性質

課程背景

大數據不論在研究還是工程領域都是熱點之一,算法是大數據管理與計算的核心主題。大數據算法課程試圖簡要介紹大數據計算中涉及到的基本算法設計方法。

適用對象

大數據算法課程適用於大數據研究與開發人員,也適用於數據科學愛好者學習。

開課信息

開課次數
開課時間
學時安排
參與人數
第1次開課
2014年06月30日~2015年01月10日
3~5小時每周
26562
第2次開課
2015年03月02日~2015年07月20日
90239
第3次開課
2018年12月01日~2019年02月25日
2小時每周
36174
第4次開課
2019年10月21日~2019年12月30日
3~5小時每周
18324
參考資料:

課程簡介

大數據算法課程講授一些大數據上基本算法設計思想,包括機率算法、I/O有效算法和並行算法等。該課程共設計十講,分別為大數據算法概述、亞線性算法、亞線性算法例析、外存算法概述、外存查找結構、外存圖數據算法、基於MapReduce的並行算法設計、MapReduce算法例析、超越MapReduce的並行大數據處理、眾包算法。

課程大綱

第一講 大數據算法概述
大數據算法概述
第一講作業
第二講 亞線性算法
亞線性算法概述
亞線性算法概述單元測驗
第三講 亞線性算法例析
亞線性算法例析
第三講作業
第四講 外存算法概述
外存算法概述
第四講作業
第五講 外存查找結構
外存查找結構
第五講作業
第六講 外存圖數據算法
外存圖數據算法
第六講作業
第七講 基於MapReduce的並行算法設計
基於MapReduce的並行算法設計
第七講作業
第八講 MapReduce算法例析
MapReduce算法例析
第九講 超越MapReduce的並行大數據處理
超越MapReduce的並行大數據處理
第九講作業
第十講 眾包算法
眾包算法
第十講作業
參考資料:

課前預備

預備知識

大數據算法課程要求學生預備“算法設計與分析” 和 “機率與統計”知識。

學習資料

書名
作者
ISBN
出版社
出版時間
《大數據算法》
王宏志
978-7-111-50849-6
機械工業出版社
2015年
《算法導論(第三版)》
Thomas H.Cormen 等著;殷建平等譯
978-7-111-40701-0
機械工業出版社
2013年
《機率與計算》
Michael Mitzenmacher等著;史道濟等譯
978-7-111-20805-1
機械工業出版社
2007年
參考資料:

授課目標

1、讓聽課的學習者接觸到和傳統算法課程不一樣的算法設計與分析思路,並且以較新的研究成果為導向,讓參與該課程學習的同學了解大數據算法的前沿知識。
2、通過大數據算法課程課程的學習,使學生掌握大數據算法設計的基本思想,並通過課程的作業,掌握大數據算法設計與分析的技術。

所獲榮譽

2017年12月26日,大數據算法課程被中華人民共和國教育部認定為“國家精品線上開放課程”。

教師簡介

王宏志,男,漢族,1978年生,哈爾濱工業大學計算機學院海量數據計算研究中心長聘教授,博士生導師,英才學院副院長。

相關詞條

熱門詞條

聯絡我們