零基礎學大數據算法

內容簡介

本書是通俗易懂的大數據算法教程。通篇採用師生對話的形式，旨在用通俗的語言、輕鬆的氣氛，幫助讀者理解大數據計算領域中的基礎算法和思想。本書由背景篇、理論篇、套用篇和實踐篇四部分組成。背景篇介紹大數據、算法、大數據算法等基本概念和背景；理論篇介紹解決大數據問題的亞線性算法、磁碟算法、並行算法、眾包算法的基本思想和理論知識；套用篇介紹與大數據問題息息相關的數據挖掘和推薦系統的相關知識；實踐篇從實際套用出發，引導讀者動手操作，幫助讀者通過實際程式和實驗驗證磁碟算法、並行算法和眾包算法。在講解每一個大數據問題之前，本書都會介紹大量的經典算法和基礎數據結構知識，不僅可以幫助學習過數據結構與算法、算法設計與分析等課程的同學複習，同時能夠讓入門的“小菜鳥”們，不會因為沒有學習過經典算法而對本書望而卻步，輕鬆地掌握大數據算法！

作者簡介

博士畢業以來一直哈爾濱工業大學計算機學院任職，根據2012年教育部學科評估，該學科排名第4。王博士現任軟體與理論學科副教授，博士生導師。發表論文100餘篇，出版學術專著《XML查詢處理》和英文專著《Innovative Techniques and Applications of Entity Resolution》，撰寫3篇專著章節，擁有3項軟體著作權，完成經典教材《算法導論(第三版)》最後5章的翻譯，其論文被SCI/EI檢索60餘次，引用300餘次，其中5篇論文發表於**國際會議上。獲得微軟學者(亞太地區40人獲獎)、中國優秀資料庫工程師(全國10人獲獎)、IBM博士英才(大中華區8人獲獎)等稱號，“海量數據計算的理論和技術”獲得黑龍江省自然科學獎1項，其博士論文“XML數據查詢處理技術的研究”獲得哈爾濱工業大學優秀博士論文和中國計算機學會優秀博士論文。其在2014年與慕課網開設《大數據算法》課程，這是國內首次公開開設與大數據算法相關的課程，迄今已經有超過2萬人選課。其2008年在國際**會議VLDB上發表的論文是2000年以來第一篇國內學者獨立完成的VLDB論文，在國內外產生了較大影響。2011年在微軟亞洲研究院期間提出的海量圖數據的匹配算法國際上首次將子圖匹配算法擴展到了在規模為10億級別的圖上，該算法於2012年發表以來已被引用超過30次，並已經進入微軟亞洲研究院的Trinity系統。王博士在國內外多個知名資料庫會議擔任程式委員會委員20餘次，在國際學術領域有一定影響。王博士在大數據管理、Web數據管理、數據質量管理、圖數據管理的研究和開發方面都有用豐富的經驗。

圖書目錄

第1 篇　背景篇

第1 章　何謂大數據 4

1．1　身邊的大數據 4

1．2　大數據的特點和套用 6

第2 章　何謂算法 8

2．1　算法的定義 8

2．2　算法的分析 14

2．3　基礎數據結構――線性表 24

2．4　遞歸――以階乘為例 28

第3 章　何謂大數據算法 31

零基礎學大數據算法

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條