大數據挖掘

大數據挖掘

《大數據挖掘》是一本2016年出版的圖書,由上海科學技術出版社出版

基本介紹

  • 書名:大數據挖掘
  • 作者:熊贇、朱揚勇、陳志淵
  • 類別:計算機、網路
  • 出版社:上海科學技術出版社
  • 出版時間:2016年
  • 開本:16 開
  • 裝幀:軟精裝
  • ISBN:9787547829615
內容簡介,作者簡介,圖書目錄,

內容簡介

《大數據挖掘》一書系統介紹了大數據挖掘的概念、原理、技術和套用。包括:認識和理解大數據;大數據挖掘需要的相關技術(大數據獲取技術、大數據存儲管理技術和大數據可視化技術等);大數據計算框架;大數據挖掘任務(關聯分析、聚類分析、分類分析、演變分析、特異群組分析和異常分析);大數據套用實現;以及大數據挖掘工具。
《大數據挖掘》對大數據挖掘技術進行了全面而細緻的定義和歸納,並將向讀者展現該領域*研究熱點和技術。關於大數據套用實現章節的內容將採用作者實際主持和完成的大數據挖掘項目為實際案例,闡述大數據挖掘套用實現過程中的問題、解決方案和取得的成果。
《大數據挖掘》一書的主要讀者是數據科學專業的高等學校學生及老師,從事數據和信息質量工作的研究人員、技術人員、管理人員和決策人員

作者簡介

熊贇,教授。作為項目負責人主持或參與*、省部級或企業合作項目11項。相關研究成果在本領域國際*會議“IEEE International Conference on Data Mining (ICDM)”、《IEEE Intelligent Systems》、《Bioinformatics》、《軟體學報》等國內外權威期刊或會議上發表論文30餘篇。出版專著2本。主要研究興趣包括數據科學和技術、大規模數據處理、數據挖掘及其套用等。提出了特異群組挖掘、Day-by-Day行為數據、多支持度序列挖掘、生物數據模型等學術觀點和見解。朱揚勇,復旦大學計算機科學技術學院教授、學術委員會主任,上海市數據科學重點實驗室主任,上海市政府信息化專家委員會專家,中國計算機學會大數據專家委員會專家,美國馬里蘭大學客座教授。從事數據領域研究25年,是國內早一批從事數據挖掘研究的學者,是國際數據科學研究的主要倡導者之一。主持過國家自然科學基金、國家863計畫項目、上海市科委重點等多項數據挖掘領域的研究課題,曾獲上海市科技進步一、二、三等獎。相關研究成果在國內外權威期刊或會議上發表論文100餘篇,出版專著2本,教材3本。

圖書目錄

第1章 緒論
1.1 理解大數據挖掘
1.1.1 大數據挖掘的定義
1.1.2 大數據挖掘的任務
1.1.3 大數據挖掘的特點
1.1.4 大數據挖掘與相關技術的差異
1.2 大數據挖掘需要的相關技術
1.2.1 大數據獲取
1.2.2 大數據存儲與管理
1.2.3 大數據可視化
1.3 小結
參考文獻
第2章 大數據計算框架
2.1. HDFS
2.2. MapReduce
2.2.1 MapReduce框架及範例
2.2.2 MapReduce存在的問題和解決方法
2.3. NoSQL(非關係型)資料庫
2.3.1 NoSQL資料庫的分類
2.3.2 NoSQL資料庫實例
2.4. SQL(關係型)資料庫
2.4.1. Apache HIVE
2.4.2. 其他SQL資料庫
2.5 小結
參考文獻
第3章 關聯分析
3.1關聯分析的基本概念
3.1.1 關聯分析的定義
3.1.2 關聯規則的定義
3.1.3 關聯規則的分類
3.2 關聯規則挖掘的原理
3.2.1 挖掘簡單關聯規則
3.2.2 挖掘量化關聯規則
3.2.3 挖掘多層關聯規則
3.2.4 挖掘多維關聯規則
3.3 關聯規則挖掘的基礎算法
3.3.1 Apriori算法
3.3.2 Apriori算法
3.3.3 FP-Growth算法
3.3.4 序列模式挖掘算法
3.4挖掘算法的進階方法
3.4.1 USpan:高效用序列模式挖掘算法
3.4.2 基於MapReduce的HusMaR算法
3.5 小結
參考文獻
第4章 聚類分析
4.1聚類分析的基本概念
4.1.1 簇與聚類
4.1.2 相似性度量和聚類原理
4.2聚類分析的基礎算法
4.2.1 層次的方法――單連線算法、BIRCH算法
4.2.2 劃分的方法――k-means和k-medoids算法
4.2.3 基於密度的方法――OPTICS算法
4.3 進階方法
4.3.1 Density Peaks算法(AA算法)
4.3.2 K-Means||:基於MapReduce的K-Means算法
4.4 小結
參考文獻
第5章 分類分析
5.1分類分析的基本概念
5.2 分類模型
5.3 分類分析的原理
5.3.1 決策樹
5.3.2 基於統計的算法
5.3.3 基於神經網路的算法
5.4 分類分析的基礎算法
5.5 分類分析的進階方法
5.6 小結
參考文獻
第6章 異常分析
6.1異常分析的基本概念
6.1.1 異常
6.1.2 異常分析
6.2異常分析的原理
6.2.1 基於統計的異常分析方法
6.2.2 基於偏差的異常分析方法
6.2.3 基於距離的異常分析方法
6.2.4 基於密度的異常分析方法
6.3異常分析的主要算法
6.3.1 基於距離的異常分析算法
6.3.2 基於密度的異常分析算法
6.4 小結
參考文獻
第7章 特異群組挖掘
7.1特異群組挖掘的基本概念
7.2 特異群組挖掘與聚類和異常檢測的關係
7.3 特異群組挖掘形式化描述
7.4 特異群組挖掘框架算法
7.5 特異群組挖掘套用
7.6 小結
參考文獻
第8章 演變分析
8.1演變分析的基本概念
8.2 演變分析的原理
8.3 演變分析的基礎算法
8.4 演變分析的進階算法
8.4.1 時間序列隨機偏移符號化表示算法
8.4.2 多維溫度序列協同異常事件挖掘算法
8.5 小結
參考文獻
第9章 異質數據網路挖掘
9.1 異質數據網路
9.2 異質數據網路挖掘研究現狀
9.3 數據網路上的相似性度量的研究
9.4 異質數據網路挖掘研究內容
9.5 小結
參考文獻
第10章 大數據挖掘套用之推薦系統
10.1 推薦系統研究階段
10.2 推薦系統算法
10.2.1 推薦系統定義
10.2.2 推薦算法分類
10.2.3 比較與分析
10.3 推薦系統的評測
0.4 小結
參考文獻
第11章 大數據中的隱私問題
11.1. 隱私的重要性
11.2. 隱私保護技術
11.2.1. 直接攻擊的應對方法
11.2.2. 間接攻擊的應對方法
11.3 小結
參考文獻

相關詞條

熱門詞條

聯絡我們