大數據挖掘技術與套用(2019年電子工業出版社出版的圖書)

大數據挖掘技術與套用(2019年電子工業出版社出版的圖書)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《大數據挖掘技術與套用》是2019年電子工業出版社出版的圖書,作譯者周中元,王菁。

基本介紹

  • 書名:大數據挖掘技術與套用
  • 作者:周中元、王菁
  • 出版社:電子工業出版社
  • 出版時間:2019年12月
  • 頁數:216 頁
  • 定價:58 元
  • 開本:16 開
  • ISBN:9787121367731
內容介紹,目錄,

內容介紹

本書系統介紹大數據技術的原理、數據挖掘與套用,主要內容包括基本概念、數據收集、數據存儲、數據處理、大數據可視化、信息檢索、數據挖掘和效能評估。本書以簡單易懂的語言、生動有趣的實例和圖形展示知識點,將概念、原理與套用融會貫通,並對大數據工具軟體進行了細緻的梳理。

目錄

第1章 大數據概述
1.1 從AlphaGo說起
1.2 大數據定義
1.3 大數據產生的原因
1.4 大數據發展歷程
1.5 大數據的特徵
1.6 數據的度量
1.7 大數據思維
1.8 科學研究範式的發展
1.9 大數據的影響及套用
1.10 大數據計算模式及產品
第2章 數據收集
2.1 外部數據收集
2.1.1 網路爬蟲原理
2.1.2 搜尋排序策略
2.1.3 Web網路圖
2.1.4 構建爬蟲系統
2.2 內部數據收集
2.2.1 Flume
2.2.2 Chukwa
第3章 數據存儲
3.1 檔案存儲
3.1.1 Hadoop簡介
3.1.2 檔案存儲
3.1.3 HDFS的基本術語
3.1.4 HDFS運行架構
3.1.5 HDFS安全設計
3.1.6 HDFS的弱點
3.2 資料庫存儲
3.2.1 NoSQL簡介
3.2.2 列族資料庫HBase
3.2.3 文檔資料庫MongoDB
3.2.4 圖資料庫
3.2.5 鍵-值對資料庫
第4章 數據處理
4.1 離線批處理框架
4.2 MapReduce計算框架
4.3 Hadoop簡介
4.3.1 Hadoop生態圈
4.3.2 Hadoop發展歷程
4.3.3 Hadoop的特性
4.3.4 Hadoop的版本
4.4 HDFS高可用性架構
4.5 HDFS聯邦
4.6 YARN
4.7 Hadoop工具集
4.8 訊息機制
4.8.1 訊息處理模型
4.8.2 JMS
4.9 記憶體計算框架Spark
4.9.1 Spark的配置方式
4.9.2 Spark的主要特點
4.9.3 Spark生態圈
4.9.4 Spark與Hadoop比較
4.9.5 Spark運行架構
4.9.6 Spark基本運行流程
4.9.7 RDD
4.10 流式計算框架
4.10.1 流式計算處理過程
4.10.2 常見的流式計算軟體
4.10.3 Storm系統
4.10.4 Spark Streaming
4.10.5 流計算與批處理計算的區別
4.11 圖計算
4.11.1 Pregel圖計算框架的提出
4.11.2 超步
4.11.3 Pregel計算模型
4.11.4 Pregel的C++ API
4.11.5 Pregel體系結構
4.11.6 容錯性
第5章 大數據可視化
5.1 數據可視化定義
5.2 數據可視化發展歷程
5.3 數據可視化的作用
5.4 數據可視化設計步驟
5.5 數據可視化設計要素
5.6 顏色可視化設計
5.6.1 色彩空間
5.6.2 色彩三要素
5.7 數據可視化基本圖形選用
5.8 數據可視化工具
第6章 信息檢索
6.1 信息檢索定義
6.2 相關性
6.2.1 布爾模型
6.2.2 排序布爾模型
6.2.3 向量空間模型
6.2.4 語言模型
6.3 及時性
6.4 搜尋引擎
6.4.1 網頁連結分析法
6.4.2 電子商務中的商品排序
6.4.3 開源搜尋引擎
6.5 推薦系統
6.5.1 何謂推薦系統
6.5.2 推薦系統與電商
6.5.3 推薦系統數據基礎
6.5.4 推薦方法
6.5.5 開源推薦系統
6.6 網際網路廣告
第7章 數據挖掘
7.1 基本概念
7.1.1 數據挖掘的定義
7.1.2 相關技術
7.2 數據來源
7.3 數據表示與預處理
7.4 機器學習算法
7.4.1 關聯分析
7.4.2 分類
7.4.3 回歸分析算法
7.4.4 聚類分析
7.5 數據挖掘工具軟體
第8章 效能評估
8.1 效果評估
8.1.1 對信息檢索的評估
8.1.2 對分類的評估
8.1.3 對聚類的評估
8.2 性能評估
附錄 Hadoop編年史
參考文獻

相關詞條

熱門詞條

聯絡我們