Hadoop大數據分析與挖掘實戰

Hadoop大數據分析與挖掘實戰

《Hadoop大數據分析與挖掘實戰》是一本2015年機械工業出版社出版的圖書,作者張良均、樊哲、李成華、劉麗君等,本書共14章,主要介紹了數據挖掘、Hadoop大數據的基本原理以及真實案例。

基本介紹

  • 書名:Hadoop大數據分析與挖掘實戰
  • 作者:張良均 、樊哲 、李成華 、劉麗君等
  • 出版社:機械工業出版社
  • ISBN:9787111522652 
內容簡介,圖書目錄,作者簡介,

內容簡介

本書共14章,分三個部分:基礎篇、實戰篇、高級篇。基礎篇介紹了數據挖掘、Hadoop大數據的基本原理,實戰篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得大數據項目挖掘分析經驗,同時快速領悟看似難懂的大數據分析與挖掘理論知識。讀者在閱讀過程中,應充分利用隨書配套的案例建模數據,藉助TipDM-HB大數據挖掘建模平台,通過上機實驗,以快速理解相關知識與理論。

圖書目錄

目錄前 言基 礎 篇第章 數據挖掘基礎  某知名連鎖餐飲企業的鴉拜騙困惑  從餐飲服務到數據挖掘  數據挖掘的基本任務  數據挖掘建模過程1.4.1 定義挖掘目標1.4.2 數據取樣1.4.3 數據探索1.4.4 數據預處理1.4.5 挖掘建模1.4.6 模型評價  餐飲服務中的大數據套用  小結第章 基嬸酷旬礎  概述2.1.1 簡介2.1.2 生態系統  安裝與配置  原理2.3.1 原理2.3.2 原理2.3.3 原理  動手實踐  小結第章 生態系統:  概述3.1.1 簡介3.1.2 安裝與配置  原理3.2.1 架構3.2.2 的數據模型  動手實踐  小結第章 生態系統:  概述4.1.1 簡介4.1.2 安裝與配置  原理4.2.1 架構4.2.2 與槳斷宙殼4.2.3 訪問接口4.2.4 數據模型  動手實踐  小謎台漿結第章 大數據挖掘建模平台  常用的大數據平台  大數據挖掘建模平台5.2.1 大數據挖掘建模平台的功能5.2.2 大數據挖掘建模平台操作流程及實例5.2.3 大數據挖掘建模平台的特點  小結第章 挖掘建模  分類與預測6.1.1 實現過程6.1.2 常用的分類與預測算法6.1.3 決策樹6.1.4 中算法的實現原理6.1.5 動手實踐  聚類分析6.2.1 常用聚類分析算法6.2.2 聚類算旬鞏戀法6.2.3 中算法的實現原理6.2.4 動手實踐  關聯規則6.3.1 常用的關聯規則算法6.3.2 關聯規則算法6.3.3 中算法的實現原理6.3.4 動手實踐  協同過濾6.4.1 常用的協同過濾算法6.4.2 基於妹說項目的協同過濾算法簡介6.4.3 中算法的實現原理6.4.4 動手實踐  小結實 戰 篇第章 法律諮詢數據分析與服務推薦  背景與挖掘目標  分析方法與過程7.2.1 數據抽取7.2.2 數據探索分析7.2.3 數據預處理7.2.4 模型構建  上機實驗  拓展思考  小結第章 電商產品評論數據情感分析  背景與挖掘目標  分析方法與過程8.2.1 評論數據採集8.2.2 評論預處理8.2.3 文本評論分詞8.2.4 構建模型  上機實驗  拓展思考  小結第章 航空公司客戶價值分析  背景與挖掘目標  分析方法與過程9.2.1 數據抽取9.2.2 數據探索分析9.2.3 數據預處理9.2.4 模型構建  上機實驗  拓展思考  小結第章 基站定位數據商圈分析  背景與挖掘目標  分析方法與過程10.2.1 數據抽取10.2.2 數據探索分析10.2.3 數據預處理10.2.4 構建模型  上機實驗  拓展思考  小結第章 網際網路電影智慧型推薦  背景與挖掘目標  分析方法與過程11.2.1 數據抽取11.2.2 構建模型  上機實驗  拓展思考  小結第章 家電故障備件儲備預測分析  背景與挖掘目標  分析方法與過程12.2.1 數據探索分析12.2.2 數據預處理12.2.3 構建模型  上機實驗  拓展思考  小結第章 市供水混凝投藥量控制分析  背景與挖掘目標  分析方法與過程13.2.1 數據抽取13.2.2 數據探索分析13.2.3 數據預處理13.2.4 構建模型  上機實驗  拓展思考  小結第章 基於圖像處理的車輛壓雙櫃她擊譽黃線檢測  背景與挖掘目標  分析方法與過程14.2.1 數據抽取14.2.2 數據探索分析14.2.3 數據預處理14.2.4 構建模型  上機實驗  拓展思考  小結高 級 篇第章 基於的大數據挖掘開發  概述  環境配置  基於算法接口的二次開發15.3.1 算法實例15.3.2 算法接口的二次開發示例  小結第章 基於的數據挖掘二次開發  概述16.1.1 大數據挖掘建模平台服務接口16.1.2 簡介  大數據挖掘建模平台服務開發實例16.2.1 環境配置16.2.2 開發實例  小結參考資料

作者簡介

張良均,資歷大數據挖掘專家和模式識別專家,不錯信息項目管理師,有10多年的大數據挖掘套用、諮詢和培訓經驗。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗很好豐富。此外,他精通Java EE企業級套用開發,是廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院兼職教授,著有《神經網路實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等暢銷書。

作者簡介

張良均,資歷大數據挖掘專家和模式識別專家,不錯信息項目管理師,有10多年的大數據挖掘套用、諮詢和培訓經驗。為電信、電力、政府、網際網路、生產製造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘套用與諮詢服務,實踐經驗很好豐富。此外,他精通Java EE企業級套用開發,是廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院兼職教授,著有《神經網路實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等暢銷書。

相關詞條

熱門詞條

聯絡我們