《MATLAB數據分析與挖掘實戰》是張良均編著的圖書。
基本介紹
- 書名:MATLAB數據分析與挖掘實戰
- 作者:張良均
- ISBN:9787111504351
內容簡介,作品目錄,
內容簡介
《大數據技術叢書:MATLAB數據分析與挖掘實戰》共16章,共三篇。
基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對《大數據技術叢書:MATLAB數據分析與挖掘實戰》所用到的數據挖掘建模工具MATALB進行了簡明扼要的說明;第3章、第4章、第5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理進行了介紹。
實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、網際網路、生產製造以及公共服務等行業的套用進行了分析。在案例結構組織上,《大數據技術叢書:MATLAB數據分析與挖掘實戰》是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程關鍵環節,穿插程式實現代碼。最後通過上機實踐,加深數據挖掘技術在案例套用中的理解。
提高篇(第16章),介紹了基於MATLAB二次開發的數據挖掘套用軟體——TipDM數據挖掘建模工具,並以此工具為例詳細介紹了基於MATLAB接口完成數據挖掘二次開發的各個步驟,使讀者體驗到通過MATLAB實現數據挖掘二次開發的強大魅力。
作品目錄
- MATLAB數據分析與挖掘實戰
- 前言
- 為什麼要寫這本書
- 本書特色
- 本書適用對象
- 如何閱讀本書
- 勘誤和支持
- 致謝
- 基礎篇
- 第1章 數據挖掘基礎
- 1.1 某知名連鎖餐飲企業的困惑
- 1.2 從餐飲服務到數據挖掘
- 1.3 數據挖掘的基本任務
- 1.4 數據挖掘的建模過程
- 1.4.1 定義挖掘目標
- 1.4.2 數據取樣
- 1.4.3 數據探索
- 1.4.4 數據預處理
- 1.4.5 挖掘建模
- 1.4.6 模型評價
- 1.5 常用的數據挖掘建模工具
- 1.6 小結
- 第2章 MATLAB數據分析工具箱簡介
- 2.1 MATLAB的安裝
- 2.2 MATLAB使用入門
- 2.2.1 MATLAB R2014a操作界面
- 2.2.2 MATLAB常用操作
- 2.3 MATLAB數據分析工具箱
- 2.4 配套附屬檔案使用設定
- 2.5 小結
- 第3章 數據探索
- 3.1 數據質量分析
- 3.1.1 缺失值分析
- 3.1.2 異常值分析
- 3.1.3 一致性分析
- 3.2 數據特徵分析
- 3.2.1 分布分析
- 3.2.2 對比分析
- 3.2.3 統計量分析
- 3.2.4 周期性分析
- 3.2.5 貢獻度分析
- 3.2.6 相關性分析
- 3.3 MATLAB主要數據的探索函式
- 3.3.1 統計特徵函式
- 3.3.2 統計作圖函式
- 3.4 小結
- 第4章 數據預處理
- 4.1 數據清洗
- 4.1.1 缺失值處理
- 4.1.2 異常值處理
- 4.2 數據集成
- 4.2.1 實體識別
- 4.2.2 冗餘屬性識別
- 4.3 數據變換
- 4.3.1 簡單的函式變換
- 4.3.2 規範化
- 4.3.3 連續屬性離散化
- 4.3.4 屬性構造
- 4.3.5 小波變換
- 4.4 數據規約
- 4.4.1 屬性規約
- 4.4.2 數值規約
- 4.5 MATLAB主要的數據預處理函式
- 4.6 小結
- 第5章 挖掘建模
- 5.1 分類與預測
- 5.1.1 實現過程
- 5.1.2 常用的分類與預測算法
- 5.1.3 回歸分析
- 5.1.4 決策樹
- 5.1.5 人工神經網路
- 5.1.6 分類與預測算法評價
- 5.1.7 MATLAB主要分類與預測算法函式
- 5.2 聚類分析
- 5.2.1 常用的聚類分析算法
- 5.2.2 K-Means聚類算法
- 5.2.3 聚類分析算法評價
- 5.2.4 MATLAB主要聚類分析算法函式
- 5.3 關聯規則
- 5.3.1 常用的關聯規則算法
- 5.3.2 Apriori算法
- 5.4 時序模式
- 5.4.1 時間序列算法
- 5.4.2 時間序列的預處理
- 5.4.3 平穩時間序列分析
- 5.4.4 非平穩時間序列分析
- 5.4.5 MATLAB主要時序模式算法函式
- 5.5 離群點檢測
- 5.5.1 離群點的檢測方法
- 5.5.2 基於統計模型的離群點的檢測方法
- 5.5.3 基於聚類的離群點的檢測方法
- 5.6 小結
- 實戰篇
- 第6章 電力企業的竊漏電用戶自動識別
- 6.1 背景與挖掘目標
- 6.2 分析方法與過程
- 6.2.1 數據抽取
- 6.2.2 數據探索分析
- 6.2.3 數據預處理
- 6.2.4 構建專家樣本
- 6.2.5 構建模型
- 6.3 上機實驗
- 6.4 拓展思考
- 6.5 小結
- 第7章 航空公司的客戶價值分析
- 7.1 背景與挖掘目標
- 7.2 分析方法與過程
- 7.2.1 數據抽取
- 7.2.2 數據探索分析
- 7.2.3 數據預處理
- 7.2.4 模型構建
- 7.3 上機實驗
- 7.4 拓展思考
- 7.5 小結
- 第8章 中醫證型關聯規則挖掘
- 8.1 背景與挖掘目標
- 8.2 分析方法與過程
- 8.2.1 數據獲取
- 8.2.2 數據預處理
- 8.2.3 模型構建
- 8.3 上機實驗
- 8.4 拓展思考
- 8.5 小結
- 第9章 基於水色圖像的水質評價
- 9.1 背景與挖掘目標
- 9.2 分析方法與過程
- 9.2.1 數據預處理
- 9.2.2 構建模型
- 9.2.3 水質評價
- 9.3 上機實驗
- 9.4 拓展思考
- 9.5 小結
- 第10章 基於關聯規則的網站智慧型推薦服務
- 10.1 背景與挖掘目標
- 10.2 分析方法與過程
- 10.2.1 數據抽取
- 10.2.2 數據預處理
- 10.2.3 構建模型
- 10.3 上機實驗
- 10.4 拓展思考
- 10.5 小結
- 第11章 套用系統負載分析與磁碟容量預測
- 11.1 背景與挖掘目標
- 11.2 分析方法與過程
- 11.2.1 數據抽取
- 11.2.2 數據探索分析
- 11.2.3 數據預處理
- 11.2.4 構建模型
- 11.3 上機實驗
- 11.4 拓展思考
- 11.5 小結
- 第12章 面向網路輿情的關聯度分析
- 12.1 背景與挖掘目標
- 12.2 分析方法與過程
- 12.2.1 數據抽取
- 12.2.2 數據預處理
- 12.2.3 構建模型
- 12.3 上機實驗
- 12.4 拓展思考
- 12.5 小結
- 第13章 家用電器用戶行為分析及事件識別
- 13.1 背景與挖掘目標
- 13.2 分析方法與過程
- 13.2.1 數據抽取
- 13.2.2 數據探索分析
- 13.2.3 數據預處理
- 13.2.4 模型構建
- 13.2.5 模型檢驗
- 13.3 上機實驗
- 13.4 拓展思考
- 13.5 小結
- 第14章 基於基站定位數據的商圈分析
- 14.1 背景與挖掘目標
- 14.2 分析方法與過程
- 14.2.1 數據抽取
- 14.2.2 數據探索分析
- 14.2.3 數據預處理
- 14.2.4 構建模型
- 14.3 上機實驗
- 14.4 拓展思考
- 14.5 小結
- 第15章 氣象與輸電線路的缺陷關聯分析
- 15.1 背景與挖掘目標
- 15.2 分析方法與過程
- 15.2.1 數據抽取
- 15.2.2 數據探索分析
- 15.2.3 數據預處理
- 15.2.4 模型構建
- 15.3 上機實驗
- 15.4 拓展思考
- 15.5 小結
- 提高篇
- 第16章 基於MATLAB的數據挖掘二次開發
- 16.1 混合編程套用體驗——TipDM數據挖掘平台
- 16.1.1 建設目標
- 16.1.2 模型構建
- 16.1.3 模型發布
- 16.1.4 模型調用
- 16.1.5 模型更新
- 16.2 二次開發過程
- 16.2.1 接口算法編程
- 16.2.2 用Library Compiler創建Java組件
- 16.2.3 安裝MATLAB運行時環境
- 16.2.4 JDK環境及設定
- 16.2.5 接口函式的調用
- 16.3 小結