數據挖掘實用案例分析

數據挖掘實用案例分析

《數據挖掘實用案例分析》是2018年2月清華大學出版社出版的圖書,作者是趙衛東、董亮。

基本介紹

  • 中文名:數據挖掘實用案例分析
  • 作者:趙衛東、董亮
  • 出版社:清華大學出版社
  • 出版時間:2018年2月
  • 定價:49 元
  • 裝幀:平裝 
  • ISBN:9787302490494
內容簡介,圖書目錄,

內容簡介

數據挖掘已經廣泛套用於各行各業,並催生了數據分析師的興起。本書結合項目實踐,首先對數據挖掘的核心問題進行了總結,並以保險推薦為例說明數據挖掘過程中每個步驟需要關注之處; 然後,結合香水銷售分析,討論可視化圖形的基本套用。為增強本書的實用性,提高讀者的動手能力,後續章節詳細地分析了數據挖掘在銀行信用卡、餐飲、商務酒店、製造業、公安等領域的套用。此外,本書還介紹了卷積神經網路在音頻數據處理方面的實際套用。
本書內容深入淺出,案例生動形象,可以作為高校相關專業“數據挖掘”“機器學習”“商務數據分析”等課程的實驗教材,也可以供學習數據分析的社會人士參考。

圖書目錄

第1章數據分析過程的主要問題
1.1業務理解
1.2數據理解
1.3數據質量問題與預處理
1.4數據分析常見陷阱
1.5數據分析方法的選擇
1.5.1分類算法
1.5.2聚類算法
1.5.3關聯分析
1.5.4回歸分析
1.5.5深度學習
1.5.6統計方法
1.6數據分析結果的評價
1.6.1分類算法的評價
1.6.2聚類結果的評價
1.6.3關聯分析的評價
1.6.4回歸分析結果的評價
1.6.5深度學習的評價
1.7數據分析團隊的組建
1.7.1項目經理
1.7.2業務專家
1.7.3數據工程師
1.7.4數據建模人員
1.7.5可視化人員
1.7.6評估人員
1.8數據分析人才培養的難題
1.8.1數理要求高
1.8.2跨學科綜合能力
1.8.3國內技術資料少
1.8.4實踐機會少
第2章數據挖掘算法的選擇——保險產品推薦
2.1業務理解
2.2數據分析目標
2.3數據探索
2.3.1數據質量評估
2.3.2探索數據統計特性
2.3.3數據降維
2.4模型選擇過程
2.4.1算法初選
2.4.2算法驗證
2.4.3算法最佳化
2.4.4平衡數據集
2.4.5修改模型參數
2.5總結
第3章常用可視化的多維分析
3.1箱圖
3.2雷達圖
3.3標籤雲
3.4氣泡圖
3.5樹圖
3.6地圖
3.7高低圖
3.8雙軸圖
3.9關係圖
3.10熱圖
第4章SPSS Modeler建模組件介紹
4.1數據預處理組件
4.1.1數據清理組件
4.1.2數據集成組件
4.1.3數據選擇組件
4.1.4數據變換組件
4.2數據挖掘建模組件
4.2.1模型篩選
4.2.2自動建模
4.2.4貝葉斯網路模型
4.2.6支持向量機模型
4.2.8統計模型
4.2.9聚類模型
4.2.10關聯分析
4.2.11KNN模型
4.2.12數據挖掘模式評估
4.3知識表示
4.3.1圖形節點
4.3.2數據輸出
4.3.3數據導出
第5章香水銷售分析
5.1香水銷售數據預處理
5.2香水銷售數據統計分析
5.3影響香水銷量的因素分析
5.4香水適用場所關聯分析
5.5香水聚類分析
5.6香水行銷建議
第6章銀行信用卡欺詐與拖欠行為分析
6.1客戶信用等級影響因素
6.1.1客戶信用卡申請數據預處理
6.1.2信用卡申請成功影響因素
6.2信用卡客戶信用等級影響因素
6.3基於消費的信用等級影響因素
6.4信用卡欺詐判斷模型
6.4.1基於Apriori算法的欺詐模型
6.4.2基於判別的欺詐模型
6.4.3基於分類算法的欺詐模型
6.5欺詐人口屬性分析
6.5.1欺詐人口屬性統計分析
6.5.2基於邏輯回歸的欺詐人口屬性分析
6.5.3逾期還款的客戶特徵
6.5.4基於決策樹分析逾期客戶特徵
6.5.5基於回歸分析逾期客戶特徵
6.5.6根據消費歷史分析客戶特徵
6.5.7基於聚類分析客戶特徵
6.5.8基於客戶細分的聚類分析
第7章海底撈火鍋運營分析
7.1火鍋相關數據抓取
7.2數據預處理
7.3數據分析
7.3.1海底撈運營分析
7.3.2店鋪選址分析
7.4菜品關聯分析
7.5用戶評論與評分的關聯分析
7.6顧客情感分析
第8章商務賓館競爭分析
8.1目前經濟型酒店行業競爭態勢
8.2用戶相關數據準備
8.3通過Python編程抓取評論
8.4數據預處理
8.5商務賓館客戶數據分析
8.5.1酒店評分影響因素
8.5.2酒店評分與酒店業績關係
8.5.3酒店評分分析
8.5.4客戶情感分析
8.5.5競爭分析
8.6建議
第9章耐熱導線工廠質量管理數據分析
9.1項目概述
9.2耐熱導線生產質量數據預處理
9.3耐熱鋁線質量檢測數據分析
第10章基於邏輯回歸模型的高危人員分析
10.1高危人員分析需求
10.2高危人群相關數據收集與預處理
10.3建立模型
第11章卷積神經網路在音頻質量評價領域的套用
11.1深度學習基礎
11.1.1深度學習的發展過程
11.1.2深度學習常用技術框架
11.1.3常用的深度學習算法
11.2音頻質量評價
11.2.1音頻樣本及特徵預處理
11.2.2音頻特徵選擇
11.2.3卷積神經網路模型訓練
11.2.4模型參數調優
11.3性能驗證
參考文獻

相關詞條

熱門詞條

聯絡我們