數據分析技術（第2版）使用SQL和Excel工具

內容簡介

SQL是數據查詢的基本語言，Excel是數據分析和展示的最常見工具。兩者結合，可以組成一個強大且易於理解的業務數據分析工具。很多類重要的數據分析並不需要複雜且昂貴的數據挖掘工具。答案就在你的電腦桌上。

這是一本實用指南，作者Gordon S. Linoff是數據挖掘領域的權威專家。書中介紹了如何使用SQL和Excel來設計並完成複雜的數據分析。本書的第1版被廣泛認可，第2版涵蓋了對SQL和Excel新功能的介紹，同時包括新的技術和實際業務示例。第2版介紹了業務經理和數據分析人員所需掌握的最新信息。

本書首先介紹數據挖掘所用的SQL基礎知識，如何使用Excel展示結果，以及用於理解數據的簡單的統計學概念。熟悉執行SQL和操作Excel後，本書介紹了核心分析技術。本書內容逐步從基礎查詢擴展到複雜的套用，使讀者能夠學習到某種數據分析的使用原因和時機，如何設計和實現，以及展示數據分析結果的強大方法。每一步都詳細解釋了業務環境、技術方法以及在所熟悉工具中的具體實現。

隨著對本書的閱讀，你會發現很多知識點，包括地理信息的重要性，圖表中的數據隨時間的變化方式，如何使用生存分析理解客戶任期和變動，以及影響生存率的因素。同時，還會探索到一些方法，包括分析客戶的購買模式、分析購物車以及計算關聯規則。此外，本書還包含重要的SQL數據挖掘模型(線性回歸模型、樸素貝葉斯模型等)、建立客戶簽名所需的信息、用於分析結果集的模型、包含累積增量圖表和ROC圖表、使用SQL的最佳實踐、提高查詢性能的方法等。

圖書目錄

第1章數據挖掘者眼中的SQL 1

1.1 資料庫、SQL和大數據 2

1.1.1 什麼是大數據？ 2

1.1.2 關係型資料庫 3

1.1.3 Hadoop和Hive 3

1.1.4 NoSQL和其他類型的資料庫 3

1.1.5 SQL 4

1.2 繪製數據結構 4

1.2.1 什麼是數據模型？ 5

1.2.2 什麼是表？ 5

1.2.3 什麼是實體-關係圖表？ 8

1.2.4 郵政編碼表 9

1.2.5 訂閱數據集 10

1.2.6 訂單數據集 11

1.2.7 關於命名的提示 12

1.3 使用數據流描述數據分析 12

1.3.1 什麼是數據流？ 13

1.3.2 數據流、SQL和關係代數 16

1.4 SQL查詢 16

1.4.1 做什麼，而不是怎么去做 16

1.4.2 SELECT語句 17

1.4.3 一個基礎的SQL查詢 17

1.4.4 一個基本的SQL求和查詢 19

1.4.5 聯接表的意義 20

數據分析技術（第2版）使用SQL和Excel工具

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條