《從零進階!數據分析的統計基礎》是2015年電子工業出版社出版的圖書,作者是人大經濟論壇。
基本介紹
- 書名:從零進階!數據分析的統計基礎
- 作者:人大經濟論壇 主編 曹正鳳 編著
- ISBN:978-7-121-25244-0
- 類別:辦公軟體
- 頁數:168
- 定價:49
- 出版社:電子工業出版社
- 出版時間:2015-2
- 裝幀:平裝
- 開本:16
內容簡介,基本信息,編輯推薦,內容提要,目錄,作者簡介,前言,讀者對象,閱讀指南,本書特點,學習方法,致謝,
內容簡介
《從零進階!數據分析的統計基礎》共 6 章,分別講解了數據分析的步驟和方法、描述性統計分析、抽樣估計、假設檢驗、方差分析、 相關與回歸分析,使用簡單的語言介紹了這些數據分析基本方法的核心思想和涉及的統計學、機率論等方面 的理論內容,並使用圖示的方法詳細介紹了使用 Excel 2013 進行簡單的描述性統計分析和使用 SPSS 進行相 關的數據分析的過程與結果分析。
《從零進階!數據分析的統計基礎》適合需要提升自身數據分析理論和實踐能力的職場新人;在市場行銷、金融、財務、人力資源管理 中需要數據分析的人士;從事諮詢、研究、分析等的專業人士。也可以作為數據分析師職業培訓的教材,普通高等院校非統計專業數據分析的選修教材。
基本信息
從零進階!數據分析的統計基礎(CDA數據分析師系列叢書,首套寫給專業數據分析師的叢書)
人大經濟論壇 主編 曹正鳳 編著
ISBN 978-7-121-25244-0
2015年2月出版
定價:49.00元
168頁
16開
編輯推薦
CDA數據分析師系列叢書按照數據分析師規範化學習體系而定,對於一名初學者,應該先掌握必要的機率、統計理論基礎,包括描述性分析,推斷性分析,參數估計,假設檢驗,方差分析,回歸分析等內容,這在第一本書《從零進階!數據分析的統計基礎》中進行了專業詳細的講解。其次,數據分析需要按照標準流程進行,即數據的獲取、儲存、整理、清洗、歸約等系列數據處理技術,這在《如虎添翼!數據處理的SAS EG實現》中利用SAS EG和編程技術進行了操作過程的詳解。最後,經過處理的數據需要根據業務問題,利用相關方法進行建模分析,得出結果,結果檢驗,繪製圖表並解讀數據,這在《胸有成竹!數據分析的SAS EG進階》中進行了詳細的講解和操作分析。
CDA數據分析師叢書整體風格是“理論>技術>套用”的一個學習過程,最終目的在於商業業務套用、職場數據分析,為欲從事於數據分析領域的各界人士提供了一個規範化數據分析師的學習體系。
內容提要
《從零進階!數據分析的統計基礎》共 6 章,分別講解了數據分析的步驟和方法、描述性統計分析、抽樣估計、假設檢驗、方差分析、 相關與回歸分析,使用簡單的語言介紹了這些數據分析基本方法的核心思想和涉及的統計學、機率論等方面 的理論內容,並使用圖示的方法詳細介紹了使用 Excel 2013 進行簡單的描述性統計分析和使用 SPSS 進行相 關的數據分析的過程與結果分析。
《從零進階!數據分析的統計基礎》適合需要提升自身數據分析理論和實踐能力的職場新人;在市場行銷、金融、財務、人力資源管理 中需要數據分析的人士;從事諮詢、研究、分析等的專業人士。也可以作為數據分析師職業培訓的教材,普通高等院校非統計專業數據分析的選修教材。
目錄
第 1 章 數據分析概述 1
1.1 什麼是數據分析 . 2
1.2 數據分析六步曲 . 2
1.2.1 明確分析目的和內容 . 2
1.2.2 數據收集. 3
1.2.3 數據預處理. 3
1.2.4 數據分析. 3
1.2.5 數據展現. 4
1.2.6 報告撰寫. 5
1.3 數據分析方法簡介 . 5
1.3.1 統計分析方法簡介 . 5
1.3.2 數據挖掘方法簡介 . 6
1.3.3 統計分析與數據挖掘的區別和聯繫 . 9
1.4 常用數據分析工具的安裝 . 10
1.4.1 在 Excel 2013 中安裝數據分析工具 . 10
1.4.2 數據分析軟體 SPSS 的安裝 13
1.5 課後練習 . 18
第 2 章 描述性統計分析 19
2.1 直方圖 . 20
2.1.1 什麼是直方圖. 20
2.1.2 如何看直方圖. 20
2.1.3 如何畫直方圖. 20
2.1.4 使用 Excel 2013 進行直方圖的繪製 . 22
2.2 數據的計量尺度 . 24
2.3 數據的集中趨勢 . 25
2.3.1 定量數據:平均數 . 25
2.3.2 順序數據:中位數和分位數 . 27
2.3.3 分類數據:眾數. 27
2.4 數據的離中趨勢 . 28
2.4.1 極差 28
2.4.2 分位距 29
2.4.3 平均差 29
2.4.4 方差與標準差 30
2.4.5 離散係數 32
2.5 數據分布的測度 . 33
2.5.1 數據偏態及其測定. 34
2.5.2 數據峰度及其測定. 34
2.5.3 數據偏度和峰度的作用. 35
2.6 數據的展示——統計圖 . 35
2.6.1 條形圖與扇形圖. 36
2.6.2 折線圖 36
2.6.3 莖葉圖 37
2.6.4 箱線圖 40
2.6.5 統計圖小結 42
2.7 使用 Excel 實現數據的描述性統計及分析 43
2.7.1 使用 Excel 實現三國全部武將武力描述性統計 43
2.7.2 使用 Excel 分別實現三個國家武將武力描述性統計分析 44
2.8 課後習題. 45
第 3 章 抽樣估計 . 48
3.1 抽樣估計基礎 . 49
3.1.1 隨機事件 49
3.1.2 隨機事件的機率. 50
3.1.3 隨機變數及其機率分布. 52
3.1.4 隨機變數的數字特徵. 55
3.2 常態分配及三大分布 . 56
3.2.1 常態分配的機率密度函式. 56
3.2.2 常態分配的特徵. 57
3.2.3 標準常態分配 58
3.2.4 基於常態分配的三大分布. 61
3.3 中心極限定理 . 63
3.3.1 中心極限定理的提法. 63
3.3.2 中心極限定理的內容. 64
3.3.3 中心極限定理的意義與套用 . 64
3.4 抽樣估計 . 65
3.4.1 抽樣估計概述. 66
3.4.2 抽樣估計的基本概念 . 66
3.4.3 抽樣估計的誤差 . 70
3.4.4 抽樣估計的理論基礎 . 72
3.4.5 抽樣估計的方法 . 73
3.4.6 抽樣的組織形式 . 77
3.4.7 必要抽樣數目的確定 . 78
3.5 課後習題 . 80
第 4 章 假設檢驗 86
4.1 假設檢驗概述 . 87
4.1.1 假設檢驗的概念 . 87
4.1.2 假設檢驗的基本思想 . 87
4.1.3 假設檢驗在數據分析中的作用 . 88
4.2 假設檢驗的分析方法 . 88
4.2.1 假設檢驗的基本步驟 . 88
4.2.2 假設檢驗與區間估計的聯繫 . 90
4.2.3 假設檢驗中的兩類錯誤 . 92
4.2.4 利用 P 值進行決策 92
4.2.5 套用假設檢驗需要注意的問題 . 94
4.3 常見的檢驗統計量 . 94
4.3.1 z 檢驗統計量 95
4.3.2 t 檢驗統計量. 96
4.3.3 2 檢驗統計量. 97
4.3.4 F 檢驗統計量 . 97
4.3.5 各種檢驗統計量一覽表 . 97
4.4 SPSS 中常用的幾種 t 檢驗實例 99
4.4.1 單樣本 t 檢驗 99
4.4.2 兩獨立樣本 t 檢驗 102
4.4.3 配對樣本 t 檢驗 106
4.5 課後習題 . 110
第 5 章 方差分析 114
5.1 方差分析 . 115
5.1.1 方差分析的概述 . 115
5.1.2 方差分析的幾個概念 . 115
5.1.3 單因素方差分析中的基本假定 . 116
5.2 單因素方差分析 . 116
5.2.1 單因素方差分析的原理. 116
5.2.2 單因素方差分析的數據結構 . 117
5.2.3 單因素方差分析的統計量. 118
5.2.4 單因素方差分析的基本步驟 . 119
5.3 使用 SPSS 實現單因素方差分析的步驟及結果分析 . 119
5.3.1 操作步驟及必要說明. 119
5.3.2 對操作結果的分析. 123
5.4 課後習題. 126
第 6 章 相關與回歸分析 130
6.1 變數間的關係 . 131
6.1.1 函式關係及特點. 131
6.1.2 相關關係及特點. 131
6.2 相關分析. 132
6.2.1 相關分析及步驟. 132
6.2.2 散點圖的繪製 132
6.2.3 相關係數 133
6.2.4 相關係數的顯著性檢驗. 134
6.2.5 使用 SPSS 實現相關分析 135
6.3 一元線性回歸分析 . 137
6.3.1 一元回歸模型及相關假定. 138
6.3.2 一元線性回歸方程及求法. 138
6.3.3 回歸直線的擬合優度. 139
6.3.4 回歸模型的檢驗. 139
6.4 使用 SPSS 實現一元線性回歸分析 141
6.4.1 畫散點圖和趨勢線. 142
6.4.2 簡單相關分析 145
6.4.3 一元線性回歸分析的操作步驟 . 145
6.4.4 一元線性回歸分析的結果解讀 . 150
6.5 課後習題. 153
附錄 A 三國武將數據 . 160
附錄 B CDA(註冊數據分析師)致力於最好的數據分析人才建設 . 175
作者簡介
人大經濟論壇:於2003年成立,致力於推動經管學科的進步,傳播優秀教育資源,目前已經發展成為國內最大的經濟、管理、金融、統計類的線上教育和諮詢網站,也是國內最活躍和最具影響力的經管類網路社區。
人大經濟論壇從2006年起在國內最早開展數據分析培訓,累計培訓學員數萬人,在大數據的趨勢背景下,作為Certified Data Analyst Institute(註冊數據分析師協會,簡稱CDA協會)的中國唯一授權中心,根據CDA協會的數據分析師LevelⅠ(業務分析師)、Level Ⅱ(建模分析師)、Level Ⅲ(數據專家)的等級標準,致力於培養正規化、科學化、專業化的數據分析師隊伍,為企事業單位輸送更多優秀數據分析人才。(Certified Data Analyst Institute,亦稱“註冊數據分析師協會”,成立於美國德拉瓦州,主要宗旨為匯聚國際先進的數據分析技術,建設國際性規範化數據分析師職業標準,推進數據分析師的行業發展及認證工作,標準行業認證為CDA數據分析師)
曹正鳳,統計學專業博士,具有多年的數據分析項目實踐經驗和統計學教學經驗,人大經濟論壇CDA金牌講師,北京石油化工學院實驗師,研究方向為數據挖掘領域的前沿算法研究,包括隨機森林算法、神經網路等,發表多篇論文,且發表的EI核心收錄論文受到多次檢索。
前言
感謝您選擇“CDA 數據分析師”LevelⅠ學習系列叢書”之《從零進階!數據分析的統計基礎》 眾所周知,數據分析的基礎是統計學,沒有機率論和數理統計的知識,數據分析尤如無根之草, 只能浮游在華麗的詞藻上,數據分析師的職業發展之路也走不長遠,因此掌握數據分析的統計學基礎 知識是非常重要的。統計學作為一門學科,其內容之多,不是一本書能概括得了的,而為了使零基礎 的讀者,儘快進階成一名具有統計基礎的數據分析師,本書為此做出了積極的探索。取其精華,論其 重點,使讀者能儘快地掌握一些數據分析師必備的統計學知識,這是本書的目的,也是學習本書的讀 者所想要達到的最終目標。掌握本書中的內容,您將在數據分析師這個職業之路上走得更遠,更踏實。 本書按照數據分析必備的統計學基礎知識來講解,以三國武將數據為案例背景,由淺入深、由易 到難地向您展示統計學基礎理論。由於三國時期的歷史背景家喻戶曉,讀者可以不必費力地探究案例 的背景知識,讓您能夠將更多的精力放在學習核心的理論知識上,從而為今後的數據分析工作打下堅實的理論基礎。
讀者對象
本書適合需要提升自身數據分析理論和實踐能力的職場新人;在市場行銷、金融、財務、人力資 源管理中需要數據分析的人士;從事諮詢、研究、分析等的專業人士,也可以將其作為數據分析師職 業培訓的教材,普通高等院校非統計專業數據分析的選修教材。
閱讀指南
詳細的章節內容如下:
第 1 章 數據分析概述
本章主要介紹數據分析的概念、分析步驟和分析方法,介紹如何在 Excel 2013 中安裝數據分析工 具,這是在後續課程中進行數據分析的基礎。
第 2 章 描述性統計分析 本章主要介紹數據分析中最基本的分析方法——描述性統計分析,主要包括數據的集中趨勢、離
中趨勢和數據分布的測度指標分析方法,直方圖、莖葉圖、箱線圖等統計圖的含義和畫法,介紹如何在 Excel 2013 中實現數據的描述性統計分析。 第 3 章 抽樣估計 本章主要介紹推斷統計的基礎——抽樣估計,主要包括抽樣估計的基礎知識、三種在數據分析中經常用到的分布及中心極限定理等內容,詳細介紹抽樣誤差、抽樣估計方法和抽樣組織形式等抽樣估 計的重要內容,本章介紹的內容為數據分析師在進行數據分析時所需要的最基礎的知識。
第 4 章 假設檢驗 本章主要介紹數據分析中必須用到的一種統計分析方法——假設檢驗,它是抽樣推斷的主要內容之一,本章的主要內容包括假設檢驗的基本思想、步驟和假設檢驗中經常用到的檢驗統計量,並介紹SPSS 中常用的幾種 T 檢驗方法。 第 5 章 方差分析 本章主要介紹數據分析中比較多個總體的均值是否相等的檢驗方法——方差分析,主要包括方差分析的相關概念、單因素方差分析的原理、統計量構造過程等內容,並介紹如何在 SPSS 中實現單因 素方差分析及對結果的分析。
第 6 章 相關與回歸分析 本章主要介紹相關和回歸分析,兩者均是套用極其廣泛的數據分析方法。主要內容包括變數間的關係、相關分析的概念和步驟、一元線性回歸分析的相關概念和相關假定、一元線性回歸方程及求法、一元線性回歸分析和檢驗的內容,並介紹如何使用 SPSS 實現相關分析和回歸分析。
本書特點
本書的主要特點有兩個方面。 一是理論內容畫龍點睛。 數據分析涉及統計學、機率論等眾多內容,如何較快地實現從菜鳥到數據分析師的進階,就必須有針對性地學習必要的知識,如何正確地引導讀者抓住數據分析的精髓和要點,這是本書試圖解決的 問題。如果這個問題得到解決,那么將極大地節省讀者進行數據分析的成本,從而較快地進階為一名 數據分析師。讀者有時候也會有這樣的一些感覺,當面對厚厚的一本統計學教材時,總有一種望而卻 步的感覺,失去了學下去的勇氣。編寫本書的本意,就在於讓讀者能在短期內,對數據分析師需要知 道的基礎知識做一個系統而完整的介紹,恰到好處地對精華內容進行展示,使讀者能少而精地把握數 據分析的基本要領,從而激起讀者進一步學習的欲望。讀完本書後,你會發現,其實要成為一名數據 分析師,需要掌握的知識也不是太多,因為有些內容貴在精,而不在多。
二是一個案例貫穿始終。
本書在講解統計基礎理論時,均使用同一個案例,且該案例貫穿全書的始終。以三國時期的武將數據作為例子進行介紹數據分析的過程,由於三國的歷史背景大家都較為熟悉,因此讀者不必費力熟 悉數據分析的業務背景,而是直接進入使用數據說話的奇妙世界。
學習方法
本書是數據分析師入門的基礎理論部分,其宗旨在於將數據分析師需要具備的核心理論進行描述, 而有些統計學理論沒有全面的展開,因此讀者需要根據自己的需要適當地查閱相關的理論知識,對所 學的內容進一步鞏固,達到由點到線,由線到面的學習效果。
書中前 4 章的結構是從易到難,由基礎到提高,建議讀者順序閱讀,以掌握數理統計的基本理論 知識。從第 5 章開始,其結構雖然是從易到難,但章節之間相互獨立,即可以從任意章節開始學習,不需要遵照從前到後的順序閱讀。
致謝
本書由人大經濟論壇策劃,曹正鳳負責編寫和完成統稿。 叢書從策劃到出版,傾注了電子工業出版社計算機圖書分社張慧敏、石倩、官楊、張童等多位編輯的心血,特在此表示衷心地感謝! 為保證叢書的質量,使其更貼近讀者,我們組織了人大經濟論壇的多位版主和高級會員參與了本書的預讀工作,他們是楊同梅、田佳、孫華楓、原瑜芬、葉陣雨、鄭贇、李劍宇、江翊雪、陳鵬、劉 莎莎、丁亞軍。感謝各位預讀員的辛勤、耐心與細緻,使得本叢書能以更加完善的面目與各位讀者見 面,特別感謝覃智勇圓滿地組織了本次預讀工作和審校工作。
儘管作者們對書中的案例精益求精,但疏漏仍然在所難免,如果您發現書中的錯誤或某個案例有 更好的解決方案,敬請登錄社區網站向作者反饋,我們將儘快在社區中給出回復,且在本書再次印刷 時修正。
再次感謝您的支持!