大數據分析師面試筆試寶典

內容簡介

《大數據分析師面試筆試寶典》旨在幫助讀者了解大數據分析師的工作內容、技能要求、各類常用技術的原理和可能套用的場景。

大數據分析是一個多學科交叉的領域，包含了統計學、計算機科學、運籌學乃至市場行銷學等。《大數據分析師面試筆試寶典》並沒有介紹大數據分析領域涉及的所有方面，而是根據當前用人單位對大數據分析師的需求，選擇了其中較為重要的內容進行解析，將當前大數據分析涉及的熱點技術一網打盡。

閱讀《大數據分析師面試筆試寶典》需要具備一定的數理統計知識基礎和計算機編程背景。本書儘量不去證明一些在理論界已有的結論，而是用淺顯的語言來解釋複雜的公式，以便讀者更為輕鬆地掌握全書的知識，從而能夠從容面對面試以及日常工作。

圖書目錄

第1章面試經驗／1

1.1 大數據分析技能要求／1

1.1.1 數據分析師／1

1.1.2 數據開發工程師／4

1.1.3 數據挖掘工程師／7

1.1.4 職業能力模型／10

1.2 數據分析工作流程／10

1.2.1 組織架構／10

1.2.2 分析流程／11

1.3 數據分析師臨場面試／13

1.3.1 如何準備面試／13

1.3.2 面試問題／16

1.4 本章總結／18

第2章統計學知識／19

2.1 機率知識／19

2.1.1 機率模型之間的關係解析／19

2.1.2 機率相關面試題／25

2.1.3 貝葉斯公式／28

2.2 參數估計／31

2.2.1 點估計／31

2.2.2 區間估計／34

2.3 假設檢驗／41

2.3.1 假設檢驗原理／41

2.3.2 兩類錯誤／43

2.3.3 假設檢驗的常用方法／45

2.4 抽樣技術解析／49

2.4.1 樣本量影響因素分析／50

2.4.2 假設檢驗樣本量計算／52

2.4.3 參數估計樣本量計算／53

2.5 馬爾可夫模型／54

2.5.1 馬爾可夫過程原理／55

2.5.2 馬爾可夫模型計算／55

2.6 隱馬爾可夫模型／57

2.6.1 HMM和三類問題／57

2.6.2 求機率問題／58

2.6.3 預測問題／59

2.6.4 學習問題／60

2.7 EM算法／62

2.7.1 基本思想／62

2.7.2 算法流程／63

2.8 本章總結／63

第3章數據挖掘算法／65

3.1 常用聚類算法／66

3.1.1 Kmeans算法／66

3.1.2 DBSCAN算法／68

3.1.3 聚類算法評估／69

3.2 常用分類算法／74

3.2.1 決策樹／74

3.2.2 樸素貝葉斯／79

3.2.3 KNN／80

3.2.4 SVM／81

大數據分析師面試筆試寶典

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條