統計分析：從小數據到大數據

內容提要

面對小數據和大數據，數據分析師應該如何收集數據信息？傳統的業務框架如何與統計學相關聯？測量學扮演著什麼角色？建模過程有哪些預分析技術和修正技術？建模工作完成後，如何解析？如何歸因？如何預測？等等，這些數據分析能力構成了本書的分析框架。

《統計分析：從小數據到大數據》分為8章，小數據與大數據分析模式的動態切換貫穿全書，展示了數據分析案例的模組化分析思路。第1～3章為數據預分析部分，強調業務問題與統計問題的銜接；第4～6章為統計建模階段，其中附有對行業案例和業務敏感度的訓練、對統計和業務整合的審美建議，進而構造出一套具有靈活調校的數據分析模式。第7～8章解決的問題是，如何將晦澀難懂的統計解釋轉換成業務解釋。

第1 部分數據分析準備

第1 章從業務到統計

1.1 業務需求從哪來 / 002

1.1.1 學習業務的最快途徑：閱讀運營報告 / 002

1.1.2 當務之急：研究痛點 / 004

1.1.3 數據分析之錨：未來戰略方向 / 005

1.1.4 對數據分析“小白”的有益建議 / 005

1.2 從小數據到大數據：數據體量與信息分布 / 008

1.2.1 實驗室：理論驗證 / 009

1.2.2 問卷：理論驗證+ 探索 / 011

1.2.3 資料庫：業務驗證+ 探索 / 012

1.2.4 數據信息與統計模型 / 013

1.2.5 算法套用：是否跨界 / 015

1.2.6 算法特徵：角色 / 016

1.3 數據分析流程的啟示 / 019

1.3.1 假設：驗證與歸因 / 021

1.3.2 小機率：黑天鵝的不確定 / 025

1.3.3 抽樣技術：經濟是根本 / 026

1.3.4 選擇模型：方法論 / 028

1.3.5 顯著性判斷：可證偽 / 029

第2 章變數角色與描述

2.1 如何描述變數 / 032

2.1.1 分類變數與連續變數的分界線 / 032

2.1.2 分類變數及可視化 / 033

2.1.3 連續變數及可視化 / 037

2.2 因變數的測量 / 040

2.2.1 測量級別問題 / 040

2.2.2 是否存在測量誤差 / 045

2.2.3 誰會成為“主角” / 047

2.2.4 y 的量化場景 / 050

2.3 自變數的選擇 / 053

2.3.1 驗證性：x 的選擇 / 054

2.3.2 探索性：x 的選擇 / 054

第3 章數據預分析

3.1 填補缺失 / 056

統計分析：從小數據到大數據

基本介紹

相關詞條

熱門詞條