大數據流下調查數據的統計分析

大數據流下調查數據的統計分析

《大數據流下調查數據的統計分析》是2018年中國社會科學出版社出版的圖書,作者是張喆。

基本介紹

  • 中文名:大數據流下調查數據的統計分析
  • 作者:張喆
  • ISBN:9787520328098
  • 出版社中國社會科學出版社
  • 出版時間:2018-08-01
  • 裝幀:平裝
  • 開本:16開
  • 叢書名:中青文庫
內容簡介,目錄,作者簡介,

內容簡介

大數據是一把雙刃劍,給統計學科的發展既帶來機遇又提出挑戰,本文正是基於此進行討論。
在大數據背景下,首先根據大數據流的形式和特徵,提出了在大數據時代抽樣調查仍有存在意義的觀點;其次確立大數據的分析邏輯體系,將對大數據流的統計分析問題定義為“推斷災難”體系,由“維度問題”和“結構問題”構成,其中對“維度問題”的含義和解決方法進行了歸納和總結,對於“結構問題”,本文根據大數據的特性,將大數據信息看作是真實數據和虛假信息的匯總,構建了大數據下的結構模型,並通過數理證明得到了大數據下模型參數估計會減小的結論;再次面對大數據的結構問題時,作者提出了兩種解決思路,通過模擬分析,驗證了這兩種方法在處理大數據問題時的有效性;最後由於大數據具有多元數據流的特性,使得對同一變數有不同的觀察值,而使用哪個值來估計會產生問題,本文依照因子分析的邏輯展開討論,建立了多元大數據流模型,並推導出真實變數的估計方程。
本文作為一種嘗試,從統計分析的角度入手,望能擴展大數據的研究視野。

目錄

第1章 緒論
1.1 選題的背景和意義
1.1.1 選題的背景
1.1.2 選題的意義
1.2 大數據研究概況
1.2.1 大數據研究的發展概況
1.2.2 大數據背景下有關抽樣的研究概況
1.2.3 大數據背景下有關推斷的研究概況
1.3 論文研究的基本框架
1.3.1 論文研究的思路
1.3.2 論文研究的結構及主要內容
1.3.3 論文的創新點
第2章 大數據流下的抽樣調查
2.1 大數據分析系統的建立
2.1.1 大數據的產生
2.1.2 大數據的取得
2.1.3 大數據的存儲
2.1.4 大數據的分析
2.2 大數據背景下抽樣的意義
2.3 適合大數據背景的抽樣方法
2.4 本章總結
第3章 大數據流下“推斷災難”
3.1 維度問題
3.1.1 問題的引入
3.1.2 “維度問題”的解決辦法
3.2 結構問題
3.2.1 問題的引入
3.2.2 大數據結構的刻畫
3.2.3 大數據衝擊影響的刻畫
3.2.4 統計模擬驗證
3.3 本章總結
第4章 “結構問題”下的兩種處理方法
4.1 解決路徑一:SIMEX方法
4.1.1 處理問題的思路
4.1.2 SIMEX的理論展開
4.1.3 SIMEX方法的模擬驗證
4.2 解決路徑二:Regression Calibration方法
4.2.1 處理問題的思路
4.2.2 Regression Calibration的理論展開
4.2.3 Regression Calibration方法的模擬驗證
4.2.4 輔助變數的選擇
4.3 本章總結
4.3.1 SIMEX方法總結
4.3.2 Regression Calibration方法總結
第5章 大數據處理中的因子分析邏輯
5.1 問題的引入
5.2 多元數據流下的統計模型
5.2.1 多元數據流下的統計模型建立
5.2.2 多元數據流下的統計模型估計
5.3 因子分析思路的實際驗證
5.3.1 問題的介紹
5.3.2 指標和數據說明
5.3.2 模型的建立與估計
5.4 本章總結
第6章 結論與展望
6.1 討論與結論
6.2 研究展望
參考文獻

作者簡介

張喆,男,1984年生,祖籍山東省惠民縣。2015年畢業於中國人民大學統計學院,獲經濟學博士學位,美國愛荷華州立大學訪問學者。畢業後任教於中國青年政治學院經管學院,現為中國光大集團和清華大學聯合培養博士後。中國商業統計學會理事。主要從事抽樣調查、數據分析和巨觀經濟指標等方面研究,已在《統計研究》等雜誌上發表學術論文十餘篇,參與完成省部級課題兩項。

相關詞條

熱門詞條

聯絡我們