大數據流下調查數據的統計分析

內容簡介

大數據是一把雙刃劍，給統計學科的發展既帶來機遇又提出挑戰，本文正是基於此進行討論。

在大數據背景下，首先根據大數據流的形式和特徵，提出了在大數據時代抽樣調查仍有存在意義的觀點；其次確立大數據的分析邏輯體系，將對大數據流的統計分析問題定義為“推斷災難”體系，由“維度問題”和“結構問題”構成，其中對“維度問題”的含義和解決方法進行了歸納和總結，對於“結構問題”，本文根據大數據的特性，將大數據信息看作是真實數據和虛假信息的匯總，構建了大數據下的結構模型，並通過數理證明得到了大數據下模型參數估計會減小的結論；再次面對大數據的結構問題時，作者提出了兩種解決思路，通過模擬分析，驗證了這兩種方法在處理大數據問題時的有效性；最後由於大數據具有多元數據流的特性，使得對同一變數有不同的觀察值，而使用哪個值來估計會產生問題，本文依照因子分析的邏輯展開討論，建立了多元大數據流模型，並推導出真實變數的估計方程。

本文作為一種嘗試，從統計分析的角度入手，望能擴展大數據的研究視野。

大數據流下調查數據的統計分析

基本介紹

內容簡介

目錄

作者簡介

相關詞條

熱門詞條