含網路結構的離散選擇模型:理論及套用研究

含網路結構的離散選擇模型:理論及套用研究

《含網路結構的離散選擇模型:理論及套用研究》是依託中央財經大學,由潘蕊擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:含網路結構的離散選擇模型:理論及套用研究
  • 項目類別:青年科學基金項目
  • 項目負責人:潘蕊
  • 依託單位:中央財經大學
項目摘要,結題摘要,

項目摘要

網際網路和移動網際網路的快速發展的一個重要標誌即社交網站的興起,由此產生了海量的網路結構數據。網路結構數據具有體量大、結構複雜、維度高等特點,在研究消費者行為、探求社會資本流動以及提供網站用戶畫像等方面起到了重要作用。這使得對網路結構數據的統計分析存在大量的實際需求。然而,現階段能夠直接使用的統計學工具卻非常有限。本項目充分利用網路結構數據的特徵和企業面臨的實際需求,提出含網路結構的離散選擇模型。重點研究模型的估計方法、變數選擇方法和基於網路抽樣的統計推斷方法。試圖建立圍繞網路結構數據的統計分析新方法和理論體系。與此同時,本項目的研究能夠廣泛地套用於大規模網路結構數據,為網際網路和移動網際網路企業在網路行銷、用戶購買行為研究和用戶畫像等方面提供一類嶄新而有效的統計工具,具有非常實際的套用價值。

結題摘要

項目的研究內容主要集中在兩個方面,一是大規模網路結構數據的回歸分析,包括模型的建立、估計以及理論性質的研究;二是以車聯網數據為典型代表的套用研究。在理論研究方面,主要的研究進展包括網路的生成機制研究和帶有網路結構的回歸分析研究。一方面,在網路生成機制的研究中,提出了用於解釋網路生成的潛在移動平均模型。另一方面,在帶有網路結構的回歸分析的研究問題上,對帶有時間序列特徵的網路結構數據進行了統計分析,提出了網路向量自回歸模型,重點研究了模型估計方法和理論性質,並且將這一模型套用於新浪微博數據的動態分析。該論文成果Network Vector Autoregression發表在Annals of Statistics上。此外,對於含網路結構的離散選擇模型,利用網路結構數據和線性判別分析的工具解決分類問題。論文成果Network Linear Discriminant Analysis已經在Computational Statistics and Data Analysis上發表。另外一篇基於網路結構數據和邏輯回歸模型解決分類問題的工作Network Logistic Regression Model也已經被Statistica Sinica接收。在套用研究方面,關注以車聯網數據和位置數據為主的統計分析與建模。在這一研究方向上,有2個重要的科研論文發表。論文Usage Based Insurance with POI data以UBI車險業務為研究對象。文章通過車聯前裝設備採集駕駛行為數據與車輛位置點數據,以車輛出險情況為因變數,建立邏輯回歸模型。根據分析結果,文章對駕駛員出險風險進行細分,並且針對車險保費定價的實施給出了一定的解讀與建議。項目負責人與車聯網大數據公司有著長期的合作,研究所使用的數據部分來自該公司。論文的研究成果,已經被公司採納並且落地成數據產品,幫助制定個性化UBI車險,為公司帶來了一定的社會經濟效益。另一篇論文A case study for Beijing Point of Interest Data Using Group Linked Cox Process研究了上百萬數量級的位置數據,主要為新浪微博的北京市的簽到數據。文章利用隨機點過程中的Cox過程,將北京的位置點數據進行了分組和歸納,並且對北京的各類商圈聚集效應進行了解讀。

相關詞條

熱門詞條

聯絡我們