經濟管理領域中的高維複雜數據分析理論與套用

《經濟管理領域中的高維複雜數據分析理論與套用》是依託北京航空航天大學,由王惠文擔任項目負責人的重點項目。

基本介紹

  • 中文名:經濟管理領域中的高維複雜數據分析理論與套用
  • 依託單位:北京航空航天大學
  • 項目負責人:王惠文
  • 項目類別:重點項目
項目摘要,結題摘要,

項目摘要

本項目將以經濟、金融與管理領域為背景,對高維複雜數據統計分析中的一些基礎性與前沿性的理論問題開展研究。通過對幾種典型的複雜類型數據(例如符號數據、成分數據、函式數據等)的分析方法的工作目標、基本原理以及技術特點進行比較與提煉,建立一種高層次、簡約的基礎理論框架和代數體系,實現對諸多複雜類型數據分析方法的基本原理進行統一的理論描述,並發展適應大規模、高維複雜數據的新型多元分析方法。新理論體系將克服現有方法中存在的維數災難、信息運用不充分、模型解釋性不強等技術難題。在此基礎上,還將推動套用研究取得突破性進展。例如基於符號數據的概念與方法,開發新的問卷調查方法,或者進行多產品庫存交易記錄數量關聯挖掘研究;運用函式數據分析方法,改進違約機率度量模型和匯率波動規律分析模型;運用成分數據分析方法,分析勞動力就業結構的動態規律。這些研究的實現,將為經濟管理領域中的數據收集與分析提供更加有效的技術。

結題摘要

本項目以經濟、金融與管理領域中一些重大的數據分析問題為背景,對高維複雜數據的若干新型統計分析方法進行研究。項目首先全面開展符號數據分析方法研究,提出基於全信息的區間數據多元分析理論方法,以及混合分布型符號數據的代數體系和多元分析理論,這在符號數據分析領域是一個十分重要的理論突破;第二,系統研究了成分數據向量的代數體系,提出了多元成分數據的數字特徵,構建了多元成分數據的線性回歸模型、Fisher判別方法、主成分分析方法和時間序列分析方法;第三,在多元函式數據分析方面,提出了新的多元函式數據分析方法,例如主成分分析、回歸分析、聚類分析等。與此同時,還研究了函式型變數的M估計以及變數選擇問題,對函式型數據和多元協變數混合的回歸模型進行理論探索;第四,對複雜類型數據的關聯分析、聚類分析以及模糊聚類的距離範式進行了研究,在高維度數據的餘弦相似度計算方面,提出了“條件反單調性”和“支持度遞增集合窮舉樹”等概念,給出了挖掘餘弦興趣模式的CosMiner算法。本項目已將所開發的理論方法運用於一系列經濟管理的重要問題研究,對政府決策和地區管理產生重要影響。例如,在國家自然科學基金委託項目“創新研究群體科學基金實施效果分析與發展戰略研究”中,利用區間數據分析方法,分析在不同學部創新研究群體的資助效果和產出特徵,為基金委制定國家創新研究群體的未來發展戰略規劃提供了決策依據。在承擔中央電視台電影頻道M9105電影網的委託項目中,採用直方圖數據主成分分析方法,構建了一種新型的網路用戶評分模型。本項目還根據區間數據多元判別分析方法,建立了公司財務困境預測模型,研究考慮違約情況下累積分紅壽險的退保權定價模型。運用函式型數據分析方法,研究了北京市120急救電話呼叫量與PM 2.5、SO2等數據的相關關係。王惠文教授提出的關於北京市霧霾防治的提案,獲得2014年北京市政協優秀提案獎。此外,成分數據分析方法還被嵌套在投入產出表預測建模中,解決了在投入產出表編制和使用過程中,長期存在的時滯問題。本項目還積極開展國際交流與合作工作,組織一次高端國際學術研討會議,有多人次赴國外合作研究以及參加相關的國際會議,並應邀參加P. Britro教授組織的《Analysis of Distributional Data》的專著章節寫作。本項目研究已圓滿完成立項報告中所提出的各項任務,取得重要研究成果,無重大調整。

相關詞條

熱門詞條

聯絡我們