高維複雜數據分析理論及其在投資決策中的套用

高維複雜數據分析理論及其在投資決策中的套用

《高維複雜數據分析理論及其在投資決策中的套用》是依託山西大學,由梁吉業擔任項目負責人的重點項目。

基本介紹

  • 中文名:高維複雜數據分析理論及其在投資決策中的套用
  • 項目類別:重點項目
  • 項目負責人:梁吉業
  • 依託單位:山西大學
項目摘要,結題摘要,

項目摘要

社會經濟活動形態的日趨複雜和規模的不斷增長導致其產生的數據迅速膨脹,主要特徵表現為:規模的海量性、表示的高維性、結構的複雜性、時空動態性,同時具有不完整、不確定、非協調等特點,對高維複雜數據的分析利用成為經濟管理領域信息處理面臨的主要任務。本項目針對符號數據、函式數據、成分數據等經濟管理領域中典型的高維複雜數據,就與之相關的兩大核心科學和技術問題:高維複雜數據的數學建模與知識推理、高維複雜數據的綜合利用與行為決策,開展深入系統的研究。具體內容:(1)符號數據的粒化、粒度空間結構、基於多粒度與動態粒度的問題求解模型與算法;(2)函式數據的聚類、基於粒度支持向量機的分類與回歸分析;(3)成分數據的方差分析方法、時序成分數據的預測方法;(4)區域全社會固定資產投資決策、股票投資選擇決策等問題的實證研究。項目研究成果將形成一個高層次複雜數據分析的基礎理論體系,創新經濟管理領域數據分析的理論與套用。

結題摘要

隨著社會經濟活動形態的日趨複雜和規模的不斷增長,投資決策等經濟管理領域的各類數據呈現出規模的海量性、表示的高維性、結構的複雜性、時空動態性等特點。項目組面向投資決策等國民經濟與社會發展中的現實決策分析問題,以粒度計算為主要理論分析框架,以信息熵為不確定性度量的主要工具,圍繞高維複雜數據的建模與高效算法,開展了特徵降維、聚類分析、分類與回歸、決策建模與實證分析等方面的系統研究。主要理論創新成果概括如下: (1)為應對數據的大規模性、快速增長性等挑戰,項目組採用“樣本表征整體”、“特徵重要度的遞推計算”以及“雙維度加速機制”等策略,提出了一系列高效特徵降維方法與算法,為高維複雜大數據環境下決策建模過程中關鍵指標選取提供了高效求解方法。 (2)針對數據特徵的混合性、數據分布的非平衡性、數據規模的海量性、數據增長的實時快速性等特點,基於“加權相似性度量”、“類的多中心代表元”、“有效性評價指標”、“目標函式設計策略”等技巧與策略,項目組發展了一系列聚類分析方法與高效算法,為探測高維複雜數據中的類結構提供了有效方法。 (3)採用“主動學習”、“粒度計算”、“核方法”、“組合與融合”等策略,項目組提出了一系列針對二維表數據、函式數據、成分數據的分類與回歸新方法,為不同數據形式下的預測與決策提供了有效方法。 (4)在決策建模方面,項目組提出了基於粗糙集理論的分層多屬性群決策模型,以及基於“一致度、貼近度與均衡度”的群決策效果評價準則;提出了基於優勢粗糙集模型的穩健型證券投資的兩級排序全序化方法。 結合理論研究成果,項目組選擇了股票價值投資決策、企業財務危機預警、CPI周期性波動趨勢預測、人口結構組合預測等典型套用問題,開展了實證研究。特別是項目組關於股票價值投資決策的研究成果被套用於大同證券有限責任公司的證券資產配置、證券投資策略設計以及大客戶諮詢等業務,取得了顯著效果。項目組研製的高維複雜數據挖掘實驗系統可為高維複雜數據分析提供可靠的計算平台。 總體上,研究成果既為高維複雜數據的建模與分析提供了一般性基礎理論和高效算法,同時又為某些基於大數據的投資決策典型問題提供了問題求解方法與決策建模技術。

相關詞條

熱門詞條

聯絡我們