數據分析中的大規模矩陣最佳化模型求解算法研究

數據分析中的大規模矩陣最佳化模型求解算法研究

《數據分析中的大規模矩陣最佳化模型求解算法研究》是依託南京大學,由陳彩華擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:數據分析中的大規模矩陣最佳化模型求解算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:陳彩華
  • 依託單位:南京大學
項目摘要,結題摘要,

項目摘要

近年來,隨著現代信息技術的快速發展,人們在各個領域均會遇到高維數據的統計分析問題。由於數據的維數過高,傳統的統計方法往往失效,使得它成為目前套用數學中最困難也最有機遇的領域之一。為此,統計學家紛紛提出新方法、引入新概念來應對這一挑戰,在其中矩陣最佳化模型被廣泛的套用。本項目以此為背景,著重研究數據分析中的常見矩陣最佳化模型的算法和套用。具體而言,在本項目中,我們(1)將通過分析數據的結構,設計基於數據本身結構的各類高效算法,具體包括一階算法、一階—Newton CG混合算法和Newton方法等。並在此基礎上,研製滿足各種不同求解要求的matlab軟體包。(2)將結果套用於金融、管理科學中,進行數據分析處理,提取有效信息。

結題摘要

在數據分析中,經常會遇到向量、矩陣、圖像等龐大的數據,維數可以達到上萬、甚至更高,對於該類數據樣本數目可能遠小於數據的維數。因而需要利用數據的結構(如稀疏性、低秩)降維以提取潛在的信息。這些數特性一般可以通過對模型作適當的正則化而實現,其中矩陣最佳化模型被廣泛套用在矩陣和圖像數據的正則化中。本項目以此為背景,擬集合一階算法、半光滑Newton鄰近點算法、Newton法等研究數據分析中常見模型的求解算法,研製軟體包,套用於圖像科學、金融等各個領域中。 項目組與史丹福大學、新加坡國立大學、香港中文大學、香港浸會大學、中國科學院等科研機構開展了深入的合作研究,並已經超額完成預計任務;在國外知名刊物上發表論文7 篇,均被SCI收錄,其中SCI一區 4 篇(兩篇論文發表在Mathematical Programming, 兩篇論文發表在SIAM系列雜誌),並且有一篇論文入選ESI高被引論文,一篇論文獲得華裔世界數學家聯盟頒發的傑出論文獎勵。項目主持人參加了眾多的國內外學術會議並作報告,並且主持了2015年國際數學規劃分會的分組報告、以及擔任2016年國際連續最佳化大會的其中兩個小組的組織者。 項目按照申請書設計的技術路線與年度計畫有序進行。項目在理論與方法方面的貢獻主要包含:1、當數據分析中的模型目標函式為2塊的可分函式時,設計了帶慣性的交替方向法來求解上述問題,較經典的交替方向法相比算法的表現有了明顯的提高;2、當問題的塊數不少於3時,證明了交替方向法在求解該問題時可能不收斂,回答了交替方向法研究中的一個主要的公開問題。為了克服交替方向法可能的不收斂性,提出將其隨機排列的變形用於求解上述不可分問題,並在某些情形下得到了收斂性;3、當用戶需要高精度解時,提出了兩階段最佳化算法,起始用交替方向法,若難以達到目標,則在第二階段利用半光滑Newton-CG鄰近點算法進行加速。 此外,算法被套用在求解魯棒主成份分析、壓縮圖像重建、稀疏投資組合等模型中,並預期在數據分析中發揮更多重要,幫助從數據中提取潛在信息、進行最佳化決策。

相關詞條

熱門詞條

聯絡我們