Stiefel流形上一階最佳化算法的理論與套用

Stiefel流形上一階最佳化算法的理論與套用

《Stiefel流形上一階最佳化算法的理論與套用》是依託上海電力大學,由竺筱晶擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:Stiefel流形上一階最佳化算法的理論與套用
  • 項目類別:青年科學基金項目
  • 項目負責人:竺筱晶
  • 依託單位:上海電力大學
項目摘要,結題摘要,

項目摘要

Stiefel流形上的最佳化是當今國際最佳化界的一個研究熱點,它在科學與工程領域有廣泛套用。對於流形約束問題,傳統歐氏空間中的最佳化算法往往收效甚微,而黎曼流形上的最佳化算法恰好利用了可行域的幾何特性將約束問題轉化為無約束問題。本項目致力於發展Stiefel流形上的一階最佳化算法,包括梯度法和共軛梯度法。回拉是黎曼最佳化的一個關鍵技術,它在可接受的計算成本下將切向量光滑地映射到流形上,從而使疊代保持流形約束。本項目擬利用矩陣指數的近似方法,例如有理逼近和子空間方法,構造新的回拉型保約束格式及其相應的回拉微分型向量運輸公式,並結合非單調線搜尋技術或濾子技術,建立高效穩定的算法。在理論方面,我們將分析疊代格式的計算複雜度,證明算法的全局收斂性,並深入挖掘矩陣指數逼近的幾何性質。在數值實驗方面,我們將通過科學與工程中的實際套用問題,例如線性特徵值問題、正交矩陣逼近、電子結構計算等,證實新算法的有效性。

結題摘要

本項目致力於Stiefel流形上的一階最佳化算法研究。Stiefel流形上的最佳化,或稱正交約束最佳化,是當今國際最佳化界的一個研究熱點,廣泛套用於統計學、信號與圖像處理、深度學習、電子結構計算等領域。Stiefel流形是由正交約束矩陣組成的一種特殊黎曼流形。由於流形的非線性與非凸結構,傳統歐氏空間中的最佳化方法無法有效求解黎曼流形上的最佳化問題。但利用黎曼幾何的內蘊方法,可將黎曼流形上的最佳化問題視為無約束最佳化問題。拉回是黎曼最佳化的一項關鍵技術。它是黎曼指數映射的一階近似,可將切向量映射到流形上某一點。指數映射對應於測地線,雖有很好的幾何性質,但在一般情況下不便於數值計算。基於數值線性代數技術,能在某些具體流形上構造出簡單的拉回公式。特別地,在Stiefel流形上有基於QR分解、極分解、Cayley變換的拉回公式。我們主要做了以下三個方面的工作。第一項工作關於Stiefel流形上的共軛梯度法。我們提出了兩種新的基於Cayley變換的向量遷移。它們均滿足Ring-Wirth非擴張條件,而且其中一種還是等距遷移,彌補了基於QR分解和極分解的向量遷移的理論缺陷。同時,新的向量遷移保持了經典方法的計算複雜度,特別地在低秩情形有O(np^2)複雜度的簡化變形。此外,我們將歐氏空間中的非單調共軛梯度法推廣到一般黎曼流形上,並證明了全局收斂性。該工作已發表於Comput Optim Appl。第二項工作是矩陣指數及其逼近在Stiefel流形最佳化問題上的相關理論。我們探索了矩陣指數與Stiefel流形上的黎曼指數映射與拉回的關係,並提出了一種基於矩陣指數Pade逼近的新拉回。針對稀疏高秩問題,我們將新的拉回映射與Krylov子空間方法相結合,開發出一種高效的梯度型疊代格式。該工作已發表於Optim Lett。第三項工作關於一般黎曼流形上基於逆拉回的共軛梯度法。我們將向量遷移替換成逆拉回,修改了黎曼流形上的Wolfe條件,證明了Fletcher-Reeves和Dai-Yuan共軛梯度法的全局收斂性。我們也探討了Stiefel流形上逆拉回映射的實施細節,包括現有的逆正交拉回、逆QR拉回,以及新提出的逆Cayley拉回公式。該工作目前仍在研究中。

相關詞條

熱門詞條

聯絡我們