《變結構學習自動機的自適應與協同最佳化算法》是依託同濟大學,由張軍旗擔任項目負責人的面上項目。
基本介紹
- 中文名:變結構學習自動機的自適應與協同最佳化算法
- 項目類別:面上項目
- 項目負責人:張軍旗
- 依託單位:同濟大學
中文摘要,結題摘要,
中文摘要
學習自動機是一種基於強化學習機制的機率自動機,在與隨機環境相互作用的過程中學習未知環境的機率特徵。學習自動機自提出以來,其基礎理論的研究取得較大發展,形成以變結構學習自動機為主流,並在模式識別、調度與分配、擁塞避免、博弈、馬爾科夫鏈控制、函式最佳化等眾多套用領域取得了顯著的實際效果。本項目圍繞變結構學習自動機的個體自適應與群體協同兩個關鍵科學問題,首先針對目前變結構學習自動機對不同環境使用固定的結構變化方法並需手動調試參數,使得學習效率與套用範圍受限的問題,定義環境的學習難度並提出變結構學習自動機的個體自適應學習範式與追擊模式;然後,針對群體變結構自動機通常採用輪詢的學習方式,缺乏有效的群體協同機制而導致群體學習能力受限的問題,提出基於群體智慧型的變結構學習自動機的群體協同算法;最後,針對基於隨機反饋的高維多模態函式最佳化問題建模,發揮具備自適應學習與群體智慧型的變結構學習自動機的最佳化能力。
結題摘要
學習自動機是一種基於強化學習機制的機率自動機,在與隨機環境相互作用的過程中學習未知環境的機率特徵。學習自動機自提出以來,其基礎理論的研究取得較大發展,形成以變結構學習自動機為主流,並在模式識別、調度與分配、擁塞避免、博弈、馬爾科夫鏈控制、函式最佳化等眾多套用領域取得了顯著的實際效果。本項目圍繞變結構學習自動機的個體自適應與群體協同兩個關鍵科學問題,首先提出了基於末位淘汰制與序最佳化的個體自適應學習範式與追擊模式,提高變結構學習自動機的效率;同時提出了複雜度為常數的學習自動機學習方法,有利於運用到大數據領域的學習問題。然後,基於EDA(分布估計算法),提出了變結構學習自動機的群體協同算法,發揮群體的全局學習能力;最後,本項目引入機器學習思想,將引領粒子群的對象從群體最優點擴展為歷史信息分布、當前個體最優集合與群體歷史最優點三個候選項,通過自適應地學習環境選擇學習對象。通過在CEC2013 的28 個標準連續函式測試集上的套用實驗結果表明HMPSO算法的性能明顯優於其它PSO 算法。發表學術論文28篇,其中期刊文章10篇,國際會議文章18篇;SCI收錄10篇; EI收錄26篇;期刊文章中IEEE Transactions系列文章8篇,其中第一作者6篇,通訊作者1篇。