《基於支持向量機的複雜連續系統強化學習控制研究》是依託中國礦業大學,由王雪松擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於支持向量機的複雜連續系統強化學習控制研究
- 項目類別:青年科學基金項目
- 項目負責人:王雪松
- 依託單位:中國礦業大學
- 研究期限:2009-01-01 至 2011-12-31
- 批准號:60804022
- 支持經費:18(萬元)
- 申請代碼:F0303
- 負責人職稱:教授
《基於支持向量機的複雜連續系統強化學習控制研究》是依託中國礦業大學,由王雪松擔任項目負責人的青年科學基金項目。
《基於支持向量機的複雜連續系統強化學習控制研究》是依託中國礦業大學,由王雪松擔任項目負責人的青年科學基金項目。項目摘要針對複雜連續系統的學習控制問題,設計一類有效的基於支持向量機的強化學習控制方法。內容包括:強化學習系統...
強化學習線上學習系統中,樣本集構建的好壞直接決定了最終學習效果的好壞。基於核方法構建值函式的線上逼近模型,線上自適應的構建訓練樣本集,從而提高逼近模型的精度。 利用支持向量分類器來平衡強化學習中的探索和利用問題,探索和利用控制...
本項目研究基於統計學習的複雜系統建模與控制問題,主要包括:1.研究基於統計學習的複雜系統線上辨識技術,包括提出快速有效的能跟蹤對象動態變化的高斯過程(GP)線上訓練算法;提出多入多出(MIMO)型支持向量機(SVM)及其線上訓練算法,...
《強化學習關鍵技術及其在機器人行為學習中的套用》是依託中國礦業大學,由程玉虎擔任項目負責人的面上項目。項目摘要 針對強化學習存在的基函式選取困難、學習速度慢及算法收斂性難以保證等問題,設計一類有效的強化學習控制方法,並將其套用...
《強化學習原理及其套用》是2014年6月1日科學出版社出版的圖書,作者是王雪松、朱美強、程玉虎。內容簡介 作為一類求解序貫最佳化決策問題的有效方法,強化學習在運籌學、計算科學和自動控制等領域得到廣泛套用,業已成為機器學習領域活躍的研究...
1.4.2 傳統機器學習理論的缺陷 1.4.3 統計學習理論的提出 1.4.4 支持向量機的發展歷史 1.4.5 支持向量機的優點 1.4.6 支持向量機的套用範圍 1.5 基於SVM的控制系統辨識建模的國內外研究現狀 1.5.1 國外研究現狀 1.5.2...
《複雜系統支持向量機建模與故障預報》是2015年國防工業出版社出版的圖書,作者是蔡艷寧、汪洪橋、葉雪梅。內容簡介 支持向量機是解決系統建模和數據驅動模式分析問題的一種有效工具,是當前複雜系統故障預測及可靠性評估領域的研究熱點,並在...
感知靈敏度、計算複雜度和環境適應性是目前頻譜感知方法的主要不足,本項目擬針對這些問題展開系統研究。首先,基於統計學習理論中的支持向量機(SVM)方法,重點研究面向發射機的非合作頻譜感知,將頻譜感知問題建模為隨機對象辨識問題和高維...
第一部分是神經網路學習及其在複雜非線性系統中的控制,包括基於時間差分的神經網路預測控制,基於徑向基函式網路的機械手疊代學習控制,自適應T_S型模糊徑向基函式網路等。第二部分是強化學習的大規模或連續空間表示問題,包括基於強化學習...
4.1.4 核參數對支持向量機學習性能的影響研究 4.2 集成分類系統的增量式學習算法 4.2.1 算法描述 4.2.2 入侵檢測問題的增量式學習性能研究 4.3 漏警與誤警損失的多目標最佳化研究 4.3.1 入侵檢測的不均衡損失問題 4.3.2 ...
本項目建立了基於支持向量機機器學習算法的土地生態風險評價方法,為多壓力因子的土地生態風險綜合評價在方法上提供了新思路。系統研究土地生態系統在城市化、工業化以及土地利用變化下,土地資源存在的生態風險及其對生態風險的綜合評價具有很大...
本課題擬首先基於支持向量機建立PHEV混合動力系統數學模型,然後運用模型預測控制理論實現其能量管理和最佳化控制;擬利用支持向量機理論研究高精度SOC估計算法,為能量決策提供重要依據;基於粒子群算法和模擬退火算法提出精度高、收斂速度快的混合...
基於支持向量機逆控制開展多電機的DYC研究,提出一種新的支持向量機逆聯合控制方法,重點關注故障狀態下多電機的容錯控制;構建系統的硬體控制平台;提煉基礎科學問題,探索多電機協調容錯控制的一般性規律。
主成分分析、相關性分析等方法研究含混沌特性時間序列間相互作用機理;(2) 通過延遲時間和嵌入維數,研究多元混沌時間序列相空間重構和建模方法;(3) 利用神經網路、支持向量機等智慧型非線性工具對包含混沌特性的複雜系統進行建模和預測。