基於支持向量機的複雜連續系統強化學習控制研究

基於支持向量機的複雜連續系統強化學習控制研究

《基於支持向量機的複雜連續系統強化學習控制研究》是依託中國礦業大學,由王雪松擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於支持向量機的複雜連續系統強化學習控制研究
  • 項目類別:青年科學基金項目
  • 項目負責人:王雪松
  • 依託單位:中國礦業大學
  • 研究期限:2009-01-01 至 2011-12-31
  • 批准號:60804022
  • 支持經費:18(萬元)
  • 申請代碼:F0303
  • 負責人職稱:教授
項目摘要
針對複雜連續系統的學習控制問題,設計一類有效的基於支持向量機的強化學習控制方法。內容包括:強化學習系統知識的表達和利用、基於機率型支持向量分類機的強化學習、支持向量機時間滾動式最佳化學習算法、基於線上聚類分析的個體支持向量機建立、基於多目標最佳化的個體支持向量機輸出結論的選擇性集成。通過研究,為提高系統的學習收斂速度,通過給系統融入恰當的實時、動態知識,擬提出基於支持向量回歸/分類機的強化學習;為提高系統的學習精度和泛化性能,擬提出基於集成支持向量機的強化學習;通過在倒立擺平衡控制和移動機器人自主導航問題中的套用,驗證上述強化學習控制方法的可行性和有效性。研究成果將深化和豐富現有的強化學習理論,進一步擴大強化學習方法的套用範圍,增強其解決實際問題的能力。本項目是自動化、機器學習、統計學習與人工智慧有機結合的新穎交叉研究方向,具有廣闊的研究前景。

相關詞條

熱門詞條

聯絡我們