《基於深度加強學習的CBTC系統性能最佳化研究》是依託北京交通大學,由朱力擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於深度加強學習的CBTC系統性能最佳化研究
- 項目類別:青年科學基金項目
- 項目負責人:朱力
- 依託單位:北京交通大學
項目摘要,結題摘要,
項目摘要
基於通信的列車控制(CBTC)系統是以連續車地通信為基礎的列車運行控制系統,是列控系統的發展方向。複雜的信道條件,頻繁的越區切換,將嚴重影響CBTC系統運行效率。當前對CBTC系統的研究很少考慮車地通信系統性能對列車控制的影響。 本項目研究CBTC系統中通信與控制的聯合最佳化問題。項目以列車最優運行曲線跟蹤誤差和能耗最小為最佳化目標,定義列車的控制性能參數線性二次型成本。為了保證列車運行的安全,最佳化模型將增加安全相關的列車控制行為限制條件。項目首先利用城軌運營場景下的測試數據建立基於位置的有限狀態馬爾科夫信道模型;隨後,根據列車運行控制的特點,研究考慮通信延遲的列車控制模型;最後,利用深度加強學習方法,根據系統中信道的隨機變化特性以及列車的實時位置信息,將車地通信系統切換的決策,和列車控制行為決策進行聯合最佳化設計。該項目的研究將為城軌CBTC系統的最佳化設計提供強有力的理論基礎。
結題摘要
基於通信的列車控制(CBTC)系統是採用連續和雙向車地通信的列車自動控制系統。CBTC是未來列車控制系統的發展方向。複雜的信道環境和頻繁的切換會嚴重影響城市軌道交通CBTC系統中列車與地面的通信性能,進而影響CBTC的運行效率。目前關於CBTC的研究沒有考慮列車與地面通信對列車控制性能的影響。本項目研究了CBTC系統中通信與控制的聯合最佳化問題。為了最小化運行跟蹤誤差和能耗,項目將線性二次型成本定義為控制性能指標。為了保證列車運行的安全性,最佳化模型對安全相關的列車控制行為進行了約束。此外,項目根據隨機信道特性和實時列車位置信息,利用深度強化學習方法對切換決策策略和列車控制策略進行了聯合最佳化。基於實際信道測量結果和仿真結果表明,項目所提出的最佳化方法可以顯著提高CBTC系統的列車控制性能,而CBTC系統需要犧牲部分性能來保證系統安全。