《基於最小二乘策略疊代的無人機航跡規劃方法》是陳曉倩、劉瑞祥撰寫的一篇論文。
基本介紹
- 中文名:基於最小二乘策略疊代的無人機航跡規劃方法
- 作者:陳曉倩、劉瑞祥
- 發表時間:2019-02-22
- 論文來源:計數機工程與套用
- 分類號:V279;V249
論文摘要,引文格式,
論文摘要
針對傳統強化學習方法因對狀態空間進行離散化而無法保證無人機在複雜套用場景中航跡精度的問題,使用最小二乘策略疊代(least-squares policy iteration, LSPI)算法開展連續狀態航跡規劃問題研究。該算法採用帶參線性函式逼近器近似表示動作值函式,無需進行空間離散化,提高了航跡精度,並基於樣本數據離線計算策略,直接對策略進行評價和改進。與Q學習算法的對比仿真實驗結果表明LSPI算法規劃出的三維航跡更為平滑,有利於飛機實際飛行。
引文格式
陳曉倩,劉瑞祥.基於最小二乘策略疊代的無人機航跡規劃方法[J/OL].計算機工程與套用:1-7[2019-11-27].