摘要:
为使多无人机集群在特定网络条件下实现通信性能、任务效率与飞行安全的综合优化, 使其更好完成城市区域的巡查任务, 对多目标约束下的航线规划问题进行了研究。基于双深度强化学习技术, 对已知通信质量分布的空域进行空间离散化处理, 建立空间、能耗与通信模型, 设计包含数据获取量、飞行安全、剩余电量及路径消耗的多维度奖励函数, 通过经验回放与目标网络机制稳定训练过程。实验表明, 训练后的网络模型在未预知环境中仍能生成最优无线网络传输策略与安全飞行轨迹, 可有效解决多目标约束下的航线规划问题,验证了双深度强化学习在该领域的适用性。
中图分类号:
涂晓彬.
基于强化学习的多无人机系统航线规划
[J]. 吉林大学学报(信息科学版), 2025, 43(6): 1230-1236.
TU Xiaobin.
Route Planning for Multi-UAV Systems Based on Reinforcement Learning
[J]. Journal of Jilin University (Information Science Edition), 2025, 43(6): 1230-1236.