动态约束下可重构模块机器人分散强化学习最优控制

董博¹, 刘克平², 李元春²

Decentralized reinforcement learning optimal control for time varying constrained reconfigurable modular robot

DONG Bo¹, LIU Ke-ping², LI Yuan-chun²

图6 采用ACI强化学习的轨迹跟踪曲线
Fig.6 Trajectory tracking curve with ACI