摘要:
为了对二自由度机械臂轨迹进行规划, 提出了一种新的动态搜索Q学习算法。该算法不需要建立机械臂的数学模型, 直接对轨迹进行规划, 根据学习进程动态调整贪婪策略的比例参数, 并给出较传统方式更具客观性和公平性的定量策略评价单元。同时, 由动态更新机构在线更新学习经验。仿真结果表明, 新的Q学习算法能使机械臂更快速地达到目标位置, 并实现轨迹全局最优。
中图分类号:
李艳辉, 赵辉, 李珊珊. 一种新的Q学习算法在机械臂轨迹规划中的应用[J]. J4, 2013, 31(1): 90-94.
LI Yan-hui, ZHAO Hui, LI Shan-shan. New Q-Learning Algorithm for Trajectory Plan of Manipulator[J]. J4, 2013, 31(1): 90-94.