摘要: 针对Q-Learning 算法在离散状态下存在运行效率低、学习速度慢等问题,提出一种改进的Q-Learning 算法。改进后的算法在原有算法基础上增加了一层学习过程,对环境进行了深度学习。在栅格环境下进行仿真实验,并成功地应用在多障碍物环境下移动机器人路径规划,结果证明了算法的可行性。改进Q-Learning 算法以更快的速度收敛,学习次数明显减少,效率最大可提高20%。同时,该算法框架对解决同类问题具有较强的通用性。
中图分类号:
高乐, 马天录, 刘凯, 张宇轩. 改进Q-Learning 算法在路径规划中的应用[J]. 吉林大学学报(信息科学版), 2018, 36(4): 439-443.
GAO Le, MA Tianlu, LIU Kai, ZHANG Yuxuan. Application of Improved Q-Learning Algorithm in Path Planning[J]. Journal of Jilin University (Information Science Edition), 2018, 36(4): 439-443.