J4 ›› 2009, Vol. 27 ›› Issue (02): 185-.
吴洪岩,刘淑华,张 嵛
WU Hong-yan,LIU Shu-hua, ZHANG Yu
摘要:
在复杂连续环境下,强化学习系统的状态空间面临维数灾难问题,需要采取量化的方法,降低输入空间的复杂度。径向基神经网络(RBFNN:Radial Basis Function Neural Networks)具有较强的函数逼近能力及泛化能力,由此提出了基于径向基神经网络的Q学习方法,并将其应用于单机器人的自主导航。在基于径向基神经网络的强化学习系统中,用径向基神经网络逼近状态空间和Q函数,使学习系统具有良好的泛化能力。仿真结果表明,该导航方法具有较强的避碰能力,提高了机器人对环境的适应能力。
中图分类号: