• •    

轮式移动机器人的双强化学习自适应模糊控制

叶锦华,李迪,叶峰   

  1. 华南理工大学
  • 收稿日期:2012-12-26 修回日期:2013-04-22 发布日期:2013-06-20
  • 通讯作者: 叶锦华

Dual Reinforcement Learning Adaptive Fuzzy Control of Wheeled Mobile robot

  • Received:2012-12-26 Revised:2013-04-22 Published:2013-06-20
  • Contact: Jin-Hua YE

摘要: 针对包含执行器动力学模型的三阶不确定非完整轮式移动机器人系统,提出一种基于反演设计和双强化学习自适应模糊系统的轨迹跟踪控制方法,该方法对运动学控制器采用分流控制技术防止系统运行初期的速度跳变,对本体动力学和执行器动力学分别使用强化学习自适应模糊控制,优化补偿常规方法难以解决的系统未知参数和非参数不确定性,并利用鲁棒项来消除未知外部扰动和模糊控制逼近误差对系统的影响,提高了系统的控制性能,Lyapunov理论证明控制系统是稳定且最终有界收敛的,仿真结果表明该方法的有效性。

关键词: 自动控制技术, 轮式移动机器人, 轨迹跟踪, 自适应模糊控制, 强化学习, 分流模型, 非完整系统

Abstract: A trajectory tracking method is proposed for three-order uncertain nonholonomic mobile robot with actuator dynamics based on backstepping technique and dual reinforcement learning adaptive fuzzy logic system. In this method, the shunting control technique is used to prevent the velocity jumps at the beginning of system for the motion controller. And the reinforcement learning adaptive fuzzy logic control is employed for both body dynamics and actuator dynamics, such that the unknown system uncertainties of parameters and non-parameters can be compensated optimally. Moreover, in order to enhance the control performance, the robust compensators are applied to eliminate the impact of unknown external disturbance and approximation error of fuzzy system. The stability and ultimately bounded convergence of control system are proven by Lyapunov theory. And the validity of this method is verified by the simulation results。

Key words: automatic control technology, wheeled mobile robot, trajectory tracking, adaptive fuzzy control, reinforcement learning, shunting model, nonholonomic system

[1] 董惠娟, 于震, 樊继壮. 基于激光测振仪的非轴对称超声驻波声场的识别[J]. 吉林大学学报(工学版), 2018, 48(4): 1191-1198.
[2] 张茹斌, 占礼葵, 彭伟, 孙少明, 刘骏富, 任雷. 心肺功能评估训练系统的恒功率控制[J]. 吉林大学学报(工学版), 2018, 48(4): 1184-1190.
[3] 张士涛, 张葆, 李贤涛, 王正玺, 田大鹏. 基于零相差轨迹控制方法提升快速反射镜性能[J]. 吉林大学学报(工学版), 2018, 48(3): 853-858.
[4] 田彦涛, 张宇, 王晓玉, 陈华. 基于平方根无迹卡尔曼滤波算法的电动汽车质心侧偏角估计[J]. 吉林大学学报(工学版), 2018, 48(3): 845-852.
[5] 王林, 王洪光, 宋屹峰, 潘新安, 张宏志. 输电线路悬垂绝缘子清扫机器人行为规划[J]. 吉林大学学报(工学版), 2018, 48(2): 518-525.
[6] 胡云峰, 王长勇, 于树友, 孙鹏远, 陈虹. 缸内直喷汽油机共轨系统结构参数优化[J]. 吉林大学学报(工学版), 2018, 48(1): 236-244.
[7] 朱枫, 张葆, 李贤涛, 王正玺, 张士涛. 基于强跟踪卡尔曼滤波的陀螺信号处理[J]. 吉林大学学报(工学版), 2017, 47(6): 1868-1875.
[8] 晋超琼, 张葆, 李贤涛, 申帅, 朱枫. 基于扰动观测器的光电稳定平台摩擦补偿策略[J]. 吉林大学学报(工学版), 2017, 47(6): 1876-1885.
[9] 冯建鑫. 具有测量时滞的不确定系统的递推鲁棒滤波[J]. 吉林大学学报(工学版), 2017, 47(5): 1561-1567.
[10] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
[11] 许金凯, 王煜天, 张世忠. 驱动冗余重型并联机构的动力学性能[J]. 吉林大学学报(工学版), 2017, 47(4): 1138-1143.
[12] 胡云峰, 顾万里, 梁瑜, 杜乐, 于树友, 陈虹. 混合动力汽车启停非线性控制器设计[J]. 吉林大学学报(工学版), 2017, 47(4): 1207-1216.
[13] 申帅, 张葆, 李贤涛, 朱枫, 晋超琼. 基于跟踪微分器的加速度反馈控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1217-1224.
[14] 王春阳, 辛瑞昊, 史红伟. 针对大滞后系统的滞后时间削弱自抗扰控制方法[J]. 吉林大学学报(工学版), 2017, 47(4): 1231-1237.
[15] 毛钰, 左曙光, 林福. 转矩波动下电动轮系统机电耦合振动特性[J]. 吉林大学学报(工学版), 2017, 47(3): 908-916.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!