吉林大学学报(工学版) ›› 2014, Vol. 44 ›› Issue (3): 742-749.doi: 10.13229/j.cnki.jdxbgxb201403026

• 论文 • 上一篇    下一篇

轮式移动机器人的双强化学习自适应模糊控制

叶锦华,李迪,叶峰   

  1. 华南理工大学 机械与汽车工程学院,广州 510641
  • 收稿日期:2012-12-26 出版日期:2014-03-01 发布日期:2014-03-01
  • 作者简介:叶锦华(1982),男,博士研究生.研究方向:机器人技术.E-mail:jinhuayea@gmail.com
  • 基金资助:
    “863”国家高技术研究发展计划项目(2011AA04A104,2012AA040909);广东省战略新兴产业核心技术攻关项目(2012A010702004).

Dual reinforcement learning adaptive fuzzy control of wheeled mobile robot

YE Jin-hua,LI Di,YE Feng   

  1. School of Mechanical and Automotive Engineering, South China University of Technology, Guangzhou 510641, China
  • Received:2012-12-26 Online:2014-03-01 Published:2014-03-01

摘要: 针对包含执行器动力学模型的三阶不确定非完整轮式移动机器人系统,提出了一种基于反演设计和双强化学习自适应模糊系统的轨迹跟踪控制方法。该控制方法对运动学控制器采用分流控制技术,防止系统运行初期的速度跳变。对本体动力学和执行器动力学分别使用强化学习自适应模糊控制,优化补偿常规方法难以解决的系统未知参数和非参数不确定性,并利用鲁棒项来消除未知外部扰动和模糊控制逼近误差对系统的影响,提高了系统的控制性能。Lyapunov理论证明:控制系统是稳定且最终有界收敛的,仿真结果表明了该方法的有效性。

关键词: 自动控制技术, 轮式移动机器人, 轨迹跟踪, 自适应模糊控制, 强化学习, 分流模型, 非完整系统

Abstract: A trajectory tracking method is proposed for three-order uncertain nonholonomic mobile robot with actuator dynamic model. This method is based on the backstepping technique and dual reinforcement learning adaptive fuzzy logic system. The shunting control technique is used to prevent the velocity jump at the beginning of system for the motion controller. The reinforcement learning adaptive fuzzy logic control is employed for both body dynamics and actuator dynamics, such that the unknown system uncertainties of parameters and non-parameters can be compensated optimally. Moreover, in order to enhance the control performance, the robust compensators are applied to eliminate the impact of unknown external disturbance and approximation error of fuzzy system. The stability and ultimately bounded convergence of the control system are proven by Lyapunov theory. The validity of this method is verified by the simulation results.

Key words: automatic control technology, wheeled mobile robot, trajectory tracking, adaptive fuzzy control, reinforcement learning, shunting model, nonholonomic system

中图分类号: 

  • TP24
[1] Brockett R W. Asymptotic Stability and Feedback Stabilization[M]. Boston: Birkhauser, 1983.
[2] Chaw D. Sliding-mode tracking control of nonholonomic wheeled mobile robots in polar coordinates[J]. IEEE Transactions on Control Systems Technology, 2004, 12(4): 637-644.
[3] Chen Hong, Ma Miao-miao, Wang Hu, et al. Moving horizon H tracking control of wheeled mobile robots with actuator saturation[J]. IEEE Transactions on Control Systems Technology, 2009, 17(2): 449-457.
[4] Yoo S J. Adaptive tracking control for a class of wheeled mobile robots with unknown skidding and slipping[J]. IET Control Theory and Applications, 2010, 4(10): 2109-2119.
[5] Cao Zheng-cai, Zhao Ying-tao, Wu Qi-di. Adaptive trajectory tracking control for a nonholonomic mobile robot[J]. Chinese Journal of Mechanical Engineering, 2011, 24(3):1-7.
[6] Jang J O. Adaptive neuro-fuzzy network control for a nobile robot[J]. Journal of Intelligent and Robotic Systems, 2011, 62(3-4): 567-586.
[7] Chaw D. Fuzzy adaptive tracking control of wheeled mobile robots with state-dependent kinematic and dynamic disturbances[J]. IEEE Transactions on Fuzzy Systems, 2012, 20(3): 587-593.
[8] Yang S X, Zhu A, Yuan G F, et al. A bioinspired neuro dynamics-based approach to tracking control of mobile robots[J]. IEEE Transactions on Industrial Electronics, 2012, 59(8): 3211-3220.
[9] Lin Chuan-kai. A reinforcement learning adaptive fuzzy controller for robots[J]. Fuzzy Sets and Systems, 2003, 137(3): 339-352.
[10] Campion G, Bastin G, D'Andrea-Novel B. Structural properties and classification of kinematic and dynamic models of wheel mobile robots[J]. IEEE Transactions on Robots and Automation, 1996,12(1): 47-62.
[11] 李艳东,王宗义,朱玲,等. 基于递归模糊神经网络的移动机器人滑模控制[J]. 吉林大学学报:工学版, 2011, 41(6):1731-1737.
Li Yan-dong, Wang Zong-yi, Zhu Ling,et al. Sliding mode control of mobile robots based on recurrent fuzzy-neural network[J]. Journall of Jilin University (Engineering and Technology Edition), 2011, 41(6): 1731-1737.
[12] Park B S, Yoo S J, Park J B, et al. Adaptive output-feedback control for trajectory tracking of electrically driven nonholonomic mobile robots[J]. IET Control Theory and Applications,2010,5(6): 830-838.
[13] Dax T, Kar I N. Design and implementation of an adaptive fuzzy logic-based controller for wheeled mobile robots[J]. IEEE Transactions on Control Systems Technology, 2006,14(3): 501-510.
[1] 顾万里,王萍,胡云峰,蔡硕,陈虹. 具有H性能的轮式移动机器人非线性控制器设计[J]. 吉林大学学报(工学版), 2018, 48(6): 1811-1819.
[2] 李战东,陶建国,罗阳,孙浩,丁亮,邓宗全. 核电水池推力附着机器人系统设计[J]. 吉林大学学报(工学版), 2018, 48(6): 1820-1826.
[3] 赵爽,沈继红,张刘,赵晗,陈柯帆. 微细电火花加工表面粗糙度快速高斯评定[J]. 吉林大学学报(工学版), 2018, 48(6): 1838-1843.
[4] 王德军, 魏薇郦, 鲍亚新. 考虑侧风干扰的电子稳定控制系统执行器故障诊断[J]. 吉林大学学报(工学版), 2018, 48(5): 1548-1555.
[5] 闫冬梅, 钟辉, 任丽莉, 王若琳, 李红梅. 具有区间时变时滞的线性系统稳定性分析[J]. 吉林大学学报(工学版), 2018, 48(5): 1556-1562.
[6] 董惠娟, 于震, 樊继壮. 基于激光测振仪的非轴对称超声驻波声场的识别[J]. 吉林大学学报(工学版), 2018, 48(4): 1191-1198.
[7] 张茹斌, 占礼葵, 彭伟, 孙少明, 刘骏富, 任雷. 心肺功能评估训练系统的恒功率控制[J]. 吉林大学学报(工学版), 2018, 48(4): 1184-1190.
[8] 田彦涛, 张宇, 王晓玉, 陈华. 基于平方根无迹卡尔曼滤波算法的电动汽车质心侧偏角估计[J]. 吉林大学学报(工学版), 2018, 48(3): 845-852.
[9] 张士涛, 张葆, 李贤涛, 王正玺, 田大鹏. 基于零相差轨迹控制方法提升快速反射镜性能[J]. 吉林大学学报(工学版), 2018, 48(3): 853-858.
[10] 王林, 王洪光, 宋屹峰, 潘新安, 张宏志. 输电线路悬垂绝缘子清扫机器人行为规划[J]. 吉林大学学报(工学版), 2018, 48(2): 518-525.
[11] 胡云峰, 王长勇, 于树友, 孙鹏远, 陈虹. 缸内直喷汽油机共轨系统结构参数优化[J]. 吉林大学学报(工学版), 2018, 48(1): 236-244.
[12] 朱枫, 张葆, 李贤涛, 王正玺, 张士涛. 基于强跟踪卡尔曼滤波的陀螺信号处理[J]. 吉林大学学报(工学版), 2017, 47(6): 1868-1875.
[13] 晋超琼, 张葆, 李贤涛, 申帅, 朱枫. 基于扰动观测器的光电稳定平台摩擦补偿策略[J]. 吉林大学学报(工学版), 2017, 47(6): 1876-1885.
[14] 冯建鑫. 具有测量时滞的不确定系统的递推鲁棒滤波[J]. 吉林大学学报(工学版), 2017, 47(5): 1561-1567.
[15] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 刘松山, 王庆年, 王伟华, 林鑫. 惯性质量对馈能悬架阻尼特性和幅频特性的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 557 -563 .
[2] 王同建, 陈晋市, 赵锋, 赵庆波, 刘昕晖, 袁华山. 全液压转向系统机液联合仿真及试验[J]. 吉林大学学报(工学版), 2013, 43(03): 607 -612 .
[3] 张春勤, 姜桂艳, 吴正言. 机动车出行者出发时间选择的影响因素[J]. 吉林大学学报(工学版), 2013, 43(03): 626 -632 .
[4] 肖锐, 邓宗才, 兰明章, 申臣良. 不掺硅粉的活性粉末混凝土配合比试验[J]. 吉林大学学报(工学版), 2013, 43(03): 671 -676 .
[5] 陈思国, 姜旭, 王健, 刘衍珩, 邓伟文, 邓钧忆. 车载自组网与通用移动通信系统混杂网络技术[J]. 吉林大学学报(工学版), 2013, 43(03): 706 -710 .
[6] 孟超, 孙知信, 刘三民. 基于云计算的病毒多执行路径[J]. 吉林大学学报(工学版), 2013, 43(03): 718 -726 .
[7] 仙树, 郑锦, 路兴, 张世鹏. 基于内容转发模型的P2P流量识别算法[J]. 吉林大学学报(工学版), 2013, 43(03): 727 -733 .
[8] 吕源治, 王世刚, 俞珏琼, 王小雨, 李雪松. 基于柱透镜光栅的虚模式下一维集成成像显示特性[J]. 吉林大学学报(工学版), 2013, 43(03): 753 -757 .
[9] 王丹, 李阳, 年桂君, 王珂. 非均质度量掩蔽函数在空域水印中的应用[J]. 吉林大学学报(工学版), 2013, 43(03): 771 -775 .
[10] 冯琳函, 钱志鸿, 尚克诚, 朱爽. 基于IEEE802.15.4标准的改进型隐藏节点冲突避免策略[J]. 吉林大学学报(工学版), 2013, 43(03): 776 -780 .