轮式移动机器人的双强化学习自适应模糊控制

引用本文

叶锦华, 李迪, 叶峰. 轮式移动机器人的双强化学习自适应模糊控制. 2014, 44(3): 742-749
YE Jin-hua, LI Di, YE Feng. Dual reinforcement learning adaptive fuzzy control of wheeled mobile robot. 吉林大学学报(工学版), 2014, 44(3): 742-749 复制到剪切板

Permissions

轮式移动机器人的双强化学习自适应模糊控制

叶锦华, 李迪, 叶峰

华南理工大学机械与汽车工程学院,广州 510641

叶锦华(1982),男,博士研究生.研究方向:机器人技术.E-mail:jinhuayea@gmail.com

基金:“863”国家高技术研究发展计划项目(2011AA04A104,2012AA040909); 广东省战略新兴产业核心技术攻关项目(2012A010702004);

摘要

针对包含执行器动力学模型的三阶不确定非完整轮式移动机器人系统,提出了一种基于反演设计和双强化学习自适应模糊系统的轨迹跟踪控制方法。该控制方法对运动学控制器采用分流控制技术,防止系统运行初期的速度跳变。对本体动力学和执行器动力学分别使用强化学习自适应模糊控制,优化补偿常规方法难以解决的系统未知参数和非参数不确定性,并利用鲁棒项来消除未知外部扰动和模糊控制逼近误差对系统的影响,提高了系统的控制性能。Lyapunov理论证明:控制系统是稳定且最终有界收敛的,仿真结果表明了该方法的有效性。

关键词: 自动控制技术; 轮式移动机器人; 轨迹跟踪; 自适应模糊控制; 强化学习; 分流模型; 非完整系统

中图分类号:TP24 文献标志码:A 文章编号:1671-5497(2014)03-0742-08

Dual reinforcement learning adaptive fuzzy control of wheeled mobile robot

YE Jin-hua, LI Di, YE Feng

School of Mechanical and Automotive Engineering, South China University of Technology, Guangzhou 510641, China

Fund:

Abstract

A trajectory tracking method is proposed for three-order uncertain nonholonomic mobile robot with actuator dynamic model. This method is based on the backstepping technique and dual reinforcement learning adaptive fuzzy logic system. The shunting control technique is used to prevent the velocity jump at the beginning of system for the motion controller. The reinforcement learning adaptive fuzzy logic control is employed for both body dynamics and actuator dynamics, such that the unknown system uncertainties of parameters and non-parameters can be compensated optimally. Moreover, in order to enhance the control performance, the robust compensators are applied to eliminate the impact of unknown external disturbance and approximation error of fuzzy system. The stability and ultimately bounded convergence of the control system are proven by Lyapunov theory. The validity of this method is verified by the simulation results.

Keyword: automatic control technology; wheeled mobile robot; trajectory tracking; adaptive fuzzy control; reinforcement learning; shunting model; nonholonomic system

Show Figures

0 引言

非完整轮式移动机器人(NWMR)作为典型的非完整系统,其控制问题一直受到广泛关注。由于不满足Brockett的必要条件^{[ 1]},常规光滑时不变控制方法不再适用,加上其本身是一个MIMO耦合的非线性系统,因此,对此类系统的控制变得特别困难。实际系统不可避免地存在模型不确定性,并受到未知外部扰动的影响,此时如何保证NWMR仍然能够进行精确的轨迹跟踪,国内外学者对此提出了诸多解决方法,主要有鲁棒控制^{[ 2, 3]}、自适应控制^{[ 4, 5]}和智能控制^{[ 6, 7]}等方法。其中,鲁棒控制往往需要知道系统不确定的上界,自适应控制则更适用于固定或慢时变的结构参数不确定性,具备逼近未知不确定性函数能力的智能控制尽管解决了上述不足,然而对于具有高度不确定因素的系统,控制效果有限。此外,现有的NWMR轨迹跟踪控制方法中,尽管已经考虑了系统动力学对系统的影响,却较少考虑执行器动力学对系统的影响,这在高速、高精的应用场合中,将导致系统跟踪控制性能下降,而控制器输出直接为执行器控制量,更符合实际情况。另外,由系统运行初期初始误差较大而引起的速度跳变将导致很大的控制量,这对于受到机构和执行器限制的实际系统是难以实现的。

为了解决上述问题,本文综合考虑了NWMR的运动学、本体动力学和执行器动力学几方面,结合反演设计技术,提出了一种双强化学习自适应模糊控制(RLAFC)方法,解决了系统包含复杂未知不确定因素的NWMR轨迹跟踪控制问题,并通过鲁棒项来消除系统扰动和模糊控制逼近误差的影响,还利用基于仿生神经动力学的分流控制技术^{[ 8]},解决了系统运行初期的速度跳变问题。RLAFC^{[ 9]}不仅具备自适应模糊控制优化逼近任意不确定函数的能力,还利用强化学习方法对自适应参数向量进行进一步优化,加快了RLAFC的收敛速度,并使得控制系统能够适应未知模型信息少或未知参数大范围变化等传统方法难以消除的不确定性,解决了常规智能控制的不足,提高了系统的适应性和鲁棒性。

1 模型分析

研究对象为如图1所示的(2,0)型^{[ 10]}NWMR,两轮间的距离为2b,轮子半径为r,质心o _c为两轮轴线的中心,NWMR整车质量为m,绕通过o _c点轴线的转动惯量为I。

	Figure Option View Download New Window
	图1 NWMR结构示意图Fig.1 Schematic diagram of NWMR

定义质心o _c点在全局坐标系xoy下的位姿为: q=[ x, y, θ]^T则根据理想非完整约束条件,其运动学模型为^{[ 11]}:

=vcos θ, =vsin θ, =w(1)

式中: v为 NWMR的前进速度; w为 NWMR的转动角速度。

使用拉格朗日乘子法,可建立 NWMR从 o_c输出的动力学模型为^{[ 11]}:

= U= Ψ₁+ = τ(2)

式中: τ=[τ_v,τ_w ]^T为 NWMR的前进驱动力矩和转动驱动力矩; U=[ v, w]^T,标称值矩阵和取:

= , =

Ψ₁=Δ =Δ CU= F_s为本体动力学系统的有界未知非线性不确定项, Δ M和Δ C为模型误差; 为有界未知力矩扰动项;连续函数 F_s为表面摩擦综合项。

文中假设NWMR两轮采用特性相同的独立直流电机驱动,则NWMR执行器动力学模型为^{[ 12]}:

(3)

式中:N为电机输出端到轮子的减速比;k_t为电机力矩常数; L、 R分别为电机电感和内阻; k_e为反电动势常数; i为电机的励磁电流; 为有界的未知电压扰动项;矩阵 B为:

B= ,

u=[u_r,u_l ]^T为两轮驱动电机的控制电压输入; φ=[φ_r,φ_l ]^T为两轮转速,满足:

φ= JU= U(4)

根据式(3)(4)可知控制力矩 τ与控制电压 u的动态关系式为:

= τ= U= Ψ₂+ = u(5)

式中: Ψ₂=Δ =Δ τ=Δ U为执行器动力学系统的有界未知非线性不确定项,Δ 、Δ 和Δ 表示电机模型误差;令 , , 和表示 L、 R、 k、 k_e的标称值,则有:

= B ^-¹/( ), = B ^-¹/( ), = N J。

2 控制器设计和稳定性分析

为了降低设计复杂度,文中结合反演设计思想,对系统的运动学(式(1)),本体动力学(式(2))和执行器动力学(式(3))3个子系统分别进行控制器设计。反演设计方法将复杂的非线性系统分解成不超过系统阶数的子系统,然后与普适性强的 Lyapunov理论结合,为每个子系统设计辅助控制器,前一个子系统的辅助控制器作为控制目标集成到下一个子系统的控制器中去,并在最后一步完成总体控制器的设计。文中控制器设计分3个步骤进行。

(1)设计运动学辅助控制器 U_c

定义时变参考轨迹位姿: q_r= ,满足:

=v_rcos θ_r, =v_rsin θ_r, =w_r(6)

式中: v_r、 w_r为期望参考速度值。

定义 NWMR的轨迹跟踪误差为:

e_c=

(7)

则轨迹跟踪误差动态方程为:

(8)

运动学轨迹跟踪是设计一个合理的辅助速度控制器 U_c= 来消除误差 e_c,基于文献[8]提出的神经动力学分流控制方法设计运动学控制器为:

U_c=

(9)

式中: k _y >0, k _θ >0,有界 v_s为与引起速度跳变变量相关的辅助信号,其动态更新表达式为:

=-Av_s=( B₁ -v_s) g₁( e _x)=( B₂ +v_s) g₂( e _x) (10)

式中: A为 v_s的无源衰减率; B₁、 B₂分别为 v_c的设计上界和下界值;上界门限线性函数 g₁( e _x)和下界门限线性函数 g₂( e _x)分别设计为:

(11)

通过门限线性函数的切换,基于式(10)由系统误差 e _x引起的速度跳变将被限制在[ -B₂, B₁]内。定义速度跟踪误差 e _U= = U_c= U,将式(9)代入式(8)有:

(12)

(2)设计本体动力学辅助控制器 τ_c

第(2)步的设计目标是以 U_c为参考输入,设计辅助力矩控制器 τ_c= ,来消除误差 e _U,取 τ_c为:

τ_c= k_p e _U+ -γ₁(13)

式中: k_p=diag( κ_p, κ_p), κ_p为正的常数;设计鲁棒补偿项 γ₁为:

γ₁=

(14)

式中:ϑ₁为正的常数;自适应模糊补偿项为 Θ₁的估计, Θ₁的表达式为:

Θ₁( U, , U_c, )= Ψ₁+ = U_c= e _v (15)

式中: e _v= ;文中采用单点模糊化,乘积推理机,中心平均加权解模糊化及高斯隶属度函数所构成的多输入单输出模糊逻辑系统^{[ 13]},高斯隶属度函数使得模糊系统具有全局逼近的性质,则 Θ₁的最优估计可表示为:

Θ₁= ξ _τ+ ω₁(16)

式中: ω₁为模糊系统的逼近误差; ξ _τ为模糊基向量; 为未知参数的最优参数向量。

用估计值替代真值 Θ₁得到:

= ξ _τ (17)

为了获得接近最优的参数向量,文中参数向量通过强化学习自适应方法进行更新,更新律为:

= Γ _τ ξ _τ

-η _τ Γ _τ‖ e _U‖

(18)

=- Γ _τ_c‖ e _U‖ ξ _τ

-η _τ Γ _τ_c‖ e _U‖

(19)

式中: Γ _τ=diag( ν _τ, ν _τ); Γ _τ_c=diag( ν _τ_c, ν _τ_c); ν _τ、 ν _τ_c、 η _τ为正的常数;强化学习信号 r _τ取:

r _τ= e _U+‖ e _U‖ ξ _τ (20)

定义力矩跟踪误差 e _T= = τ_c= τ,并将式(13)代入式(2)有:

+ e _U= - k_p e _U+ γ₁+ ρ₁+ e _T- e_v(21)

式中: = Θ₁- ; ρ₁= ω₁+

(3)设计执行器控制器 u

以第(2)步力矩控制输出 τ_c为参考输入,第(3)步是设计电压控制输入 u,来消除误差 e _T,进一步考虑实际执行器存在饱和问题,取 u为:

u= k _I D _I+ k _v D _v+ - γ₂(22)

式中: k _I=diag( κ _I, κ _I); k _v=diag( κ _v, κ _v);

D _I= ; D _v= ,

滤波跟踪误差 ψ= 定义为:

=-α βψ= βe _T (23)

β=diag( κ _ψ, κ _ψ); λ、 δ、 α、 κ _I、 κ _v和 κ _ψ为正的常数;符号th(·)等价于饱和函数tanh(·)。设计鲁棒补偿项 γ₂为:

γ₂=

(24)

式中:ϑ₂为正的常数。

与第(2)步设计相似,利用自适应模糊估计值替代其真值 Θ₂, Θ₂和分别为:

Θ₂( τ, , τ_c, τ_c, U)= = τ_c= U= Ψ₂+ e _T (25)

= ξ _u (26)

取参数向量估计 (i=1,2)的强化学习自适应律为:

= Γ _u ξ _u

-η _u Γ _u‖ e _T‖

(27)

=- Γ _u_c‖ e _T‖ ξ _u

-η _u Γ _u_c‖ e _T‖

(28)

r _u= e _T+‖ e _T‖ ξ _u (29)

式中: Γ _u=diag( ν _u); Γ _u_c=diag( ν _u_c, ν _u_c); ν _u、 ν _u_c、 η _u为正的常数。

将式(22)代入式(5)有:

+ e _T= Θ₂- k _I D _I- k _v D _v+ γ₂+ ρ₂- e _U (30)

式中: Θ₂= Θ₂- ; ρ₂= = ω₂。

根据上述设计步骤,有如下定理成立:

定理1 给定系统(1),(2),(5),选择运动学控制器(9)、本体动力学控制器(13)、执行器动力学控制器(22),分流模型(10)和参数强化学习自适应律(18) ~(20)、(27) ~(29),则闭环控制系统可实现最终有界稳定轨迹跟踪。

证明选择如下总体 Lyapunov函数

L=L₁ +L₂ +L₃(31)

式中:

L₁= ( = )=(1=cos e _θ) / k _y= /(2 B₁) (32)

L₂= e _U+ tr{ Φ _τ}+ tr{ } (33)

L₃=

e _T+

tr{

Φ _u}+

tr{

k _I Λ ^-¹

k _v β ^-¹ Δ ^-¹

(34)

式中: Λ=diag( λ); Δ=diag( δ);符号lch(·)与符号ln(cosh(·))等价。令 B₁ =B₂ =B,对 L₁求导,并将式(9)(10)(12)代入求导后的 L₁可得:

=- v_rsin² e _θ=[ -A-g₁( e _x) -g₂( e _x)] /B+ e _v=V₁+ e _v (35)

对于NWMR本体动力学系统有如下性质:

性质1 =2 为斜对称阵,即存在 x∈R² ^×¹使得 x^T( =2 ) x=0成立。

将式(18) ~(21)代入求导后的 L₂,并结合性质1有:

= ( =2 ) e _U+ -tr{ }-tr{ }≤- k_p e _U+ ( γ₁ +ρ₁)= e _v+ e _T+F₁(36)

式中:

F₁=‖ e _U‖tr{= ξ _τ( ξ _τ)^T +η _τ + ξ _τ( ξ _τ)^T +η _τ } (37)

定义: D₁=- k _I D _I- k _v D _v;

D₂=2 k _I Λ ^-¹ +2 k _v β ^-¹ Δ ^-¹ ;

V₂ =α ψ^T k _v 。

将式(27) ~(30)代入求导后的 L₃,得到:

=- e _T+ D₁+ ( γ₂+ ρ₂)- e _U+ Θ₂-tr{ }-tr{ }+ D₂≤ -V₂= e _T+ ( γ₂ +ρ₂)= e _U+F₂(38)

式中:

F₂=‖ e _T‖tr{= ξ _u( ξ _u)^T +η _u + ξ _u( ξ _u)^T +η _u } (39)

为了方便下一步分析,进行如下假设:

假设1 ‖ ρ₁‖≤ Ξ₁,‖ ρ₂‖≤ Ξ₂, Ξ₁ >0, Ξ₂ >0。

将式(14)(24)(35)(36)(38)代入求导后的式(31),再结合假设1,当取 ϑ _i≥ Ξ _i, i=1,2,有:

= = = =V₁= e _v- k_p e _U+ ( γ₁ +ρ₁)= e _v+ e_T -V₂= e_T= ( γ₂ +ρ₂)= e _U+F₁+F₂≤V₁- k_p e _U- V₂= e _T+‖ e _U‖(-ϑ₁+Ξ₁)+‖ e _T‖(-ϑ₂+Ξ₂)+F₁+F₂≤ V₁ -λ_min( k _p) +η _τ‖ e _U‖F₃-V₂- λ_min( ) +η _u‖ e _T‖F₄(40)

式中:λ_min( k_p)、 λ_min( )分别表示矩阵 k_p和的最小特征值; F₃和 F₄具体表达式见文献^{[ 9]}。根据文献^{[ 8]}可知,当 v_r >0, V₁≤0。显然 V₂≥0,因此当‖ e _U‖和‖ e _T‖满足:‖ e _U‖>η_τ F₃ /λ_min( k_p),‖ e _T‖>η_τ F₄ /λ_min( )或 ‖ e _T ‖2/(η _uF₄),或者‖ Φ _u‖、‖ ‖、‖ Φ_τ‖和‖ ‖满足特定条件时(见文献^{[ 9]},此时有 F₃ <0, F₄ <0),则 <0,即闭环控制系统是稳定的且最终收敛于一个有界范围。定理1证明完毕。

注1 通过增大 λ_min( k_p), e _U可收敛于任意小值,而当‖ e _T‖2/(η _uF₄)时,增大 k _v(相当于增大V₂)可以扩大系统稳定领域的范围。

注2 文中控制器采用质心输出,而非轮子输出,并用强化学习自适应模糊系统逼近包含了系统本体动力学和执行器动力学结构参数矩阵的不确定项,这使得文中控制器可适用于同类型(如(2,1)型^{[ 10]})的其他非完整轮式移动机器人系统的轨迹跟踪控制。

3 仿真试验

通过 Matlab软件来验证文中方法的可行性,移动机器人本体的物理参数为: =32 kg, =18 .625 kg· m²,b=0 .6 m,r=0 .04 m。

执行器的物理参数为:N=21, =0 .203 H, =5 .41 Ω, =0 .191 N· m/A, =0 .02 V。

本体动力学不确定项为: Ψ₁=(10sin( t-8) +e ^-t,10cos( t-8)=2 e ^-t)。

电机动力学的不确定项为: Ψ₂=(sin(2 t)=2cos( t-2),2sin( t-2)=cos(3 t)),

扰动项、分别取[=8,8]和[=1,1]间的随机数。

运动学控制器参数取: k _y=8, k _θ=10, A=2, B=4。本体动力学控制器参数取: κ _p=80, ϑ₁=25。电机动力学控制器参数取: κ _I=0 .6, κ _v=2, α=6; κ _ψ=8, λ=10, δ=10, ϑ₂=10。

模糊系统、逻辑系统使用如下模糊推理规则:

R ^l:如果 X _j为 ,则 Y为 C ^l。

式中: j为模糊系统输入变量个数; l为模糊规则数,为了减少计算量,提高系统的实时性,文中每个变量使用3个与模糊规则相对应的高斯隶属度函数, RLAFC的参数为: ν _τ=28, ν _τc=20, ν _u=6, ν _uc=4, η _τ =η _u=1。

首先进行圆轨迹跟踪试验,轨迹参数为: U_r=[2π/5,π/5]^T, q_r(0)=[6,4, π/2]^T, NWMR的初始参数为: q(0)=[5,3, π/3]^T, U(0)=[0,0]^T,在关闭 RLAFC和仅开启本体动力学 RLAFC的情况下进行轨迹跟踪控制,仿真结果如图2所示,可见执行器动力学不确定性对系统有着不可忽略的影响,实际应用应给予考虑。应用文中双 RLAFC控制器的轨迹跟踪仿真结果如图3 ~图8所示。从图3可以看出:控制器同时消除了本体动力学、执行器动力学不确定性和外部扰动的影响,保证NWMR精确地跟踪参考轨迹。图4~图6表明3个子系统的跟踪误差都收敛于有界范围,达到了反演控制的目标。图7描述了执行器控制输入的变化情况,可见通过饱和约束使得控制量处于合理范围,而由于使用分流控制技术,图8所示的NWMR移动速度变化初期过渡平稳,未发生跳变现象。

	Figure Option View Download New Window
	图2 圆弧轨迹跟踪对比结果Fig.2 Comparing results of circle trajectory tracking

	Figure Option View Download New Window
	图3 基于文中控制器的圆弧轨迹跟踪Fig.3 Circle trajectory tracking using proposed controller

	Figure Option View Download New Window
	图4 圆弧轨迹跟踪位姿误差Fig.4 Pose errors of circle trajectory tracking

	Figure Option View Download New Window
	图5 圆弧轨迹跟踪的速度误差Fig.5 Velocity errors of circle trajectory tracking

	Figure Option View Download New Window
	图6 圆弧轨迹跟踪的力矩误差Fig.6 Torque errors of circle trajectory tracking

	Figure Option View Download New Window
	图7 圆弧轨迹跟踪的控制电压输入Fig.7 Control voltage inputs of circle trajectory tracking

	Figure Option View Download New Window
	图8 NWMR的速度变化情况Fig.8 Moving velocity of NWMR

再进行分段直线轨迹跟踪,轨迹参数取: U_r=[1 .414,0]^T, q_r(0)=[0,0, π/4]^T,第2段和第3段直线参数为: θ_r | _t=_{8 s}=0, θ_r | _t=_{16 s} =-π/4, NWMR的初始位姿为: q(0)=[1,2, π/3]^T,试验结果如图9和图10所示。从图9可以看出对于分段直线,在过渡处误差明显加大,但控制器使得系统跟踪误差迅速减小, NWMR很快重新实现对参考轨迹的渐进跟踪,跟踪效果良好。而尽管过渡处的控制输入变化较为剧烈,如图10所示,其幅度依然处在合理范围内。

	Figure Option View Download New Window
	图9 分段直线轨迹跟踪Fig.9 Piecewise line trajectory tracking

	Figure Option View Download New Window
	图10 分段直线轨迹跟踪的控制电压输入Fig.10 Control voltage inputs of piecewise line trajectory tracking

最后进行多个初始位姿的8字形轨迹跟踪,轨迹参数: x_r=sin( t/3), y_r=sin( t/6), q_r(0)=[0,0,0 .4634]^T, NWMR初始位姿分别为: q₁=[0.5,-0.2,π/4]^T, q₂=[-0.5,0.2,π]^T, q₃=[0,0,π/2]^T,跟踪情况如图11所示,结果表明了文中控制器具有半全局性,且对于变曲率复杂曲线也具有良好的控制效果。

	Figure Option View Download New Window
	图11 8字型轨迹跟踪仿真结果Fig.11 Simulation results of 8-shaped trajectory tracking

4 结束语

NWMR的执行器动力学对控制器性能有着不可忽略的影响,当考虑执行器动力学时,NWMR为三阶系统,加大了控制器的设计难度,而通过反演设计有效地降低了控制系统的设计复杂度,文中提出的带鲁棒项的双RLAFC,提高了系统的收敛效率,并保证了NWMR在本体动力学系统和执行器动力学系统同时存在复杂不确定性和未知外界扰动时能够实现精确的轨迹跟踪。控制器结合基于仿生神经动力学的分流控制技术使得系统能在较大初始偏差时不发生常规控制器的速度跳变。对圆弧轨迹、分段直线轨迹和多个初始位姿的8字型曲线的仿真试验结果表明:文中控制策略使得系统是最终有界收敛的,并可以有效地消除系统复杂不确定性的影响,抑制外部扰动,提高NWMR的轨迹跟踪效果。

The authors have declared that no competing interests exist.

参考文献

View Option

[1]	Brockett R W. Asymptotic Stability and Feedback Stabilization[M]. Boston: Birkhauser, 1983. [本文引用:1]
[2]	Chaw D. Sliding-mode tracking control of nonholonomic wheeled mobile robots in polar coordinates[J]. IEEE Transactions on Control Systems Technology, 2004, 12(4): 637-644. [本文引用:1] [JCR: 2.0]
[3]	Chen Hong, Ma Miao-miao, Wang Hu, et al. Moving horizon H^∞ tracking control of wheeled mobile robots with actuator saturation[J]. IEEE Transactions on Control Systems Technology, 2009, 17(2): 449-457. [本文引用:1] [JCR: 2.0]
[4]	Yoo S J. Adaptive tracking control for a class of wheeled mobile robots with unknown skidding and slipping[J]. IET Control Theory and Applications, 2010, 4(10): 2109-2119. [本文引用:1] [JCR: 1.717]
[5]	Cao Zheng-cai, Zhao Ying-tao, Wu Qi-di. Adaptive trajectory tracking control for a nonholonomic mobile robot[J]. Chinese Journal of Mechanical Engineering, 2011, 24(3): 1-7. [本文引用:1] [CJCR: 1.505]
[6]	Jang J O. Adaptive neuro-fuzzy network control for a nobile robot[J]. Journal of Intelligent and Robotic Systems, 2011, 62(3-4): 567-586. [本文引用:1] [JCR: 0.827]
[7]	Chaw D. Fuzzy adaptive tracking control of wheeled mobile robots with state-dependent kinematic and dynamic disturbances[J]. IEEE Transactions on Fuzzy Systems, 2012, 20(3): 587-593. [本文引用:1] [JCR: 5.484]
[8]	Yang S X, Zhu A, Yuan G F, et al. A bioinspired neuro dynamics-based approach to tracking control of mobile robots[J]. IEEE Transactions on Industrial Electronics, 2012, 59(8): 3211-3220. [本文引用:2] [JCR: 5.165]
[9]	Lin Chuan-kai. A reinforcement learning adaptive fuzzy controller for robots[J]. Fuzzy Sets and Systems, 2003, 137(3): 339-352. [本文引用:3] [JCR: 1.749]
[10]	Campion G, Bastin G, D'Andrea-Novel B. Structural properties and classification of kinematic and dynamic models of wheel mobile robots[J]. IEEE Transactions on Robots and Automation, 1996, 12(1): 47-62. [本文引用:2] [JCR: 2.126]
[11]	李艳东, 王宗义, 朱玲, 等. 基于递归模糊神经网络的移动机器人滑模控制[J]. 吉林大学学报: 工学版, 2011, 41(6): 1731-1737. Li Yan-dong, Wang Zong-yi, Zhu Ling, et al. Sliding mode control of mobile robots based on recurrent fuzzy-neural network[J]. Journall of Jilin University (Engineering and Technology Edition), 2011, 41(6): 1731-1737. [本文引用:2] [CJCR: 0.701]
[12]	Park B S, Yoo S J, Park J B, et al. Adaptive output-feedback control for trajectory tracking of electrically driven nonholonomic mobile robots[J]. IET Control Theory and Applications, 2010, 5(6): 830-838. [本文引用:1] [JCR: 1.717]
[13]	Dax T, Kar I N. Design and implementation of an adaptive fuzzy logic-based controller for wheeled mobile robots[J]. IEEE Transactions on Control Systems Technology, 2006, 14(3): 501-510. [本文引用:1] [JCR: 2.0]

1983

0.0

... 由于不满足Brockett的必要条件^[1],常规光滑时不变控制方法不再适用,加上其本身是一个MIMO耦合的非线性系统,因此,对此类系统的控制变得特别困难 ...

2004

2.0

0.0

... 实际系统不可避免地存在模型不确定性,并受到未知外部扰动的影响,此时如何保证NWMR仍然能够进行精确的轨迹跟踪,国内外学者对此提出了诸多解决方法,主要有鲁棒控制^[2,3]、自适应控制^[4,5]和智能控制^[6,7]等方法 ...

2009

2.0

0.0

2010

1.717

0.0

2011

0.0

1.505

2011

0.827

0.0

. 2011, 62(3-4):567-586 DOI:10.1007/s10846-010-9453-4

Adaptive neuro-fuzzy network control for a nobile robot

1.Department of Computer Control Engineering, Uiduk University, Kyongju, 780-713 South Korea<br/>

A control structure that makes possible the integration of a kinematic controller and a neuro-fuzzy network (NFN) dynamic controller for mobile robots is presented. A combined kinematic/dynamic control law is developed using backstepping and stability is guaranteed by Lyapunov theory. The NFN controller proposed in this work can deal with unmodeled bounded disturbances and/or unstructured unmodeled dynamic in the mobile robot. On-line NFN parameter tuning algorithms do no require off-line learning yet guarantee small tracking errors and bounded control signals are utilized.

2012

5.484

0.0

2012

5.165

0.0

... 为了解决上述问题,本文综合考虑了NWMR的运动学、本体动力学和执行器动力学几方面,结合反演设计技术,提出了一种双强化学习自适应模糊控制(RLAFC)方法,解决了系统包含复杂未知不确定因素的NWMR轨迹跟踪控制问题,并通过鲁棒项来消除系统扰动和模糊控制逼近误差的影响,还利用基于仿生神经动力学的分流控制技术^[8],解决了系统运行初期的速度跳变问题 ...

... 根据文献^[8]可知,当v_r>0,V₁#cod#x02264 ...

2003

1.749

0.0

... RLAFC^[9]不仅具备自适应模糊控制优化逼近任意不确定函数的能力,还利用强化学习方法对自适应参数向量进行进一步优化,加快了RLAFC的收敛速度,并使得控制系统能够适应未知模型信息少或未知参数大范围变化等传统方法难以消除的不确定性,解决了常规智能控制的不足,提高了系统的适应性和鲁棒性 ...

... F₃和F₄具体表达式见文献^[9] ...

... 满足特定条件时(见文献^[9],此时有F₃0,F₄0),则 0,即闭环控制系统是稳定的且最终收敛于一个有界范围 ...

1996

2.126

0.0

... 1 模型分析研究对象为如图1所示的(2,0)型^[10]NWMR,两轮间的距离为2b,轮子半径为r,质心o_c为两轮轴线的中心,NWMR整车质量为m,绕通过o_c点轴线的转动惯量为I ...

... 注2 文中控制器采用质心输出,而非轮子输出,并用强化学习自适应模糊系统逼近包含了系统本体动力学和执行器动力学结构参数矩阵的不确定项,这使得文中控制器可适用于同类型(如(2,1)型^[10])的其他非完整轮式移动机器人系统的轨迹跟踪控制 ...

2011

0.0

0.701

. 2011, 41(6):1731-1737

Sliding mode control of mobile robots based on recurrent fuzzy-neural network

1.College of Computer and Control Engineering, Qiqihar University, Qiqihar 161006, China|2.College of Automation, Harbin Engineering University, Harbin 150001, China

A control structure is proposed for trajectory tracking control of nonholonomic mobile robots. It integrates the backstepping kinematic controller and a sliding mode controller with Adaptive Dynamic Recurrent Fuzzy Neural Network (ADRFNN). The genetic algorithm is used to optimize the parameters of kinematic controller that effectively suppresses the excessive initial speed and output torque caused by large initial error of posture. The ADRFNN is developed to achieve on-line estimation of the part of dynamic nonlinear uncertain, which greatly reduces estimation errors of uncertainties. By combing ADRFNN with the adaptive robust controller, this method can not only solve the problem of parameters and non-parameter uncertainties of mobile robots, but also eliminate input chattering of the sliding mode control. The stability and convergence of the control system are proved by Lyapunov theory. Simulation results demonstrate the effectiveness of the proposed method.

针对非完整移动机器人轨迹跟踪控制问题,提出了一种Backstepping运动学控制器与自适应动态递归模糊神经滑模控制器相结合的控制结构。采用遗传算法对运动学控制器的参数进行了优化选取,有效地抑制了因初始位姿过大而引起的初始速度及输出力矩过大的问题；采用动态递归模糊神经网络(Adaptive dynamic recurrent fuzzy neural network,ADRFNN)对动态非线性不确定部分进行在线估计,使不确定性估计误差大大减小；通过与自适应鲁棒控制器结合应用,不但解决了移动机器人的参数与非参数不确定性问题,同时也消除了在滑模控制中的输入抖振现象；基于Lyapunov方法的设计过程,保证了控制系统的稳定与收敛；仿真结果表明了该方法的有效性。

... ]^T则根据理想非完整约束条件,其运动学模型为^[11]: ...

... 使用拉格朗日乘子法,可建立NWMR从o_c输出的动力学模型为^[11]: ...

2010

1.717

0.0

... 文中假设NWMR两轮采用特性相同的独立直流电机驱动,则NWMR执行器动力学模型为^[12]: ...

2006

2.0

0.0

... 文中采用单点模糊化,乘积推理机,中心平均加权解模糊化及高斯隶属度函数所构成的多输入单输出模糊逻辑系统^[13],高斯隶属度函数使得模糊系统具有全局逼近的性质,则#cod#x00398 ...