结合神经动力学的移动机器人的轨迹追踪系统最佳模型预测方法外文翻译资料

 2022-07-21 14:38:44

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


结合神经动力学的移动机器人的轨迹追踪系统最佳模型预测方法

摘要:寻迹的移动机器人是被一种被约束的执行器,那对具有高自主性能力的机器人的强制要求。这篇文章针对一个模型的预测控制(MPC)计划,组合神经-动力学的最佳化来实现非完整移动机器人的轨迹追踪。通过使用非完整机器人的导出的运动学追踪错误,拟采用MPC方法迭代转换成约束二次规划(QP)问题,然后使用原始对偶神经网络解决这个QP问题在有限次数的迭代(水平)。应用神经-运动学优化可以使MPC的成本函数收敛到精确的最优值的约束QP制定。相比于快速MPC,他要求重复计算拉格朗日的哈希数组并且解决二次规划。计算的复杂度达到了,当使用神经-运动学算法时为次操作。最后,大量的实验表明在实时移动机器人系统MPC计划是有高效的表现。

关键字:(模型预测控制)MPC,神经-运动学最优化,二次规划问题,轨迹追踪

  1. 介绍

非完整移动机器人(NMR)控制在学术和工业生产有着迷人的吸引力,并且在机器人社会是一个重要的基本问题[1]-[4]。他的应用可以在工厂中被发现,家庭使用,危险地区和娱乐。移动机器人的轨迹跟踪控制是指移动机器人的实际位置/姿态收敛于一个预定义的参考路径或路径由一个移动虚拟目标。从早期的研究中,人工智能领域因能够追踪目标或者移动可视目标而著名[5]-[8]。主要的想法是引导机器人接近目标,以及避免障碍物。在传统研究中机器人能够看做质点并且它的物理限制被忽略。例如,在潜在的基本领域的接近控制中,控制的输出常常会出现追踪错误;因此,当机器人远离预期的位置,输出的控制是非常大的范围。相反的,当机器人接近预期位置时候,机器人的很大的速度波动。

最近,做完了移动机器人的追踪控制[9][10],在[11],对移动机器人合并动力学不确定性有完整的解答的报告。在[12]中,适应力和移动控制被考虑用来力/移动移动操作器包括不确定执行机构动力学追踪。然而,上面的报告工作没有处理内部的约束问题,包括执行机构饱和度,速度增加和一些关于机器人运动学陈述。为了包含这些约束在控制器,MPC是一个理想的工具,水平反馈控制也很著名。利用这些运动学模型,MPC能够对系统产生输入控制包括系统约束。这篇论文利用MPC的特征基于原始-对偶神经网络结合线性变化不等式求解内部约束得出两轮移动机器人最佳追踪轨迹。这是本篇论文的主要研究目的。

MPC通过输入-输出预测模型在有限的样本时间内进行实时最佳结果分析。一个重要的功能是基于连续控制得到每一步的最佳结果。在接下来的水平区间,更新相应的变量将得到最佳的结果。然后,一组连续的控制输入将在每一步中获得。因此,很明显MPC由控制和计划构成。

对于实时实现,对于MPC实现在线最佳化是一个重要而又基本的事件那就是MPC有着很高的取样速度。自从最佳化要求计算能力,MPC有更多的计算边界限制,那当前只用在较慢的运动学系统像化学反应和石油提炼。传统的最佳化方法不能解决高维空间的问题和满足实时计算要求。在[13]中,基于反馈控制器,NMRs的追踪控制已经研究。然而,计算复杂度的方法没有被分析。在[14]中,移动机器人的轨迹控制已经完全的使用MPC,并且在[15]的追踪错误的运动学模型在平衡点线性化以及分析和转移到一个精确的离散形式包括时间延迟。然而,控制计划建立在目标二次函数而导出的线性运动学。

在[16]中,一个非线性模型构造器为了追踪预期目标使用大量全方位的移动机器人,并且在[17]中,一个轨迹追踪控制器使用MPC用来调查全方位的移动机器人。然而,在计划中不包含非完整约束的自然本能。在[18]中,一个NMR的追踪控制和稳定被考虑和展示使用一个模型预测控制器。在[43]中,一个实时控制快速最佳化系统方法被利用计算自动驾驶的控制输入,在凸形二次函数中线性时间区别模型被获得来建立非线性最优化本地估计值[44],[45]。然而,FORCES要求重复计算朗格朗日哈希数组来得到QP,那将会带来额外的计算复杂度。从上面的讨论中,每一种方法都会有他的不足之处。在这篇论文中,根据上面的结果,通过完整约束,包括非完整的和内部约束(执行机构饱和度,速度增加和一些不同的机器人运动学),NMRs组成MPC的最优化的轨迹追踪控制发展。上面提到的工作被看做是发展中的特殊例子。

最近,计算机的发展更快了,一些高效的算法为MPC带来更快的应用。例如,神经网络最优化方法成为好的算法为处理在线繁重的计算消耗问题。一些神经运动学方法为约束最佳化问题在[19]和[20]中讨论实时应用。比较传统的最优化算法,这些大量的结果呈现出许多优点,尤其是实时应用。在[21]中,基于对偶神经网络的方法,多余操作器的协调和他的关节力矩的物理约束以及广义力在目标中的研究。

因此,为了避免计算能力的缺点,这篇论文提出一种结合神经动力学最优化设计的新型模型预测控制器。由于移动机器人上计算机硬件计算能力严重约束,这种情况下只有在线最优化被允许。神经运动学的利用最佳化需要计算机硬件的平行计算。而且,模型预测技术提高性能和避免违反约束,当他们在环境干扰和传感器失效下保持健壮性。然而,移动机器人的地面行动能力受限,MPC应该增强神经网络最佳化负责非线性最佳化。最后满足实时过程的要求。

在这片论文中,考虑到移动机器人的物理约束,当追踪相关的轨迹要求机器人有较高的自主驾驶能力,一个MPC方法整合PDNN最优化是对NMRs的轨迹跟踪控制。通过使用推断出机器人的轨迹错误,MPC方法的迭代变换同约束的QP问题,一个LVI-PDNN方法可以被用来解决QP问题通过有限次反馈。另一个MPC控制器的事件是高的计算花销。在这篇论文中,一个LVI-PDNN方法解决QP问题通过有限次反馈和减少计算时间。应用神经网络能够价值函数收敛到约束QP问题的最佳的值。扩展的经验说明MPC方案有效的控制机器人系统的实时系统。

这篇论文的贡献总结如下:

  1. 一个神经动力学最佳化的MPC要求实现位置约束满足并且对于移动机器人是连续可行的。
  2. 相比较于标准的MPC,在计算能力被严重限制下,MPC通过LVI-PDNN扩展负责价值函数的最佳化。最后满足实时计算要求
  3. MPC算法成功的解决了移动机器人的轨迹跟踪控制在速度约束和速度变化约束下(即加速度约束)
  4. 两轮移动机器人的运动学

研究对象是典型的非完整约束两轮移动机器人。两轮的速度(和)能够导出对应的刚体线性速度 和角速度 ,其中两轮间距是B。两轮的位姿状态通过和转角描述。运动学规律可以用下面表达式描述:

(1)

其中 是位置变量, 是控制向量。

同样的,参照位置向量定义为 和一个参照控制向量 ,如下所示:

(2)

运动学误差定义如下:

(3)

基于误差情形和动态模型,动态误差可以描述成如下:

(4)

重新定义误差控制信号:

(5)

因此动态模型(4)可以重新写作如下:

(6)

为了分析动态误差的局部稳定性(4),可以获得如下的(6)中线性误差模型:

(7)

移动机器人的跟踪控制目标(7)已经转为基于跟踪动态模型(7)的稳定性问题。因此,考虑到操控初始位置误差,那么控制输入的 和需要被重新设计。需要记下的是动态误差由一个非线性放射系统组成。

注意1:尽管误差模型(7)是可控制的,并且一些局部渐进稳定控制器已经说明[22]-[24],当线性速度和角速度收敛于0时局部线性可控制性能会失效。因此,许多成熟的控制器至今要求持续激励条件[25],[26],即,被控制的机器人不能停止;否则,他们的稳定性将会失效。但是计划中的MPC(模型预测控制)不需要持续激励,我们在模型预测控制中会给出收敛框架。

  1. 模型预测控制设计

一个可以描述非线性仿射系统的结构[46]

(8)

使之服从约束

此处 陈述向量, 是输入向量, 和 是连续非线性函数, 表达为紧凑集合, 集合表达了其内部初始位置,N表达了预测范围, ,和表达了控制范围,。

MPC(模型预测控制)能够制定最佳的迭代程序。尽管测量或者估计连续控制每一步,价值(成本)函数是最佳的比如最佳控制输入向量;然后重复最佳函数的在线计算的分析。考虑到MPC操控变量到原点,MPC价值(成本)函数可以被描述成如下:

(11)

其中 表示阶段成本和满足 ;并且 表明末端成本。

对于控制稳定性,预测和控制的范围N=Nu是足够大的,即,在阶段价值(成本)函数中LN=Nu=无穷。因此,能够组成末端价值(成本) 和规定约束 ,其中原点的附近在为实现最小环性能的MPC最佳化。

然后, 的标准二次型被定义如下, 表示欧几里得范数,并且Q和R是正定矩阵:

(12)

其中在未知范围的预测位置是的增量是 ,其中 。

跟踪动态误差(8)可以被重新写成如下形式:

(13)

使之服从下面的约束:

其中是规定向量; 及是输入向量,并且:

其中表示为一个抽样时间, 和表示是最小范围,且 和表示的是最高范围。

定义如下的向量:

预测的输出可以被写作如下形式:

(20)

其中:

因此,初始的最优化问题(12)服从约束(14)-(16)变成:

(21)

服从:

其中 ,并且和是最低范围,和是最高范围。

问题(21)可以被重新写成看做一个QP问题

(26)

服从:

其中的系数是

  1. 神经动力学最优化

从(20),一个统一的QP组成为MPC发展成(26)。在线求解QP问题是很需要的。在[19]和[20]中,梯度PDNNs分别发展成机器人操作器和最优足力分布及四足机器人的控制。在这片论文中,梯度神经-运动学最优化在MPC中适用于解决QP问题。

  1. 模型描述

表示作为原始-对偶的最高/最低范围来描述向量,他们是:

其中的对偶决定矢量定义为 ,对任何,都有元素在到正无穷。让系数矩阵和矢量成为 (29)

然后,下面的引理为随后的引出。

引理1[19],[20]:考虑到约束(14)-(16),然后QP问题(26)-(28)能够转换为下面的LVI问题,并且存在向量 满足:

(30)

从[20],线性变分不等式(30)能够转化成为分段线性等式如下:

(31)

其中在中是分段线性规划操作,或者称分段线性,可以用下面的来定义:

为了解决线性问题(31),我们可以为(31)建立下面的改进的动力学系统:

(32)

用正参数用来表示神经网络模型的收敛速度比例。

B.网络架构

PDNN结构在Fig.1中已经展示, 代表矩阵的行,代表矩阵的行,并且是的维数。在Fig.1中,PDNN属于Hopfeld神经网络,他是一个有单一层结构的简单反馈的非线性网络,基于Hebb规则采用无人监督的学习方法。PDNN由组成,不等约束的维数大小,和原始决定向量。

神经网络展示如下:

其中是分段线性激活函数,从[37]和[38],它能被实施用来运算放大。

注意2:PDNN不能决定处罚或者模拟参数,矩阵反转,或者高阶非线性项,只有简单向量或者矩阵增加和操作。因此,PDNN的架构通过模拟电路用来实施能够比现有的递归神经网络更加简单[39],[40]。查看(33)和Fig.1,PDNN回路(32)包含个积分器,k限值器(成为分段线性激活函数) 乘法器,和个加法器,因此计划的PDNN方法包含 操作。为了解决QP(26)-(28),一个传统的连续二次程序(SQP)用梯度下降是经常采用的,其中计算复杂度要求Hessian矩阵的重复计算来解决二次方程程序[29]-[31],例如MATLAB最优化函数“QUADPROG”或者“LINPROG”。传统的QP问题需要 次操作;归因于低效率的算法,显然不可能用于移动机器人的在线控制。当相比较于计算复杂度,计划的PDNN方法能够减小计算消耗(计算复杂度)。为了解决QP问题(26)-(28),传统的SQP方法花费了0.3秒,当使用PDNN方法时,只花费0.038秒[其中CPU是Inter Pentium E5700 @3.00GHZ,2GB内存],相比较于样本时间的0.1秒已经很小了,因此,PDNN方法能够提高实时计算的目的。

定理1:考虑到非线性仿射系统(8),并设计MPC输入 ,和相应的控制增量 。考虑到任一出事变量情形,神经动力学向量 (32)收敛于最佳结果 ,其中的第一个元素在(26)-(28)中是最佳控制输入 。而且,收敛是指数型的并且可以找到一个常数满足 。

证明:见附录。

注意3:考虑到适

全文共7338字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[8731],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。