英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
第二十九届中国管制会议论文集
2010年7月29-31日,中国北京
移动机器人的轨迹跟踪与避障优化基于数据驱动控件的代理*
邢少敏1关新平1 2,罗晓媛1
1. 燕山大学电气工程系,秦皇岛066004
电子邮件:xpguan@ysu.edu.cn
- 1 .上海交通大学电子电气工程学院,上海,200240
文摘:提出了一种基于数据驱动控制的最优避障轨迹跟踪方法算法。agent在回避障碍的同时,研究者总是在考虑如何避开障碍,而不是如何避开如何在最短的时间内避开障碍物,以及如何达到最优的避障控制。这篇论文的主题是利用数据驱动控制方法设计轨迹跟踪控制器,寻找最优障碍物移动代理的回避路径。为了实现数据驱动控制,引入了不可证伪控制理论。未证伪控制仅利用数据获得最优控制器参数。仿真结果表明所提方法的有效性。
关键词:最优避障,数据驱动算法,不可证伪控制理论,移动代理
1介绍
在智能体的应用中,实现了轨迹跟踪而回避总是热点。为了实现轨迹和规避,很多学者都有提出了很多方法来解决这个问题[1-5]。
避障问题是一个被广泛研究的问题而机器人的势函数法得到了广泛的应用用来解决这个问题。该方法由一个吸引机器人的人工势场目标从障碍物中重新站起来。然而,先锋工作没有考虑过移动队形通过一个部分未知的环境和障碍。在一些应用中,避免障碍是必要的,包括搜索、救援和地形数据采集使用地面或低空飞行车辆[6]。与此同时,传统用势函数法求解路径是不合适的机器人在动态环境下的规划目标和障碍物在移动。正如[7-8],传统方法也存在局部极小值机器人在障碍物和目标之间的通道附近有障碍物无法到达。一些修改介绍了改进方法[8-10]。在[10]计算机器人与目标之间的距离考虑,然后消除目标的问题附近有障碍物无法到达。上面的方法是否正在取消可用性,但是路径呢,避障并非最佳选择。
本文的目的是提出一种新的方法轨迹跟踪与避障的优化移动代理。数据驱动控件是无模型方法,它专注于创建控制器,并仅仅使用系统的输入输出数据。非伪控制介绍了实现数据驱动控制[2]的原理。不可证伪控制理论本质上是数据驱动的自适应控制理论,允许学习的基础上通过消除[3]的过程在线物理数据。
这篇论文的提纲如下。我们开始的初稿和问题提法第二节中的轨迹跟踪与最优规避。不可证伪控制理论在3.1节中介绍,对于最优的无碰撞,我们将看到细节3.2节。第4节和第5节包含模拟结果与结论。
2前期准备及问题形成
2.1路径表示与车辆运动学
有一个移动代理,它位于一个二维平面上,在这个平面上定义了一个全局笛卡尔坐标系。agent在其位置上具有三个自由度,其位置由姿态表示,
在标题设在x逆时针方向。让0表示一个空的姿势,其中n是一个整数。由于代理在平面上具有运动能力,所以姿态p实际上是时间t的函数。点的整个轨迹称为路径或轨迹。如果和时间衍生品存在,不是一个独立的变量,因为
(2)
车辆的运动控制的线性速度和旋转速度,也是时间的函数。车辆运动学由雅可比矩阵J定义:
(3)
这种运动学在非全向车辆中普遍存在。
2.2最优避障及跟踪控制器描述
现在,让我们介绍基于数据驱动算法的跟踪控制器的体系结构。
图1基于数据驱动的跟踪控制器架构
如图1所示,第一框(控制器)为移动代理的跟踪控制规则。本文针对非完整移动代理的轨迹跟踪,由Kanayama于1990年[1]提出了跟踪控制规则。控制规则如下:
(4)
第二个box(T)代表移动代理硬件,这个部分的能力是将目标速度q转化为移动代理的真实当前速度。第三个框(J)是运动学矩阵J式(3),求当前姿态的导数。第四箱(int;)是集成,生成当前姿态。“未证伪控制过程”和“控制器参数K”为数据驱动控制过程。关于这部分的描述见第3节。
在移动代理避障的过程中,当移动代理遇到障碍物时,代理的传感器检测周围环境,并确定避障的最优路径。例如,在图2中,移动代理在跟踪参考轨迹时遇到障碍物,这是避开障碍物的最佳路径,路径A或路径B,或者如何在最短时间内绕过障碍物。在第3节中,将详细描述避障的过程。
图2 最优回避描述
3不可证伪控制理论与最优避障算法
3.1不可证伪控制理论
不可证伪控制本质上是一种数据驱动的自适应控制理论,它允许通过消除过程基于在线物理数据进行学习[2,7]。一如既往的控制理论,目标是设计一种适用于电厂的闭环系统响应给定规范的控制律。
不可证伪控制理论是指在选择控制律时,人们希望充分利用测量值所获得的信息,而工厂要么是未知的,要么只是部分已知的情况。在不可证伪控制理论中,当测量数据中的新信息使一个控制器能够从考虑候选控制器中消除时,学习就发生了。关于未证伪控制理论的更多细节在[2]中描述。非证伪与证伪的正式定义如下:
定义1[6]一个控制器K是伪造的测量信息,如果这些信息足以推断出以下性能规范
将违反。否则,控制器就是不可证伪的。
上式中,为系统输入,即移动代理的期望位置;为系统输出,即移动代理的实际位置为控制变量,为系统的控制规则;是性能规范的功能。根据上述非证伪和证伪的定义,我们可以表述如下定理来解决非证伪控制问题。
定理1一组的控制参数是不可被测量信息集合证伪的,当且仅当,每个组至少存在一个对1,比如
(5)
在上式中是一个控制参数,是控制参数集表示过去的测量基准。
证明:在控制器的循环中,当且仅当中的一些。
一个命令信号将会产生测量信息。
当且仅当对于每一次这样的至少有一个(可能不同)对也会产生循环中的测量信息与和另外满足性能规范,控制器K是不可证伪的。也就是说,当且仅当对于每个,条件(5)成立时,K是不可证伪的。
3.2基于数据驱动算法的跟踪控制器设计
不证伪控制与其他自适应控制方法的主要区别在于,在不证伪控制中,可以只根据实测数据调整控制器参数,而不需要对设备进行任何假设。在本文中,我们提供的参数设置,,来找到最优控制器。,原则上,不证伪控制理论允许设置集任意子集的,其中n是控制器参数调整的数量,我们离散化候选人控制器设置K,以便只有有限数量的元素,以简化计算。
在每次,性能规范设置由三元组的集合满足不可或缺的表现形式的不平等:
(6)
上式中,和的定义可见于和,
,
.
由定理1,候选人控制器 在由工厂数据和得出的时刻时是不证伪的条件如下:
(7)
算法1(控制器不证伪过程)
初始设置:
一个有限集K m控制器候选人,,。
性能功能和
采样时间
rho;的价值
初始时间和
最初的控制器
程序(在每次):
- 测量和
- 对于每一个
- 利用式(6)计算
- 如果,则删除控制器参数从(因为伪造了测量数据时间);其他的继续。
- 如果是空集,则终止算法;否则,设置新的电流控制器参数, 和增量时间,然后回到步骤1和并重复以上步骤。
如果集合为空,则算法终止,因为中的所有控制器都是伪造的。在这种情况下,我们要么放松性能规范,要么使用额外的控制器候选来增加集。
3.3最优避障算法
在本节中,我们提出了一种新的最优避障算法。该算法是基于检测到的移动代理与障碍物之间的距离。
当移动代理沿着期望的轨迹运动时,移动代理的传感器只检测运动方向的前方。当传感器检测到移动代理与障碍物之间的距离已经达到避障阈值时,传感器扩展了检测边界。
如图3所示,在避碰开始时,传感器在检测的两侧都进行了小尺度的放大。如果检测结果表明障碍物仍然存在于该方向的两侧,则继续放大二次检测。否则,移动代理将移动到障碍物不存在的一侧。
图3最优回避原则
4仿真研究
在这一节中,为了测试所提方法的有效性,进行了数值模拟。针对单智能体跟踪期望轨迹的情况进行了仿真,避免了跟踪轨迹上的障碍物。
在每个,当使用参数控制器时,则输出变量
以及控制变量
同时,我们还得到了期望的输出变量
以及所需的控制变量
性能规范和如下:
(8)
(9)
在每次时,使用式(6)计算的值。如果,控制器参数 在这个处是不证伪的。
仿真中使用了以下参数:
采样时间是0.01秒
的值为0.01
参考轨迹为
所需控制变量
代理的初始形态
,,
因此,中的候选控制器个数为1815。
仿真结果如图4所示。移动代理在直线轨迹上运行,而直线上存在障碍物。从图4可以看出,代理可以立即跟踪轨迹。当遇到障碍物时,代理以最优路径避开障碍物。
图5为未证伪控制器参数集的演化过程,最终候选控制器参数集为294。我们选择控制器参数,,,仿真结果显示在图4。
图4 代理的轨迹和规避
5结论
本文将无模型无数据驱动的无模型控制器设计方法应用于移动代理运动系统。这种方法的优点是不需要工厂模型。我们只需要对工厂的输入输出数据进行实时测量。不可证伪控件的一个显著特征是其实现的灵活性和简单性。对于移动代理的轨迹跟踪和最优避障,该方法以简单的方式解决了这一问题。仿真结果表明了该方法的有效性。
关于数据驱动系统方法的说明
许建新 侯忠生
摘要:本文提出了几个以数据驱动系统方法为中心的思考。我们简要探讨了三个主要问题:离线和在线数据处理方法之间的关系,数据驱动和数据驱动之间的互补关系。 基于模型的方法,以及数据驱动系统方法的观点。 在本文中,我们的目标是对开放性问题进行分类和分类,探索可能为四个关键领域提供替代或潜力的可能方向,而不是为目前的知识和研究水平提供数据驱动系统问题的解决方案。 兴趣:控制,决策,调度和故障诊断。
关键词:数据驱动,主要关系,问题分类,研究方向
在炼油厂,交通和通信网络,电网,航空和航天等大规模和复杂的工业过程中,最突出的特点是存在大量数据,同时缺乏有效的过程物理模型, 支持控制,故障诊断调度和决策。 这里,大规模是指从几十个到几千个变量或节点的规模水平,复杂性来自异构信息源,多模态信号,高非线性,变量或系统状态之间的强相互作用, 人类活动的参与,以及四个关键领域的任务混合在一个综合过程中。 通常,大规模和复杂性的直接后果是广泛的系统不确定性,阻止问题解决使用基于物理模型的方法。
本文的主要目的是寻找通常由数据驱动系统方法和特别是在线数据处理技术创造的可能的替代方案。具体而言,我们关注的是四个关键领域的财富,并研究将提供的其他领域 非传统的可能解决方案。
数据驱动方法已被广泛应用于解决四个关键领域中遇到的工业和现实问题,包括控制工程,仪器和测量,计算机安全。电网和系统。智能交通系统和车辆,航空航天,电路设计和 集成电路调度,医疗和康复中的诊断和规划,互联网和网络,电气驱动,过程工业监督,半导体工业等制造业。
机器学习和计算智能方法也被广泛用于解决控制,决策,调度和故障诊断四个关键领域中的问题。
值得指出的是,数据挖掘和计算智能方法的可能组合也得到了探索,例如将数据挖掘与神经网络,模糊逻辑和进化算法相结合。
数据驱动系统方法的最新进展,如先前的讨论和已发表的关于应用和理论研究的报告所证明,提供了关于四个关键兴趣领域 - 控制,决策,调度, 和故障诊断,以及其他四个研究领域 - 计算智能,数据挖掘,控制系统理论和机器学习方法。
数据驱动系统方法的核心思想是以某种方式使用离线数据来增强在线数据驱动系统方法,当后者无法满足性能要求时。因此,一个重要的问题是要明确 离线数据和在线数据之间的主要差异。
请注意,大量的离线数据并不能保证新系统的存在或获取超出现有的系统信息。这个问题在某种意义上类似于持久性系统识别中的丰富性条件 因此,离线数据的第一个预期特征应该是足够的。其中矩形表示具有必要尺寸和大小的样本空间。样本空间是离线样本的集合,如图所示。 图中的点。我们对离线数据的期望是样本的丰富程度均匀分布在样本空间的兴趣范围内。这里,样本可以是一个动作,一个决定,一个特征,一个观察等等。 。,这是沿时间或空间坐标记录的一系列离线数据。
离线数据的另一个重要特征是完整性。样本中的离线数据序列几乎应该是完整的或密集的。在工业中,数据收集过程完成,数据丢失发生。例如,在城市交通流量的监控过程中。摄像机或环路探测器等监控设备对环境条件非常敏感,如照明条件,车辆尺寸和速度,或设备的可靠性,可能导致某些时期严重的数据丢失离线数据的完整性需要解决几个问题:与特定任务相关的必要完整性水平,对完整性的评估,统计完整性以及对完整性的主动补偿。尽管如此。在单个样本中难以实现完整性,可以在集合意义上实现统计完整性。主动补偿是针对目的的y重现样本或生成可以覆盖历史记录中缺失部分的新样本。为了实现离线数据的完整性,有必要对离线数据进行适当的后验分析,模式识别和分类,如果存在缺陷,并在可能的情况下寻求补救措施。
值得指
全文共5903字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[1699]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。