Reeds-Shepp问题在唯一最终自由方向的最优解外文翻译资料

 2022-03-25 20:11:11

英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料


A.V. Dmitruk, I.A. Samylovskii

Reeds-Shepp问题在唯一最终自由方向的最优解

莫斯科大学

avdmi@cemi.rssi.ru barbudo.sam@cs.msu.su

摘要: Reeds-Shepp模型描述了平面上只有一个最终方向的移动点,我们研究了它的时间最优问题。利用Pontryagin最大原理,获得了所有类型的极值,然后分析和抛弃非最优的极值,得到最优组合。

关键词:时间最优问题,Pontryagin最大值原理,极值,可行集合,最优解

1 问题陈述

考虑以下问题:平面上的一个移动点:

这里我们有三个状态变量和两个控制u,v,这一对(x,y)决定了平面上点的位置,是它之间的夹角速度(x,y)和纵轴。初始时间t 0是固定的。

这个问题(在初始和at上都有一个固定的速度方向最后的时刻)是由Reeds-Shepp所陈述的,所有可能的极端情况被描述。然后由许多作者研究(例如,3、4、5、7、11、13);a在[5]中给出了一个固定的最终方向的完整的合成。在这里我们用一个自由的最终方向来考虑这个问题。重点应该是在最短的时间内,在规定的位置,无论从哪个方向这就完成了。毫无疑问,这样的声明在物理上是合理的。我们的目标是为问题构建一个最佳的合成(1)。

注意,自由的问题本质上更简单有固定的(这是最优控制的典型情况);然而,问题的最佳合成(1)并没有遵循最佳的合成方法固定的的问题。与此同时,问题的相对简单性(1)允许一个人非常清楚地、完全地、很快地研究它,避免对该案件的繁琐考虑,并有一个固定的最终方向。此外,由于问题的合成(1)只依赖于两个参数(x T,y T)(不像一个固定的的合成,它依赖于三个参数),它可以是在飞机上了。

还要注意的是,对于冻结的控制u=1,问题(1)(有不同的对的条件的选择减少到众所周知的马尔可夫问题——杜宾斯问题1、在那和许多其他论文中学习(见6、8、9、10、11、12、13、14)。

因为问题(1)中的可接受的控制集是一个凸紧的(一个正方形)在平面上),控制系统在两个控制中都是线性的,经典的Filippov定理保证了一个解总是存在的。

让(x(t)y(t)ϕ(t)u(t),v(t),tisin;[0,t]是一个最优的过程。根据Pontryagin最大原则(MP),存在一个数字大于0和Lipschitz函数x(t),y(t),(t),不是所有的都等于零,生成Pontryagin函数

并满足costate方程

横截性条件:

“能量守恒定律”:

最重要的条件是,几乎所有的t

考虑到H在u和v中的可分离性,最后一个条件分裂为两个单独的条件:对于a.a. t

这些条件反过来也意味着

在这里,是一个集值函数,等于1的z-0,1的zlt;0,和区间[-1,1],z=0。

如果u(t)符号z(t),而函数z(t)只在一组零测度上消失,你可以写出“标准”关系u(t)=sign z(t)。

2 最大原则分析

在A.A.Milyutin之后,我们将问题的控制系统称为所有点约束的集合,不考虑端点约束。对于问题(1),控制系统由关系组成

在控制系统的极端情况下,我们称之为状态、控制和共态变量的集合,满足给定的控制系统,以及costate方程、能量守恒定律和最大条件(即MP的所有点态条件)。对于系统(9),极值是函数的集合满足(9)和(3)-(7)。如果costate函数的集合不等于零,那么极值是很重要的。对于系统(9),极端的非平凡性等价于拉格朗日乘数的总集合的非平凡性。(如果,那么也=0)。

让我们找到系统的所有非平凡的极端情况(9)。为了方便起见,我们假设它们是在整个实轴,以及一个适当的位置上定义的区间[t0,T]将在稍后确定,并考虑端点条件。

从(3)开始,,所以,唯一的本质上仍然存在的costate变量,我们将进一步表示它psi;。

注意,如果x=y=0,那么根据(4),=const,以及,我们得到,然后。所有的收藏都是微不足道的。

因此,,不失一般性我们可以设置。然后对一些,所以函数(t)和(t)满足以下条件:

注意,在(12)的情况下,对于几乎所有的t

考虑所谓的异常情况,当=0时。这里是和psi;equiv;0。因为是连续的,sin在孤立点消失,=const,因此,v0。而且,因为在这种情况下,,关系(10)产生u 0。因此,我们的移动点实际上是静止不动的在同一个地方(在原点)。然而,只有在这种情况下才有可能因此,我们假设然后是。

现在,考虑一下大于0的情况,但是psi;equiv;0。然后是,所以=const,因此是v0。此外,,从那里。这意味着这个点沿着一条直线运动或者以速度1返回。只有当最后的位置在纵坐标上时才有可能轴(即。在由初始速度矢量产生的直线上)。

接下来我们假设(t)不等于0。作为两个函数通过公式(12)确定控制u(t)和v(t)连续的,他们的积极性和消极的集合是由间隔组成的。考虑任何最大的间隔(连接组件)=(t 1,t 2),在哪里定义为0(然后v=1)。

注意,如果t 1或t 2是有限的,那么在这一点上=0(否则区间不是最大的)。自从ϕ= t C(t)在(10)的情况下,然后平移轴t,我们可以假设(t)=t。

从(13)我们有

先考虑案例1。然后(t)6=0 t,因此,我们必须满足横截条件(T)=0,我们将此类型排除在进一步考虑之外。

现在假设0lt;6 1。然后,显然,t 1和t 2是有限的。从它的连续性和最大限度在这一点上间隔psi;= 0。然后(14)我们在这些端点处有sin t=a,因此,。在线段上,函数sin t要么增加,要么从下降到。假设增加是被实现的。让我们找到进一步的(t)的行为。从sin0开始,我们仍然在一个内点t 2=,从u=1开始,在(10)的情况下˙psi;是连续的。此外,不同的情况也会发生,这取决于alpha;isin;(0,1)。

I)alpha;lt; 1。在这种情况下,,因此我们有在某个右手区间上(t 2,t 3)。正如上面所发现的,最大长度这样的区间是2,也就是t 3=t 2 2。在这个区间上,(即ϕ(t)是反向时间),和(14)psi;(t)=(ϕminus;theta;)minus;alpha;。它是很容易的为了看到t 2的图,t 3是相同的对称反射图上的图1,t 2关于点(t 2,0)和的图在t 1上,t 2的对称映射是关于直线的t=t-1。因此,如果(0,1),的图形有以下形式。在真正的直线R,我们要考虑sin t的图像,去掉这里的间隔然后将剩下的部分连接到一起,这样它们就可以了在它们的端点连接。结果是一种“伪正弦信号”。

图1:在大于0的情况下增加的

得到的图像是这样的。在这个区间上,它是(t)=sint(尖顶帽),下一段,3,这顶帽子是用负号,然后加上加号,等等。我们得到了一种锯齿曲线(见图1)。

当这些图被构造出来时,可以从它们中获得控制u和v通过公式(12),多值的符号现在可以被通常替换的迹象。很容易验证这里u(t)=符号因此,psi;(t)来确定你没有必要使用的图像,它就足够知道了psi;的图。因此,当增加为0时,整个过程极值是由一个函数(t)的图形来定义的。如果减少为0,整个极值也由(t)的图来定义,但在这种情况下u(t)=符号˙psi;(t)(见图2)。

所以,对于所有的(0,/2)和对应的=sin(0,1)极值,上面有锯齿形,v=符号,u是由u(t)=符号决定(t),或者有相反的符号。我们称之为极值I型。

区间T 0,T可以放在轴上的任何地方,只有一个。这个区间的左端可以是任意的。

(二)alpha;= 1。这里。像以前一样,考虑最大的0和sin()从1增加到1。v = 1再一次,改变轴向t,我们可以假设(t)=t,在这种情况下和'最大帽子'的图形:

对于t 2=2,我们有因此,不像我,在t 2之后函数可能不会传递到负区。以下是进一步的行为是可能的:

a)t 1 t 1 的图形是它在t 1 t 1上的图形的复制(翻译)(最大的尖顶帽),

b)t 1 t 1 的图像是t 1 t 1的图像的反映关于t轴(也就是t 1的图的平移,t 1(最大峰值上限),

c)值被保存在一个区间内,任意长度的t 2,然后在区间t 2,t 2 1个变量中a)或b)被实现,也就是说,一个最大的上限要么达到峰值,要么下降。

在所有这些情况下,极值属于II型。接下来,我们需要对上述类型I和II进行更详细的分解。在类型I,下列情况是可能的:

Ia型)极值包含至少一个“完整”的上限,即,有一个长度为2的区间为0或lt;0。当我们有条件(T)=0时,这个要求相当于T T 0 2的条件。

类型Ib)极值只包含一个不完整的上限:。

类型Ic)极端分子包含不超过一半的上限:t0 6。在II型(即。当=1、=/2时,下列情况是可能的:

IIa型)极值包含至少一个完整的上限,即这是一个间隔长度为0或lt;0的长度。这就等于。

IIb类型)极值包含一个不完整的上限:。

IIb0类型)极值是由子,在。

IIc型)极值不超过半顶,也就是。。

IIc0类型)极值是一个不完整的“半帽”,由0:t 1扩展在(T 0,T 1)上有0或lt;0,然后在上。

现在我们证明了这些类型的极端情况肯定不是最优的(全球意义上的)。

3 Ia型和IIa型极端情况的非最优性

我们证明,对于这些类型的任何极端情况都存在一个可接受的轨迹时间更短。为了证明它我们做了一些几何结构(这取决于它的价值)。

回忆一下。以Ia型的极端情况为基础考虑它的最终完整的上限。选择坐标系统,以便开始这个帽子的t=0,和原点重合,这个点的速度是沿着y轴方向。为了简便起见,半径为1的圆以点为中心(1,0)将被称为左圆,而对称圆w。r。t。轴的圆。

在不失一般性的情况下,我们假设在我们的帽子中,和减少。然后是,u=(1,1)(0,sigma;)和(sigma;2sigma;)。这对应于左圆的运动正方向(逆时针方向),然后沿着切线方向圆圈仍然处于正方向(例如圆圈的共同之处是一个尖端点的曲线)。如果,我们有一个Ia型的轨迹图3。它的终点B显然位于第一象限,y(B)大于0。

图 3

将左圆的圆心与B点连在一条直线上。让弧A 0 B是对称的,这条直线。的长度弧显然是一样的。然而,弧OA 0的长度比弧OA。这个事实可以很方便地表述为以下纯几何图形断言,从图4中可以很容易地看出这一点。

引理3.1。让直线l穿过点O 1=(1,1)正斜率,让A点在这条线上的左圆上,x=1。让0成为w.r.t l对称的点(很明显,它位于同一个圆上)。然后是。

图4:弧OA 0比OA短

所以,我们的极端OAB的最后一个上限比轨道的长度更大由左圆的弧OA 0和它的切向圆的0 B组成。自这个新轨迹的子弧是在0处连接起来的,这个轨迹是在这个问题中是可以接受的,因为它的长度比我们的极值要短,最后一个不是最优的(在全球意义上)。

现在考虑一下案例=/2。这里的点B在y轴上,极端情况(IIa型)可以由位于y轴上的BC段继续,(u,v)=(1,0)(见图3b)。很明显,美国广播公司的发展轨迹最优,因为它的长度比直线OBC要大,沿着这条线(u,v)equiv;(1,0)。

因此,只有特定类型的Ib、Ic、IIb、IIb0、IIc和IIc0可以假装成最优的。

让我们为每一种类型找到可到达的集合,如果它们相交,图最优的极端情况。

4 得到最优解

首先要注意的是,我们的问题(1)有两个对称:替换,我们得到它的轨道与原始的w。r。t的原点对称,和替换v7v实际上会导致替换t 7 t,然后x 7 x,也就是原始轨迹w。r。t坐标的对称反射轴。因此,在可达性集合的构建中我们可以假设结束点p=(x(T),y(T))位于第一象限

现在考虑以上每种类型的极端情况。

类型Ib:不完全的非最大上限。我们假设这里u=(1,1)间隔(0,gamma;),(gamma;gamma; sigma;),0 lt;gamma;lt;sigma;,T =gamma; sigma;。因为在这情形v 1,点沿顺时针方向旋转:首先在角度上“左”圆,然后沿着切向“右”圆的角度(也就是不是原来的右圆,而是在中心周围旋转的圆O(1)。让我们先修复任何(0,2)。那么极限的值就等于0和sigma;。对于,端点在正确的圆上,当从0增加到它沿着半径在圆心为的中心,我们用表示(见图5)。对于位于水平轴下方。

实际上,让G 0成为左圆的点,用它来表示角度水平轴。点p(,)=B 0是通过沿着弧线运动得到的0,然后沿着GB对称到OG,公切线在点G处。然后点B是对称的,这是w。r。t切线,因此B在横轴下方。

因此,当在上运行时,端点会绘制一个在圆心为O 1和半径为R的圆中打开一个。

考虑到所有这些弧,我们得到一个集合Q ,以弧为界右圆的OA,半径为R(/2)的“大”圆3(/2)的弧AFradic;5曲线OB 0 F,也就是点p(,)的痕迹。(很容易看出这一点曲线是心脏线的一部分,参数方程,y=。

因此,Q 是一个开放集由所有类型的轨迹的端点组成在案例中(t)大于.

如果大于u=(1,1)在相同的区间内,而不是Q 获得集中对称的集合,因为它位于左半平面,我们是对第一象限感兴趣,我们忽略这个例子。

在这种情况下,u=(-1,1),而不是v=1,我们有v=1,然后,做替换,我们得到了集合

全文共11112字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[15314],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。