基于最优化的行人模型评价标准
摘要
人群仿真算法(复杂,高维,多尺度系统)的评价与比较是一个重要的问题。现实主义依赖于应用的目标,这相对于实际测量而言不是很容易。我们已经对这样的评价提出了有力的解决方案。我们在评价前先重点评价仿真参数:如果评价模型不能很好的运行,那么会有什么样的评价结果?我们提出了一种基于优化的方法,它包括:参考数据,指标,仿真算法和优化技术。我们用有价值的参数值来得出与参考数据尽可能接近模拟结果,这样才使比较变得公平和有意义。
关键词:优化仿真;评价;参数估计;优化;地面实测数据
1、介绍
由于很多的仿真算法的介绍,模拟的人群已经得到一定的重视。这些算法包括根据不同的原则,被广泛使用在计算机游戏,虚拟现实,动画以及行人安全的多代理算法。
虽然有越来越多的模拟算法,但是,能够客观和严格的评价变得越来越重要。与真实世界的数据进行比较可以明显做到这样的要求。然而另一个问题变得较突出,那就是为了获得不同的结果算法的参数可以经常被调整。在这样的情况下,在保证比较算法的性能的同时,也要比较算法的实际情况的数据集。这意味着使用最佳的参数值可以使模拟和数据之间达到最佳匹配。
获取所观察到的地面真实数据的方法变得越来越普遍,数据也变得更加容易获得。随着越来越多的模拟算法和数据集,能够自动和严格比较的算法也变得相当重要。
在这里,我们提出了一个框架,它可以用来自动评估各种数据集的模拟算法。当然,这种评估包括使用指标来比较算法的数据,但也有一个广泛适用的情况,评估这些算法的参数值来最佳匹配数据。我们讲这个过程看做一个优化问题,我们找到最佳的参数值,最大限度地减少所给的模拟和数据之间的错误。然后,剩下的只是在所获得的不同的仿真算法中去比较这个错误。我们的框架一般是在这方面并且许多算法和指标可以使用或集成。
我们说明有关不同性质数据集的框架的使用和利益,如记录的轨迹,个别行人或宏观数量,如基本图。我们的框架是开放源代码,以便其他人可以使用它来评估人群模拟算法的参考数据。我们展示了其在各种不同的数据,不同的数字代理的多代理算法的性能。
论文的其余部分组织如下。在第2章中,我们给出了人群仿真的概述,参数校准和算法评价的相关工作。第3章描述了我们的参数估计框架及其关键部件:算法,度量,参考数据,优化技术。最后,在第4章中用具体的例子和应用程序展示我们的解决方案的好处。
2、相关工作
随着在图形,机器人或消防安全方面的应用,大量的人群仿真算法已经出现,其中许多选择代表在人群和模型里的私人代理。一个很有代表性的微观方法的例子是雷诺兹精Boids模型。它的目的是匹配一个代理的速度,并且作为一个结果,多种行为出现在人群中。这项工作后来扩展到包括更多的交互,如下面的移动和路径。基于物理的模型将相互作用定义为代理间的排斥力,并且可结合各种规则改进行为。最近,对基于速度的算法进行了介绍,目的在于确定与未来时间窗无冲突的代理的速度。其他一些模型包括认知模型、可用性,短期规划和基于离散方法的模型,以及使用基于光流的感性变量合成的视觉模型。
也存在许多其他的算法,如在宏观层面操作的算法。一个主要问题是,将指标发展成能够比较这些算法依赖于不同的原则,从而定性也是不同的。有一个解决方案是使用实验数据去评价;但在这种情况下,需要考虑参数。例如,利用最大似然估计的数据,设置防撞模型的参数值。Lerner 等人比较了来自模拟和真实数据之间的本地决定。勒梅西埃等人考虑了更复杂的情况,捕捉的行人运动的微观和宏观特征的实验数据被用来校准和比较各种方法。
学习方法也被用来从视觉数据方面校准模型,从现实世界的数据中学习模型参数或从现实世界的运动中学习代理运动。这些方法,然而本质是现实(基于真实数据),也限制特定的场景。此外,现实部分的轨迹不一定保证组合物轨迹的真实性。在比较中,考虑到不同类型的数据集,我们提出了一种技术以脱离模型的方法来执行参数估计。
卡帕迪亚和同事根据评估提出了一个对不同情况下的路径平滑度或碰撞次数进行评估的框架。其他工作也把模拟的轨迹与真实数据相比,基于熵的度量进行这样的比较会对个别代理的运动造成混乱。然而这样的指标可以比较算法和真实世界的数据,不过最优参数的问题仍然存在,我们建议把人群评价看做参数优化问题的部分来统一这些工作,并且我们通过改进在各种情况下的算法的性能证明了它的好处。
3、优化框架
我们的框架是由四部分组成:模拟算法,参考数据,度量和优化算法。本节介绍了这几个部分间的相互关系,然后细述了每个部分。框架的更多细节(以及一些不同的结果)可在(Wolinski et al. (2014))上被发现。
3、1概述
我们定义一个人群仿真算法作为一个函数,给定一个规定代理的集合(他们的位置和速度)计算一组新的匹配仿真状态的时间的规定。我们用XK表示所有代理在时间k时的位置,Vk表示他们的速度,和g代表他们的目标。我们可以制定一个模拟算法如下:
人群模拟算法也可以有几个影响行为的参数,如它们的半径或优选的速度。我们假设每个代理的这些参数有一组值。给定一个代理i,我们表示这组值Pi,然后代表所有代理的参数值。
我们现在可以将先前仿真算法的定义扩大到参数化仿真算法。最后,参数值p现在是输入的部分:
我们现在的目标是找到一个对于给定时间Zk而言和参考数据相符的最优参数值P。参考数据的所有时间可以定义如下:
类似地,整个模拟可以被定义为模拟算法计算的规定的集合,与参考数据一起初始化:
在一个用户定义的距离度量情况下,我们可以计算模拟和引用数据区域之间的距离(f(z,p),z)。然后我们的框架计算与参考数据最匹配的参数值,给出仿真算法f:
这个优化问题是非常高维的,因此很难解决所有指标,参考数据,仿真算法。我们在3.4节描述我们如何解决这个问题。
一旦找到每个模拟算法的优化参数值,我们可以用公平的方式比较这些算法:通过比较它们的距离的数据,同时使用最佳的参数值。事实上,对于两仿真算法FI和F2,F1在数据和度量优于F2当且仅当:
3.2、仿真算法
前面定义的人群仿真算法适合许多常见的模型。在本文中,我们专注于四个广泛使用的基于主体的仿真算法。
1.在Boids模型,F是一个在未来特定时间里的作业的位置的函数。当代理的预测距离之间的距离太低时,间隔的力量需要被计算并且加入另外的吸引力量中。参数是:半径和舒适的速度。
2.社会力模型中,f是一个代理的位置的函数。作用和目标的吸引力量之间的排斥力要计算。参数:半径和舒适的速度。
3.rv02模型,计算了可容许的速度空间,f 是返回的最佳容许速度。参数是:舒适的速度,近邻距离,半径,和时间范围。
4.tahgent模型,在速度空间有效并且考虑了可能的视觉错误,f返来的最佳速度。参数是:舒适的速度、半径和两个错误定量的参数。
3.3、优化指标
参考数据指定了模拟代理应遵守的行为或运动。它可以是实验获得的数据或其它方式所产生的数据。例如,这可能是一种运动生成的带有另一个模拟或任意值的各种度量。在每一种情况下,指标应该与引用的数据类型匹配。
方程(5)可以用于各种类型的数据/指标,有2个主要类别: 微观数据,它指定每个数据的精确轨迹,和宏观数据,它描述了整体的人群运动的方法。
下面,我们在本文中描述了一些我们使用的指标:
微观数据度量:
绝对差度量(D)计算所有代理中位置的总距离。
渐进差度量(P)在仿真被重新初始化时测量模拟代理和参考数据间的不同。
宏观数据度量:
基本关系图把代理的速度和其速度比较。这种度量在系统动力学中得到发展,他被广泛的用于测量流体速率。
3.4、优化技术
方程(5)理论上可以用任意数量的组合优化算法进行优化。每个代理有自己的一组参数值来查找,这个问题很快就变得非常高维,寻找一个最佳的解决方案的复杂性是非常高的。这个问题被用户初始化为每个参数指定一个基本分布;例如,代理的半径可以被定义为不低0.2m和不大于0.8m。在我们的例子中,我们结合了遗传算法和贪心算法:
遗传算法:基于遗传算法的方法,寻求避免局部极小,并通过保持可以导致不同的局部极小的参数的平衡。新参数通过组合被计算。我们使用该算法快速细化参数的值分布。因此,我们可以快速找到使代理有效并不陷入局部最优的评价。
贪心的方法:这种方法适用于在具体时间为每个代理更换一个参数。如果这
置换降低了优化函数,选择了新的参数值;如果没有,则恢复以前的值。这种方法可以陷入局部极小,但它不是一个问题,因为我们用它从根本上最小化成本函数。
其他的全局优化技术,如粒子群优化(PSO)或伴随矩阵方法,可应用于优化方程(5)。作为参考,我们已经实施模拟退火算法和CMA(协方差矩阵适应)算法。
4、结论
我们的框架的主要优点是它的一般性:它可以在任何度量的基础上模拟算法,任何参考数据自动找到最佳的参数。在这一节中,我们我们通过微观和宏观数据的好处强调了我们的参数优化和框架的优势。
4.1 微观数据
在微观数据,代理的轨迹是已知的和模拟轨迹的指标进行比较。在最好的情况下,所有代理的位置是已知的。接着就可以提取开始位置和结束位置的模拟器作为目标。然而在有代理的情况下会出现和消失(如进出记录相机的字段的视图)。在这些情况下,我们的人出现在特定时间/输入特定的位置。这在被记录下来的真实的人群的背景下是正确的。但是在模拟人群的背景下是不正确的。由于模拟人群和真实人群不会有相同规定所以是真正的同行初始化代理的职位可能没有意义。因此,我们选择一定数量的代理,然后从位置已知的代理数据中提取时间窗口。通过这种方式,我们可以避免上述边界条件的问题。在这种情况下,仿真算法将用于模拟所有代理,所有非选择性代理将被重置为真正的同行的位置。然后指标只考虑所选择的代理。
在这里,我们提出这样一个案例,记录正在过路的两群人(每群150人)。我们测试的数据代表了8种情况,依次是111,166,163,128,100,92,111 和152个行人。这些方案代表了我们选择的提取时间窗口基础上5个选定的代理(较少选择的代理代表较长的时间窗口,而大量的代理代表较短的时间窗口)。
下面的2组数字展示了2种结果:
图2(a):共111个代理,5个选择,从左向右移动:RV02导致的错误比Boids模型略低。
图2(b):共111个代理,5个选择,从左到右移动:切线算法比社会力量模拟器导致稍低的错误。
表1用差异与进步差度量法显示了类鸟群,社会力量,RV02和切线算法之间的比较。对于差度量,切线算法给出了最好成绩(类鸟群导致最差),而社会力算法给出了逐行差异最好的结果(RV02导致最差)。排名之间的这种差异会倾向于表明社会力算法的代理人的反应将是最接近于在给定时间的那些基准数据,而切线算法的代理人在这些情况下必须在参考数据上最接近整体路径。
表1:类鸟群,社会力量,RV02和切线算法之间微观数据比较结果,较低的分数是更好的,有色细胞显示最佳的(最低)得分。
差异 |
渐进的差异 |
|
类鸟群 |
1.0 |
0.281639438 |
社会力量 |
0.792023413 |
0.261875267 |
RV02 |
0.579948966 |
1.0 |
切线算法 |
0.573973646 |
0.321520712 |
4.2 宏观数据
参考数据不仅可以代表行人的个人轨迹,也可以代表其他类型的数据,如基本图。在参数优化情况下用给定的模拟算法可能匹配这样的基本图。我们在这里用类鸟群,社会力量和RV02仿真算法重现魏德曼的基本图。为了用算法匹配这个基本图,我们将他们限制成9个连续点,对应的密度为每平方米0.75,1,1.5,2,3,5,6,4和6.3代理。
图3显示所获得的图。在这一点上,该框架可以帮助决定哪些仿真算法是最适合重现基本关系图,这在设置疏散方案时可能是非常有用的。在图3中,类鸟群模拟相比其他两种算法会导致一个较差的匹配。社会力量的算法很好的匹配了图,达到约2代理每平方米。最后,RV02算法匹配了所有密度较好的图表。
5、分析和结论
在本文中,我们已经处理了评价人群仿真算法的问题。为了比较进行到最优时的算法,我们已经概述了进行参数估计的需要。我们已经提出了将它作为参数估计的优化问题来解决。这项工作产生了一个大致的框架,支持各种优化算法,指标,类型的参考数据和模拟算法。
我们已经表明了这种框架以不同类型算法(基于力量的,基于规则,基于速度的)的使用,不同的指标(宏观,微观)和不同类型的数据(记录轨迹,宏观措施)
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[150213],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。