英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
2015年第12届计算机和机器人视觉会议
车辆检测与计数的隐马尔可夫模型
NicholasMiller,MohanA.Thomas,JustinA.Eichel,AkshayaMishra
Miovision技术公司.
马尼托路148号101室
基奇纳,安大略省,N2C1L3
电子邮件:{nmiller,mthomas,jeichel,amishra}@miovision.com
摘要—为了减少道路拥挤和提高交通安全,需要精确的交通指标,如通过车道的车辆数量。不幸的是,大多数现有的基础设施,如环路检测器和许多视频检测器,不可能提供准确的车辆计数。因此,提出了一种基于隐马尔可夫模型(HMM)的车辆运动建模方法。该方法将道路的一个特定小区域表示为“空”、“车辆进入”、“车辆在内”和“车辆退出”,然后将改进的Viterbi算法应用到HMM序列估计框架中,对车辆进行初始化和跟踪。利用Adaboost训练的Haar样特征检测器进行车辆观测。在88小时的视频测试中,从三个不同的位置,该方法被证明对光照条件、移动阴影和相机运动的变化具有鲁棒性,并且一致地执行了多目标跟踪(MTT)和虚拟检测线(VDL)实现。该方法的平均车辆计数误差分别比MTT法和VDL法低28%和70%。作为未来的工作,该算法将被实现为交通行业提供改进的自动车辆计数,以最终提供实时计数。
关键词-隐马尔可夫模型、车辆检测、车辆跟踪、机器学习、类Haar特征、智能交通系统
(a)空区
(b)车辆进入
(c)车辆完全在内
(d)车辆离开
图1。示例序列显示了“区域”中车辆检测和跟踪的概述(用垂直于车辆运动的两条杠表示)。状态机用于跟踪专区何时为空、车辆何时进入、通过和退出专区。这些状态是使用一系列三个用于观察的对象分类器盒按顺序确定的。一个训练有素的类似Haar的特征对象探测器[4]提供车辆观察的盒子。淡蓝色的盒子表示积极的车辆分类。序列状态估计采用隐马尔可夫模型。
I. 引言
如果完全提供了卷计数,则使用基本的后处理来导出卷计数。视频技术有可能提供可验证的在线音量计数和本地驱动存在信息,并且可以大规模部署以集成整个城市的ITS网络。
智能交通系统(ITS)越来越依赖于传感和控制的复杂应用,包括实时视频分析。可靠的实时车辆交通信息是ITS有效实施、缓解拥堵、减少延误的关键。预测需求和有效控制红绿灯配时和路线的一个理想措施是计算每个交叉口路段[1],[2]的车辆总体积。为了充分融入有效的智能交通系统,应实时在线提供可靠的交通量统计。
传统的交通系统仅仅是利用简单的基于感知车辆存在的红绿灯驱动来适应交通需求。虽然感应式金属线圈是一种常用的存在检测技术,但最近视频技术为交通感应提供了一种非侵入性技术。现有的驱动式红绿灯基础设施通常只提供本地存在检测。
A. 应用环境
本文介绍了视频分析的应用,通过用户指定的感兴趣区域(通常称为“区域”)提供可靠的在线车辆流量计数。配置区域的示例见图1。其目标是测量真实世界的精度和可靠性,以评估在具有现实挑战的ITS系统中部署的适用性[3],包括来自具有各种透视图和道路几何图形的未校准相机的,照明环境变化、部分遮挡、低比特率(约100 kbps),以及低分辨率(asymp;320times;240)的视频。
978-1-4799-1986-4/15 $31.00 copy; 22015015 IIEEEEEE
DOI 10.1109/CRV.2015.42
269
B. 纲要
1)背景减法和blob跟踪:视频中车辆检测的常用方法是使用背景减法进行简单的运动目标检测[1],[6]。交通场景的背景是通过背景建模过程来学习和维护的,比如高斯混合模型[7]。当前帧中的移动对象通过减去背景并应用形态学操作进行平滑来识别[8]。连接组件[9,p.317]用于分割单个移动的blob,然后可以使用Kalman滤波器进行跟踪[10,p.584]。由于相机运动和移动阴影,背景减法可能会失败。在进进出出的交通中,停下来的车辆可能被吸收到背景图像中,导致检测失误,以及车辆离开时的虚假重影[3]。
为了对车辆blob进行多目标跟踪,必须解决数据关联问题[9,p.388],并在车辆进出场景时正确初始化和删除长期跟踪。用于车辆跟踪的最有效的数据关联方法包括多假设跟踪[11]、粒子滤波和Monte Carlo-Markov链(MCMC)[8]-具有较高的计算成本,不适合实时在线实现。最近邻数据关联通常用于实时多目标跟踪,尽管数据关联失败的可能性很高[11],并且由于背景减法失败而容易出错。
2)虚拟检测线:一种更直接的车辆计数方法是虚拟检测线(VDL)[2]。在这种方法中,在垂直于交通流的图像上绘制虚拟线。视频中的像素强度沿直线被捕获并随着时间的推移被挤压以生成时空图像(TSI)。视频中通过线路的车辆出现在TSI中,其偏移量与通过VDL的时间相对应。计算车辆体积是分割TSI中单个车辆的外观;在[2]中,使用边缘发现和形态学操作生成用于计算的分割掩模。通常,这种分割对阴影、光照条件的变化、遮挡和车速的变化非常敏感,尤其是在车辆停止时。为了克服这些局限性,提高检测精度,采用了多条检测线与对应相结合的方法[2]。基于TSI的计数往往是基于规则的,没有规定的方法使用机器学习来提高给定先前数据的准确性。此外,作者不知道任何工作实现这种多VDL解决方案的在线方式,也没有提出解决方案,以同时估计其他可靠的实时交通信息,如车辆存在。
本文的主要工作如下:第二节简要介绍了当前基于视频的音量计算方法。随后在第三节中详细描述了问题。第四节概述了贡献和创新。该方法已在一个实验数据集上进行了测试,并与第五节中的替代方法进行了比较。最后,第六节讨论了第七节中总结的局限性和未来工作的途径。
II. 背景
A. 电感环探测器作为实时计数器
一种非常常见的车辆检测技术是在路面下用导电材料制成的线圈来测量电感。大型金属框架车辆驻扎在环路上,易于在电感信号中识别。这种车辆检测方法易于实时读取,具有最小的延迟和高信噪比。不幸的是,感应线圈有几个主要的缺点,其中最重要的是安装和维护成本高。挖出路面为每一条需要检测的车道安装一个环路,成本高,破坏性大。环路对配置和放置高度敏感,并且与调整相关联的成本很高。在冬季寒冷的地区,冻融循环会对地面探测器造成实质性损害:根据[1],1991年,美国大多数城市报告,25%至30%的探测器在任何给定时间都不工作。
环路检测器通常直接连接,用于存在检测和响应驱动。数据是不可人工验证的。其灵敏度有限、结构固定,不适合于对行人、自行车和摩托车等小型车辆的传感。由于只测量电感,包括车辆体积计数在内的交通参数不能直接观测到,因此必须使用各种特殊的推理方法。尽管存在局限性,环路仍然是最突出的车辆传感器。
B. 基于视频的车辆检测
基于视频的车辆检测以其相对成本低、易于安装和维护等优点而备受关注[3]。现代互联视频检测系统能够捕获、存储和处理各种应用的视频监控和分析。车辆、骑自行车的人、行人和其他道路使用者出现在图像中,可将其纳入检测和场景理解算法中以供应用。视频处理已经被用于各种交通传感应用,包括车辆计数和存在检测。尽管研究取得了进展,但人们发现,真实世界的准确性和可靠性仍然不足,特别是在不利的环境条件下[5]。
C. Adaboost和Haar特征
基于图像外观的目标检测器有监督机器学习已显示出良好的效果[12]。
270
学习过程,如神经网络和增强型分类器[12]有很大的计算成本和内存占用,但实时检测和分类是可行的,只要有一个适当训练的分类器。
基于Adaboost训练的Haar-like特征集的车辆检测与分类是目前图像中车辆检测的常用方法[13],[4]。这种分类器对光照变化和摄像机运动具有很强的鲁棒性,但低比特率视频中的图像伪影会导致许多误报和漏报。这应该使用场景信息和时间运动信息来减轻[3],[4]。必须及时正确关联检测以计算车辆体积。
(a) 轨迹跟踪
(c)量化1D“跟踪”
(b) 一维跟踪
(d) 量化为3个位置
III. 问题表述
所研究的问题可以表述为:开发一种算法,实时准确地计算通过已配置的视频区域的车辆数量。
系统必须具有以下功能:
(e) 2个位置
(f) 单一位置
1) 视频编码压缩中的噪声和伪影:这种压缩能够使视频数据快速传输和容易存储;;
2) 在停车和通行交通中使用:在交叉口,车辆可能长时间完全静止;
3) 沿相反方向行驶的相邻车道上的车辆:根据摄像机透视图,相邻车道上的车辆可能会部分或完全阻塞感兴趣的车道。
图2。(a) 跟踪可以通过连续空间定位和预测目标的运动轨迹。车辆的约束运动将问题简化为一维跟踪(b)。(c) 对空间进行量化可以减少精确的轨迹信息,但会降低跟踪所需的复杂性和参数,特别是对于多个目标。(c-f)量化值的数量和模型参数之间存在权衡。值太少,无法捕获理想的运动参数结果。(f) 一个位置值隐藏了方向性,仅观察2个量化位置无法捕捉加速度(e)。这项工作使用3个量化位置(d)。
噪声观测可能位于图像中的任何位置,并且过滤掉有意义的轨迹(图2a)。然而,由于被跟踪的车辆都在同一方向上移动,因此跟踪得到的最有意义的信息是车辆沿车道轴线的位置(图2b)。
现在考虑一维旅行的离散表示。如果车辆的位置可以粗略地估计为沿行驶轴的量化位置,则可以使用简单的状态空间来表示。在本文中,我们将使用图2d所示的三值位置量化。定义了以下状态:
除第六节建议进一步加强的地方外,本工程不直接考虑闭塞和保险杠之间的交通。.
IV. 贡献:解决方案和创新
其贡献在于开发了一种在隐马尔可夫模型框架下使用离散状态粗略跟踪车辆运动的模型和方法[14],以可靠地生成车辆计数数据。
跟踪可以通过将候选车辆检测与唯一车辆跟踪临时关联来用于车辆计数。然而,跟踪方法通常具有多余的自由度,这使得它们能够精确地定位目标。此外,对象跟踪的初始化和终止可能需要使用特殊规则和启发式。在计数应用中,一个简单得多的模型就足够了。目标只是跟踪有多少独特的车辆通过了特定的检测区域。精确的车辆轨迹既不相关也不必要。相反,可以使用简单的离散值来模拟单个车辆的通过。
1) sempty: 区域内没有车辆,
2) senter: 一辆车出现在区域的开始但并不完全在里面,
3) sinside: 一辆车完全位于区域内中心,
4) sexit: 一辆车仍部分出现在区域内,但正在离开。
图3示出了关于状态如何在彼此之间转换以捕捉车辆在特定方向上的通过的学习模型。这个状态机扩展了[1],类似于跟踪的运动模型。请注意,当假设一次最多有一辆车出现在选定的感兴趣区域时,允许出现空状态,并提供一种方法,系统地将车辆初始化和删除与车辆跟踪合并在同一模型中。
A. 模型开发:跟踪器状态空间的量化
Kalman滤波器是一种在目标轨迹中滤除噪声的常用方法[9,p.380]。 该技术利用连续线性运动模型,使用与单个车辆位置相对应的连续观测空间对车辆通过进行建模。
271
...
st
st 1
...
空
进入
离开
内部
图4。一个描述区域内车辆和探测器观测进展的隐马尔可夫模型过程:t是当前时间,stisin;{sempty,senter,sinside,sexit},ytare观测,boxiisin;{0,1}。箭头表示统计相关性,因此st 1仅依赖于st(马尔可夫假设),yt仅依赖于林分yt 1仅依赖于st 1。
图3。在视频中描述车辆通过一个区域的状态机。这些转变如第V-B4节所述。
跃迁类似于跟踪器运动模型,发射类似于噪声检测。
B. 观察结果
用于跟踪算法的车辆观察输入以多种方式生成,包括背景减法[7]和目标检测[4]。这些位于连续空间中的观测结果可能是有噪声的。给定图3中的粗略状态模型,连续观测空间过大。与连续空间中的观测值不同,沿区域的“盒子”被用作离散的测量点(图1)。在这项工作中,使用了三个测量盒,分别表示box1、box2和box3。测量值是经过训练的分类器的二元结果[3]-它们要么包含一个候选车辆,要么不包含。这些测量值可能由于虚假检测而产生噪声,并且与跟踪器观测噪声类似。
如果这些区域足够小,两辆车同时出现的可能性就不大了。但是,它们必须足够扩展到三个框,才能清楚地看到从第一个框到中间一个框再到最后一个框的激活趋势。
如果车辆通过一个区域并进行完美的检测,则可能出现以下状态和观察顺序:
隐马尔可夫模型由状态转移矩阵和发射矩阵完全指定。这些值可以根据实际数据进行训练或估计[10]。
D. 改进的Viterbi算法车辆计数
Viterbi算法[14]通常仅用于估计给定观测值的隐藏真实状态序列。在[15]的基础上,我们使用一种改进的Viterbi算法直接从盒子观测值估计车辆数量。
在给定观测序列的情况下,Viterbi算法采用动态规划来估计最可能状态序列。这是一个离散的类比多假设跟踪,但有一个可处理的递归定义[11],[14]。算法定义了标准的递归概率,[14]
现在,可以使用计数增量tau;(即从semptyto senter的转换)找到车辆计数C*,
C. 基于隐马尔可夫模型的状态估计
如图3所示,可以学习跃迁概率,并且每个状态具有
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[238332],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。