英语原文共 14 页
视图不变的车辆类型识别和多功能计数系统
摘要:本文提出了一种视图不变、可用于实时道路交通和环境污染管理系统的自动车型识别、分类和计数系统。采用支持向量机(SVM)分类器将车辆分为四类;汽车、吉普车、公共汽车和卡车,分别基于可测量的图像特征。对一组由区域、方向梯度直方图(HOG)和局部二值模式(LBP)直方图组成的特征集进行图像分析,提出了一种特征组合识别方法;区域,LBP和HOG。利用相关特征选择(CFS)从上述特征集中选择最具鉴别性的特征,提高识别精度,减少分类所需时间。在这两个独立的数据集上进行的实验报告了不同的成功率,组合数据集的平均准确率达到95%。与区域、HOG、LBP相比,提出的特征组合技术具有更高的识别精度。实验中分别使用了前后视图和角度视图数据集,验证了该算法对视角变化的适应性。初步提出了三种可从该技术中获益的实际应用场景:出入管制、收费和估计交通车辆所引致的空气污染水平,以及证明该研究的实际可操作的重要性和相关性。
关键词:区域描述符;局部二进制模式;面向梯度直方图;机器学习;智能交通系统;车辆类型识别
1. 简介
在过去的这段时间里,与车辆直接相关的犯罪的担忧在国际上有所上升。根据国际刑警组织关于车辆犯罪的报告,如下:
hellip;一个具有高度组织的犯罪活动,将会影响到整个世界的所有地区,且这些犯罪活动与犯罪和组织恐怖主义有明显关系。他们偷盗车辆不仅是为了自己的利益,而且还会被贩运来资助其他犯罪,甚至还将这些车辆用来运输炸弹甚至作为汽车炸弹,或者从事其他犯罪活动hellip;.
为此目的,在许多情况下需要自动监测车辆的出入情况,以便管理和控制车辆进出安全地点、高速公路和跨越国际边界的行动。虽然车牌识别可根据所收集的牌照资料提供一定程度的信息收集,但在车辆克隆盛行的年代,任何额外的车辆识别数据,都有助提高对这类非法活动的警惕性。识别车辆类型并记录每种类型通过某些已知位置的次数将有助于这一过程。
此外,修建和维护高速公路的成本增加,迫使许多政府考虑将高速公路私有化,从而需要向用户收取通行费。目前,国际上收费公路的数量正在迅速增长,避免支付正确收费的犯罪率也在快速增长。通行费通常是根据车辆类型收取的,而使用的不同收费标准意味着,当没有人在场时,系统可能会被这些本该收取较高费用的车辆所欺骗,当这些车辆从低费用的收费窗口开过的时候。车辆类型的自动识别将有助于采取预防措施制止这类犯罪。
近年来,道路交通的车辆呈指数增长引起了人们对车辆交通污染程度的高度关注。特别是认为臭氧空洞是由内燃机直接产生的氮化物及副产物对臭氧层产生影响形成的。汽车发动机的功率越大,对臭氧层污染就越大,其他二次污染物的影响也越大。每小时或每日计算高公路的各类车辆数目,有助于估计车辆排放及形成的空气污染物。只要检测车辆并跟踪它们,就可以监测道路的总使用量,并估计它们的速度,这也对估计污染等级有一定的作用。
上述需求要求设计、开发、实现和安装基于计算机视觉的车辆自动计数和类型识别系统的重要性,这也是本文研究的重点。
2. 研究背景
新的算法将在下一节中给出,如图1所示,它基于一些已建立的理论和数学概念。本节为高斯混合模型(GMM)、Canny边缘检测(CED)、局部二值模式(LBP)、方向梯度直方图(HOG)、相关特征选择(CFS)和支持向量机(SVM)提供了理论基础。所提出的方法的基础是建立在这些概念、理论和数学定义之上的。
2.1 高斯混合模型(GMM)
根据[13],GMM是一个参数概率密度函数,表示为高斯分布的加权和。GMM技术采用一种混合k高斯分布的方法对每个背景像素进行建模,混合的权重表示像素值停留的时间比例。场景不变,背景颜色停留的时间更长,可能比前景颜色更静态。
在[13]中,每个像素的最近历史,X1hellip; Xt,是由K高斯分布的混合模型。定义了观察当前像素值的概率为:
其中K是高斯分布的一个数, omega;i, t是在t时刻的高斯混合函数的一个权重的估计(由高斯函数解释的一个数据)。micro;i,t 是高斯函数再t时刻的均值,sum;i,t是高斯混合函数再t时刻的协方差矩阵,eta;是高斯概率密度函数的表示,
2.2 准确的边缘检测
根据[15],边缘检测器是一种对图像灰度变化敏感的算子。检测这些强度变化可以用一阶或二阶导数来完成。在图像中去发现边缘强度和方向位置(x, y) ,利用梯度nabla;I来完成,它指向位置(x, y)处I的最大变化率的方向,用向量定义如下:
上式具有一个重要的的几何性质,即指向方向变化率最大的地方I (x, y)处,也即是相对于x方向上y变化最快的地方。
Canny算法为边缘检测器定义了一组目标,并描述了实现这些目标的最优方法,目标是:
bull;错误率:探测器应该只对边缘做出响应,而不遗漏任何边缘。
bull;本地化:找到的像素与实际边缘之间的距离应该尽可能小。
bull;响应: 不应该识别只有一条边存在的多条边。
Canny算法假定在高斯白噪声的作用下,做出了台阶边缘的检测。该边缘检测器假设为一个联合滤波器f,可以平滑噪声并定位边缘。假设边缘检测器是一个卷积滤波器f,它可以平滑噪声并定位边缘。为了捕获车辆类型中的轮廓,我们将CED应用于车辆对象,以便能够随后基于边缘对形状信息进行编码。
2.3 局部二值模式(LBP)
本地二进制模式(LBP)运算符标记,具有十进制数字的图像的像素,图像的每个像素周围的局部结构。通过减去中心像素值,将每个像素(即g1、g2、···、g8)与其八个相邻像素进行比较;结果如果为负,则编码为0,否则编码为1。对于每个给定像素,将所有这些二进制值按顺时针方向连接起来,得到一个二进制数,该二进制数从其左上相邻的开始,然后使用生成的二进制数所对应的十进制值对给定像素进行标记。
2.4 方向梯度直方图(HOG)
根据[18],HOG可以描述为:通过局部强度梯度或边缘方向的分布可以很好地表征物体的局部外观和形状的概念。它通常是通过将一个图像窗口分割成小区域(称为单元格),并在像素上累积每个局部单元格的梯度方向或边缘方向的1 - D直方图来实现的。组合的条目形成了这种表示形式,它对对比度进行了标准化,以确保光照的不变性。这种规范化扩展到块中的所有单元格,以形成HOG描述符。Dalal和Triggs探索了不同的块规范化方法。Dalal和Triggs在他们的实验中发现,L2 - Hys、L2 - norm和L1 - sqrt方案提供了类似的性能,而L1 - norm提供了稍微不那么可靠的性能,然而,这四种方法都比非规范化数据有显著的改善。
2.5 基于关系的特性选择(CFS)
CFS是一种基于类标签的单个特征预测能力来评估子集特征的滤波算法。在 [20]CFS中,报告为:
其中k为当前子集中选择的特征个数,rcf为当前子集中每个元素的平均特征类相关值,rff为每对元素的平均特征--特征相关。它以空集开始,每次添加一个具有最佳价值的特性,采用最优优先搜索法获得价值。
2.6 支持向量机
根据[21],SVM是一种训练分类器、回归器和概率密度的技术,这种技术在统计学习理论中是有根据的。SVM可用于二值和多分类任务。
2.6.1 二元分类
SVM通过确定距离训练集来确定最近点的距离,对两类问题进行模式识别。该方法通过最大化两类之间的边界宽度,实现可分离两类问题的最优分类。边缘是在n维特征空间中识别超曲面与最近的训练模式,支持向量之间的距离。如果数据没有输入空间线性可分的,一个非线性变换可以应用,数据点xisin;R映射到高维空间H ,这被称为特征空间。然后按照上面的描述将数据分离。原始支持向量机分类设计用于两类线性分离,但是,为了解决多类支持向量机的分离问题,则需要多类向量机开发。
2.6.2 多级分来
SVM是为解决二值分类问题而设计的。然而,在实际的分类问题中,我们可以有两个甚至两个以上的类。在尝试用支持向量机解决qclass的问题,其中涉及到培训q支持向量机,每个支持向量机从所有剩余的类中分离出一个类,或者培训q2机器,每个支持向量机分离出两个类。多类分类允许通过组合多个2 类分类器来实现非线性分类,N类分类是通过组合N2分类器来实现的,每个分类器都区分特定的类和训练集的其余部分。在分类阶段,对于N个二元分类器,将一个模式分配给分类模式与单个分离超平面之间正距离最大的类。在这种多类的二进制分类问题中,有两个类中的一个将包含比另一个类少得多的模式。
在支持本文研究的实验中,使用了支持向量机实现的研究,使用了CS模型类型、高斯RBF核和均值正态化参数。
之所以选择SVM分类器是由于其受欢迎的程度和处理速度。
3. 研究方法
本节向读者介绍了所提的方法—理论,详细介绍了所提出的车辆类型识别系统在三个主要主题下的每个模块每个阶段的功能:车辆目标分割;特征提取;车辆目标分类。图1是该理论的系统框图。
所提出的车辆类型识别系统的性能分析是在从两个低分辨率摄像机收集的数据集上进行的,摄像机安装在阿曼苏哈尔高速公路的路边,他们的像素分辨率为320*240,帧速率为25FPS,实验分析中使用的数据是在白天拍摄的10个小时视频片段。
3.1。车辆对象分割
首先使用基于GMM的前景(背景)相减算法对视频帧进行分割,用该算法对运动对象进行检测。由于在高速公路环境中拍摄视频时的镜头是固定不动的,可以假设上述算法获取的所有前景对象都是移动的车辆,分割后的车辆目标区域需要进一步处理,以确保分割后的区域更合适地代表车辆的真实形状。为此,首先利用Canny边缘检测器对分割对象的边缘进行估计,然后利用形态学算子对分割区域进行细化,包括圆盘结构、bwareaopen、膨胀和填充。实验结果如图2所示,验证了各算子在改进分割后的车辆目标形状方面的贡献。
图2:图中分别显示了原始车辆、边缘去除后、多余边缘去除后、膨胀填充后的情况
在提取前景车辆物体之后,将它们放置在最精密结合的方形区域内(ROI),随后将这些方形区域的尺寸调整为100*100像素的标准化尺寸,以便后续对这一区域进行进一步的处理。
3.2 特征提取
对分割后的前景对象周围的方形窗口(归一化为100times;100像素区域)进行特征提取,将方形区域内的背景像素设置为零。首先,为了训练我们的目标,我们从记录的视频镜头帧中手动提取标准化为100*100像素大小的车辆图像样本。图3和图4展示了分割前景对象的一些示例。
出于测试的目的,按照2.1节中描述的过程自动分割感兴趣区域,注意,一旦分割的前景区域被提取出来,它首先被包围在一个最紧密的方形区域内,该区域然后被归一化为100times;100像素的大小,但在方形区域内但目标感兴趣区域(ROI)之外的像素会被设置为零。在上述100times;100平方区域的算得到特征值。一下部分描述了提取特征的过程。
我们建议使用17个简单的标量区域描述符作为特征,以及面向直方图的梯度(HOG)和局部二进制模式(LBP)直方图特征。具体如下:
3.2.1 区域描述符/功能
我们建议初步使用17个区域特征,定义如下:
1.面积:在正方形区域内包含在感兴趣区域中的总像素数和:。
2.质心:计算质心的水平坐标和垂直坐标作为质心的两个特征。
3.包围框:包含感兴趣区域的最小矩形。包围框特征形式为[x, y,width] ,其中,x, y指定边界框的左上角,width的形式为[xwidth ywidthhellip;],并指定沿每个维度边界框的长度。
4.偏心距:偏心距特性为最大弦长A与最大弦长B之比,且垂直于矩形内的感兴趣区域。
5.主轴长度:椭圆长轴的长度(以像素为单位),并具有与感兴趣区域相同的第二力矩。
6.副轴长度:椭圆短轴的长度(以像素为单位),并具有与感兴趣区域相同的第二力矩。
7.方向:x轴和椭圆长轴之间的角度(以度为单位),其具有与感兴趣区域相同的第二力矩。
8.填充区域:填充图像中的像素数。其中,填充图像是与感兴趣区域的边界框大小相同的二进制图像。
9.凸区域:感兴趣区域的凸包的像素数,其中填充了凸包内的所有像素。
10.等直径:具有与感兴趣区域相同面积的圆的直径。
11.可靠性:在感兴趣区域内的凸包中像素的比例,计算为面积/凸面积。
12.范围:边界框中的像素在感兴趣区域中的比例, 计算为面积除以边界的面积 。
13.周长:周长是感兴趣的对象区域边界的长度,以像素为单位。
请注意,由于质心的水平和垂直坐标被计算为两个单独的质心特征,而边界框特征包括四个分量特征,即左上角的x和y坐标以及边界框的宽度和高度, 共有17个区域特征将被考虑。
3.2.2 HOG的特性
HOG特征提取如第2.4节所定义,因此计算长度为144的HOG特征:
其中y为二元向量[2 2];k为Bins:9;z为双元向量[32 32](单元格大小),I为100times;100(图像大小); ol为[1, 1]( y/2 -块重叠)。
3.2.3 LBP的特性
从包含在100times;100矩形区域内的每张图像中提取LBP直方图特征,得到256 bins直方图的区域。
3.2.4 功能组合
为了识别、分类和计数车辆类型,我们使用了捕捉外观和形状信息的功能集;在此过程中,从分割的前景对象中提取上述区域特征、HOG特征和LBP直方图特征,并将这些特征结合起来形成一个特征属性,分别将车辆分为汽车、公交车、吉普车和卡车四类。将提取的区域(17)、HOG(144)和LBP直方图(256)特征结合起来进行实验。
3.3。
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。