英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
视频监控中目标跟踪的图像处理技术综述
Shipra Ojha, M.E. Student, Department of Computer Engineering, Vishwakarma Institute of Information Technology, Kondhwa (Bk.), Pune 411048, India, E-mail: shipraojha4@gmail.com
Sachin Sakhare, Department of Computer Engineering, Vishwakarma Institute of Information Technology, Kondhwa (Bk.), Pune 411048, India, E-mail: sakharesachin7@gmail.com
摘要
视频监控中的目标跟踪技术吸引了众多研究者的兴趣,这是图像处理领域的一个重要应用和新兴研究领域。视频跟踪是指使用摄像机在一段时间内对运动物体或多个物体进行定位的过程。由于视频监控的主要特点,它具有人机交互、安全监控、视频通信、交通控制、机场、地下站、群众活动等公共场所的多种用途,在杂乱的前提下跟踪目标仍然是视频监控中极具挑战性的问题之一。运动目标的连续检测、分类、跟踪识别行为完成了视频监控的处理框架。本文对跟踪方法进行了深入的研究,将其分为不同的类型,重点介绍了重要的、有用的跟踪方法。在本文中,我们简要介绍了基于区域的、基于活动轮廓的跟踪策略,包括它们的正和负的两方面。详细描述了不同的跟踪方法。我们回顾了文献调查中关于不同技术的一般策略,最后陈述了可能的研究方向分析。
关键词:运动分割,目标检测,目标表示,目标跟踪,视频监控
1 引言
图像处理是一种以图像为输入的处理方式,如图像或视频帧,输出可以是与图像相关的特征或参数。计算机视觉是一个包含图像组成、图像分析和可视化方法的领域。监视是监视行为、活动和其他变化的信息,通常是为了影响、指导和保护人们的信息。利用摄像机进行运动目标定位的过程是视频跟踪。简单地说,跟踪意味着在连续视频帧中关联目标对象。遇到困难时,尤其是当对象移动速度比帧速率快,或者当跟踪对象随时间改变方向时。目标检测、目标跟踪、目标识别及其行为的顺序流完成跟踪的过程框架。
智能犯罪系统、恐怖分子的袭击和日益增加的安全问题已经震惊了全球每个国家。手工分析过程有着数量限制,例如成本高,容易出错,劳动密集,人力资源有限,有时人力资源无法监测连续信号[ 1 ]。由于时间的关系,资源危机,刑事攻击技术的进步,提供全天候监控非常困难,造成爆震的智能视频监控系统的机会。这一切的结果,在视频监控市场中敲开了新的大门。国际足联2014世界杯和2016奥运会在巴西占领了最大的视频跟踪市场。根据到研究,巴西的视频监控市场预计2016年底达到3亿6269万美元。人脸识别技术在2001“超级碗”执法监控中得到有效应用。2001年1月,面对超过100000球迷进入球场在坦帕,佛罗里达州看“超级碗”,被当地视频摄像机执法记录。这些面部图像然后通过电子计算机数据库进行电子检查。据Marcus Nieto [ 2 ]说,在加利福尼亚,许多地方公共机构部署闭路电视监控系统,主要功能是保护财产,而不是监视公共活动。在云视频监控报告2014,Dean Drako [ 3 ]提到,除了安全问题,视频监控的重要目标是在两年内改进操作。此外,云管理的视频监控系统的主要优点是非现场冗余和灵活的存储容量。根据轴通信[ 4 ],基于IP的视频系统的使用对安全以外的许多方面都产生了相当大的影响。大部分使用相同系统的零售商已经看到了积极影响业务和销售。
视频监控中的目标跟踪是计算机视觉和模式识别的一个重要方面。分类的一般结构由三个主要步骤组成:运动分割、目标跟踪和分类。卡尔曼滤波器是一种预估,它根据测量随时间的变化来预估。卡尔曼滤波在控制、导航、计算机视觉等方面有着广泛的应用。卡尔曼滤波的主要特点是预测目标的未来位置、降低噪声、跟踪单个和多个目标。在其中[ 5 ],卡尔曼滤波器实现了在令人困惑的情况下对多个运动目标的有效跟踪。粒子滤波可以应用于任何状态空间模型,也简化了传统的卡尔曼滤波方法[ 6 ]。综述了最优次优贝叶斯算法,重点研究了粒子滤波算法。随着粒子滤波,其他形式如SIR,ASIR和RPF也会被介绍。A Mittal和L Davis [ 7 ]提出了一个完全自动化的多摄像头跟踪方法,采用基于区域的匹配算法,能够处理完全和部分遮挡物体造成的密集位置。在2009年,J Ge、Y Luo和G Tei [ 8 ]介绍了夜视从移动车辆实时行人检测和跟踪。一个系统由三个模块级联而成:ROI生成,目标分类和跟踪,每一个都利用视觉特征来区分物体和杂乱的背景。单一特征提取器不能处理多个图像场景的组合的特点已经被察觉到。为了克服这一点,我们提出了集成方法[ 9 ]来创建协同解决办法来补偿组件分类器的个体无能。在后面的章节中,我们将讨论多种对象的跟踪方法。
论文的结构如下。第二节和第三节重点讨论对象表示和特征描述。第四节,介绍了运动分割。这里详细分析了不同方法的积极方面和消极方面。不同类型的对象分类,跟踪分类到不同的组,详细分析了后面章节中提到的相关工作。最后,我们验证了性能,定义了问题域,并提出了我们的方法和结论。
2 对象表示
物体是我们必须跟踪的实体,如鸟类、森林或动物园里的动物、飞机、交通控制车辆、低速行走的人。对象可以用它们的形状和大小来表示。图1为对象[ 10 ]的表示方式。
- 点
一个对象可以被描述为一组点,占用小的中心区域,用于小区域跟踪目标。对象也可以表示为单个点,称为一个人的质心。
- 几何图形
最适合于简单的刚性物体。物体的形状可以表示为矩形或椭圆形,也可用于非刚体目标跟踪。
- 物体的轮廓
等高线内的区域代表物体的轮廓。等高线表示物体的边界。等高线和轮廓都用于复杂的非刚性形状跟踪。
- 骨骼模型
用于建模关节和刚性物体的对象骨架。它可以通过中轴变换提取物体轮廓。中轴代表边界的距离。一个区域r中的每个点p都在边界处找到最近的点,其点属于该区域的中轴。它用于铰接和刚性物体的建模目的。
图1 对象表示[ 10 ](a)质心,(b)多个点,(c)矩形贴片,(d)椭圆贴片,(e)基于部分的多个补丁,(f)对象骨架,(g)完整对象轮廓,(h)对象上的控制点轮廓,(i)物体轮廓
采用形状表示与对象的外观特征相结合进行跟踪。下面列出了常用的外观特征:
- 概率密度外观模型
该模型用于高斯混合模型和直方图。从图像区域可以计算出图像的概率密度,如颜色、纹理等。
- 多视图对象识别
这种方法用一系列视图来建模对象;每个视图都包含关于观察条件的小范围的信息。表示可以在两个过程中完成:一个是将样本图像聚类成代表对象不同视图的组。二是群体成员普遍形成模型视图的特点。
- 模板
几何形状表示一个模板,它包含空间和外观信息。它主要用于目标跟踪。
3 特征描述
在图像处理中,一个简单的特性是:一个信息,用于与特定应用程序相关的计算任务进行排序,其特征可能是与图像边缘、点、物体、纹理等相关的特定结构。在复杂的场景中,有时只有一种特征不能提供足够的图像数据信息,从而导致两个或多个特征被提取。大多数彩色目标跟踪算法都使用目标的HSI颜色,对闪电变化具有很强的鲁棒性。在使用RGB特征时,颜色特征向量的分类精度较好,但这些特征对闪电变化敏感。尺度不变特征变换(SIFT)用于提取局部特征描述因子。SIFT是鲁棒的局部不变特征描述因子,主要用于灰度图像[ 11 ]。边缘特征被发现相比颜色描述对光照变化更不敏感。以额外的计算时间和处理步骤为代价,也可以使用纹理特征。存在多种特征描述因子,如生物特征、光流等特征用于区分前景对象和背景对象[ 12 ]。
- 颜色
在图像处理中,RGB(红色、绿色和蓝色)的颜色特征空间被用来表示颜色。RGB空间[ 13 ]采用基于粒子滤波的颜色和轮廓特征相结合的目标跟踪。颜色受两个物理因素的影响,即光谱功率分布和表面反射特性。色度、饱和度(明度)和明度(亮度)(HSV)是HSV空间的三个组成部分,也是均匀的颜色空间之一,但它对噪声很敏感[ 14 ]。
- 边缘
边缘检测用于识别图像强度的变化。与颜色特征相比,边缘对光照变化不敏感[ 10 ]。必须指出[ 15 ]的是它是以三维模型为基础,以边缘点为特征选择的算法。为了跟踪对象边界,使用了边缘特征。
- 纹理
它用于图像的表面变化和分割,具有平滑性和规律性等特点。图像纹理提供颜色空间排列的信息。分为基于区域的和基于边界的两种情况使用。局部二值模式(LBP)纹理是著名的灰度图像模式分析[ 16 ]。一些基于跟踪的算法如凸轮移位是基于LBP纹理的运动目标跟踪[ 17 ]。
- 矩阵
基于矩阵的区域特征用于物体识别,通过外貌判断陌生人的性别。
4 运动分割
物体检测是一种计算机视觉技术,它用于识别物体,例如人、汽车、动物或鸟类等移动物体的实例。目标检测是目标跟踪的初始步骤之一。目标检测技术包括人脸检测和行人检测。在计算机视觉中,目标识别就是识别目标主机。识别是通过结合对象的特性和对象的模型来获得的。对象识别的复杂性取决于场景恒常性、图像中对象的数目和如图2所示的遮挡可能性等几个因素。
静止摄像机的视频监视系统通常包括运动检测的一部分。本文介绍了几种运动分割方法:
- 背景差分法
背景差分法是一种广泛使用的静态摄像机运动目标检测方法。可以通过查找当前帧和背景帧之间的差异来检测对象。背景建模可以分为两类,非递归和递归技术。背景估计递归技术包括帧差分、中值滤波、线性预测滤波和非参数模型。递归技术基于中值滤波、卡尔曼滤波和高斯混合。
图2 部分闭塞的人
Halevi和Weinshall [ 18 ]提出了一种基于干扰图的线性快速算法,从新框架通过减去前一帧的时间平均得出。使用稳定和移动摄像机提供跟踪结果。在1999年 [ 19 ]提出了解决各种空间尺度问题的算法,在像素、区域和帧两个层次上对图像进行了处理。Heikkila和Silven [ 20 ]描述了基于摄像头的自动系统中基于Kalman滤波的跟踪和学习矢量量化(LVQ)的用去区分行人和骑自行车的方法。在2003 年[ 21 ],一项研究继续在监视系统中的自动跟踪和入侵者探测领域进行。跟踪系统包括背景生成和差分方法,可以通过使用PTZ摄像机来受全局强度变化的影响。当摄像机视图更改需要更新预定义图像以检测对象时,创建新区域。H galoogahi [ 22 ]提出了处理该事件如对象合并和拆分使用向前和向后匹配方法。主要通过跟踪一些事件,如输入、合并、分割、离开和对应的对象集合来跟踪一个组,RGB直方图用于不间断跟踪过程。背景建模是背景差分的核心,均值滤波和中值滤波是最常用的背景建模识别方法。R Zhang和J Ding[ 23 ]利用中值滤波实现视频背景图像,采用自适应背景差分法对运动目标进行检测和跟踪。采用形态滤波法[ 24 ]去除背景噪声,产生明朗清晰的图像,在轮廓投影分析中结合形状分析去除物体的阴影。在2013年的论文[ 25 ]中,对实时安全系统中的人体运动检测与跟踪进行了研究。
- 时间差分法
基于帧差法的时间差分法。该方法利用视频序列中连续帧间的差分来检测运动区域。这对动态环境和计算上的经济性非常适合,但通常在提取某些类型的移动对象的完整形状方面做得很差。它也可能导致运动物体出现小孔,在使用时间差分法时,在[ 26 ]中提到了分辨率。
- 光流法
光流是一种基于向量的方法,它通过在多个帧上匹配物体上的点来估计视频中的运动。这是一个描述图像发展过程中像素速度的向量场。在[ 27 ]中,利用光流,提出了一种在移动机器人环境中通过在图像序列中从底层分离出障碍物的方法。用于检测视频图像中任意可能运动像素的光流算法。在[ 28 ]中提出了基于光流场和自适应阈值分割的运动目标区域精确检测算法。
5 对象分类
分类的过程是一个对象,模式,图像区域像素等的单项工程,基于项目和集团的描述之间的相似性。在一般情况下,在视频监控对象的分类,它们基于形状、运动、颜色和纹理进行分类。
- 基于形状的分类
基于形状的分类只适用于几何形状的对象,而不适用于结构分析。根据所提取的区域的几何形状,如包含运动的盒子、斑点等对象可以被分类。[ 29 ]探索各种形状特征的准确性和性能测量研究。T Zhao和R Nevatia [ 30 ]提出了一种除了使用相机模型外,使用人体形状模型的方法来跟踪在拥挤的场景中闭塞的人。贝叶斯框架和均值漂移跟踪与形状模型的扩展的结合,提出
全文共16215字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[15737],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。