英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料
改进的自适应混合高斯模型的背景差法
佐兰·日夫科维奇
智能自治系统组
荷兰阿姆斯特丹大学
摘要
背景减法是一种常见的计算机视觉任务。我们分析了通常的像素级的方法。我们开发了一个高效的自适应算法,利用高斯混合概率密度。递归方程用于不断更新的参数,而且还同时选择适当数量的组件为每个像素。
- 简介
观察场景的静态摄像机是监视系统的常见情况。检测入侵对象是分析场景的关键步骤。通常适用的假设是,没有入侵对象的场景的图像表现出一些规律性的行为,可以很好地描述由一个统计模型。如果我们有一个统计模型的场景,入侵对象可以检测到的图像不适合模型的部分检测。这个过程通常被称为“背景减法”。
一个常见的自底向上的方法和场景模型的概率密度函数为每个像素分离地。一个新的图像的像素被认为是一个背景像素,如果其新的值是很好的描述其密度函数。对于静态场景,最简单的模型可能只是场景的一个图像,而没有入侵对象。下一步将是例如从图像中的像素强度水平的方差估计适当的值,因为方差可以从像素到像素变化。这个单一的高斯模型中使用[ 1 ]。然而,像素值往往有复杂的分布和更复杂的模型是必要的。高斯混合模型(GMM)提出了背景减法[ 2 ]。更新GMM的最常用的方法之一,提出[ 3 ],并进一步阐述[ 10 ]。这些gmm-s使用固定数量的混合组件。我们在座的改进算法OD最近的结果[ 12 ]。不仅参数,但也的混合物的组件的数目是不断适应每个像素。通过选择在一个上线的过程中的每个像素的组件的数目,该算法可以自动完全适应场景。
本文的结构如下:下一节我们列出了一些相关工作。3节回顾了从[ 3 ]的GMM方法。在第4节中,我们提出了如何可以选择的组件的数量上线,并改进算法。在第5节中,我们提出了一些实验。
2. 相关的工作
在RGB或其他色彩的时间T的像素值表示的~ x(t). 基于像素的背景减法涉及的决定,如果像素属于背景(BG)或一些前景对象(FG)。贝叶斯决策是由:
R =p(BG|~ x(t)) p(FG|~ x(t))=p(~ x(t)|BG)p(BG) p(~ x(t)|FG)p(FG)(1)
从背景减法的结果通常传播到一些更高级别的模块,例如经常检测到的检测对象。跟踪对象,我们可以得到一些知识的跟踪对象的外观,这方面的知识可以用来改善背景减法。这是讨论,例如在[ 7 ]和[ 8 ]。在一般情况下,我们不知道任何可以看到的前景对象,也不知道它们将在何时何地出现。因此,我们集P(FG)= P(BG)和承担的前景物体外观P均匀分布(~ x(t)| FG)= CFG。然后,我们决定,该像素属于背景,如果
p(~ x(t)|BG) gt; cthr(= RcFG),(2)
在cthr是阈值。我们将P(~ X | BG)作为背景模型。背景模型估计从训练集表示为x。估计的模型是由circ;P表示(~ X | X,BG)和依赖于训练集表示明确。我们假设样本是独立的,主要的问题是如何有效地fi估计密度函数和适应可能的变化。内核为基础的密度估计中使用[ 4 ],我们在座的改进GMM从[ 3 ]。在文献中,有模型考虑的图像序列的时间方面,决定也取决于以前的像素值从序列。例如,在[ 5,11 ]的像素值分布随着时间的推移被建模为自回归过程。在[ 6 ] Hidden Markov模型使用。然而,这些方法通常是慢得多,适应场景的变化是困难的。
另一个相关的主题是阴影检测。侵入对象可以在背景上投射阴影。通常,我们只对对象感兴趣,应该检测到对应于阴影的像素[ 9 ]。本文我们分析只有基本的基于像素的背景减法。对于各种应用程序中提到的一些额外的方面,也许一些后处理步骤可能是重要的,可能会导致改善,但这是本文的范围。
三.混合高斯模型。
在实践中,在场景中的照明可以逐渐改变(白天或在室外场景的天气条件)或突然(在室内场景切换光)。一个新的对象可以被带到场景或从它移除的当前对象。为了适应变化,我们可以更新加入新的样品和丢弃旧的训练。我们选择一个合理的时间周期T和t时刻我们XT = { x(t),hellip;,x(tminus;T)}。每一个新的样本,我们更新的训练数据集的XT和重构P(~ X | XT,BG)。然而,从最近的历史中可能会有一些价值观属于前景物体和我们应该表示这个估计P(~ x(t)| XT,BG FG)。我们使用GMM与M组件:
p(~ x|XT,BG FG) =M X m=1circ; pi;mN(~ x;b ~ micro;m,b sigma;2 mI) (3)
其中B ~micro;1,hellip;,B ~micro;M估计的手段和Bsigma;1,hellip;,Bsigma;m是所描述的高斯分量的方差的估计。协方差矩阵被假定为对角线和身份矩阵,我有适当的尺寸。混合权重的circ;pi;M表示的是非负的,总计达一。给定一个新的数据样本x(t)在时间t的递归更新方程[ 12 ]:
pi;m larr; circ; pi;m alpha;(o(t) m minus; circ; pi;m) (4) b ~ micro;m larr;b ~ micro;m o(t) m (alpha;/circ; pi;m)~ delta;m (5) b sigma;2 m larr;b sigma;2 m o(t) m (alpha;/circ; pi;m)(~ delta;T m ~ delta;m minus;b sigma;2 m), (6) 在~delta;M = ~ x(t)minus;B ~micro;M.代替时间间隔T,上面提到的,这里介绍一个指数衰减常数alpha;信封是用来限制在fl旧数据的影响。我们保持相同的符号记,约alpha;= 1 / T的一个新样本的所有权O(T)m设置为1为“关闭”最大的一部分circ;pi;M和其他被设置为零。我们fiNE,样本是“关闭”的一个组成部分,如果从组件的马氏距离为例,标准偏差小于三。从m个分量的平方距离的计算公式为:D2 M(~ x(t))= ~delta;T M ~delta;米/circ;sigma;2米。如果没有“关闭”成分的新成分生成circ;pi;M 1 =alpha;,B ~micro;M 1 = ~ X(T)和circ;sigma;M 1 = 0,0sigma;sigma;一定初始方差。如果元件数达到最大,我们丢弃的最小circ;pi;M.组件。该算法提出了一种在线聚类算法。通常,入侵的前景对象将由小重量circ;pi;M.因此一些额外的集群为代表,我们可以通过第一个 B最大的集群近似背景模型:
p(~ x|XT,BG) sim;B X m=1circ; pi;mN(~ x;b ~ micro;m,sigma;2 mI) (7)
如果组件整理有降权重circ;pi;M我们:
B = argmin b b X m=1circ; pi;m gt; (1 minus; cf)! (8)
在CF的一个措施,可以属于前景物体没有影响fl背景模型的数据的最大部分。例如,如果一个新的对象进入现场,保持静止一段时间它可能会产生一个额外的稳定的集群。由于旧的背景被遮挡的重量pi;B 1的新的集群将不断增加。如果对象仍然是静态的足够长的时间,它的重量变得大于CF和可以认为是背景的一部分。如果我们看一看(4)我们可以得出这样的结论:对象应静约日志(1minus;CF)/日志(1minus;alpha;)框架。例如CF = 0.1和alpha;= 0.001,我们得到105帧。
4。选择组件的数量
重量pi;M描述了多少的数据属于GMM的m个分量。它可以被视为一个样本来自m个分量和这样的pi;M-S 定义潜在的多项分布的概率。让我们假设,我们有T的数据样本,其中每个属于GMM的一个组成部分。让我们假定,属于m组样本数为nm =Pt i=1 o(i) m我的是定义在o(i) m -s前面的部分。假定多项分布的似然函数的纳米功能提供质量M = M = 1pi;nm。混合约束的重量是两个和两个一起来。我们考虑到这lambda;通过引入拉格朗日乘子。最大似然(ML)估计如下:part;part;circ;pi;mlogl lambda;(M P M = 1circ;pi;Mminus;1)= 0。后摆脱lambda;得到
pi;(t) m =nm t=1 tt X i=1o(i) m . (9)
从样品我们记为circ;pi;估计(T)和可重写递归的形式作为一个估计circ;pi;功能(Tminus;1)M Tminus;1样品和所有权O(T)m的最后一个样本:
circ; pi;(t) m = circ; pi;(tminus;1) m 1/t(o(t) m minus; circ; pi;(tminus;1) m ). (10)
如果我们现在fixfi兴1 / Tfl影响新的样本来alpha;= 1 / T得到更新方程(4)这混合的新样品的影响,我们更多地依靠新的样品和从旧样本的贡献是在下一个指数衰减加权方式之前提到的。多项分布的先验知识,可以通过它的共轭先验介绍,之前P = QM M = 1pi;厘米米狄。fi系数系数厘米有一个有意义的解释。对于多项式分布,CM提出的先验证据(在最大后验概率(MAP)感)的类m -属于该类先验的样本数。在[ 12 ]利用负系数fi系数厘米=minus;C.否定之前的证据意味着我们将接受,只有从对这类存在的数据足够的证据存在的类M。这种先验也是最小信息长度的标准,用于对给定的数据[ 12 ]选择适当的模型相关。包括前面提到的地图解决方案如下
part; part;circ; pi;mlogL logP lambda;( M P m=1circ; pi;m minus; 1) =0, where P =PM m=1 pi;minus;c m . We get: circ; pi;(t) m = 1 K ( t X i=1 o(i) m minus; c), (11) where K=M P m=1 (t P i=1o(t) m minus; c) = t minus; Mc. We rewrite (11)
as:
circ; pi;(t) m =circ; Pi;m minus; c/t 1 minus; Mc/t, (12)
where circ; Pi;m = 1 tt P i=1o(t) m
是ML估计(9)和从先前的偏差是通过C / T引入。较大的数据集(较大的T)的偏置减小。然而,如果一个小的偏差是可以接受的我们可以通过fi兴C / T CT = C / T与一些大型T保持恒定. 这意味着,偏差将始终是相同的,如果它本来是一个数据集与t样本。这是很容易证明的递归版本(11)与fi固定C / T = CT了:pi;(t) m = circ; pi;(tminus;1) m 1/t(
o(t) m 1 minus; McTminus; circ; pi;(tminus;1) m ) minus; 1/tcT 1 minus; McT. (13)
由于我们预期通常只有几个分量M和cT很小,我们假定1-McTasymp;1.如上所述,我们将1 / t设置为alpha;,并得到最终修改的自适应更新方程。
pi;m larr; circ; pi;m alpha;(o(t) m minus; circ; pi;m) minus; alpha;cT. (14)
使用该等式代替(4)。 在每次更新之后,我们需要对pi;m-s进行规范化,以使它们最多加1。 我们从GMM开始,一个以第一个样本为中心的组件,并且在前一段中提到的新组件。具有负数的Dirichlet优先将抑制数据不支持的组件,当其重量pi;m变为负数时,丢弃组件m。 这也确保混合重量保持非负。 对于选定的alpha;= 1 / T,我们可以要求至少c = 0.01 * T样本支持一个分量,我们得到cT = 0.01。
注意:(11)的直接递归版本由下式给出:
pi;(t)m =pi;(t-1)m (t-Mc)-1(o(t)m(〜x(t))-pi;(t-1)m)不是很有用。 我们可以从更大的价值开始,以避免对小t的负面更新,但是我们会取消之前的影响。 这激励了我们对先前的影响所做的重要选择。
5.实验
为了分析算法的性能,我们使用了三个动态场景。 手工分割序列以产生地面真相。 我们将改进的算法与原始算法[3]进行比较,其中固定数量为M = 4。对于不同的阈值(cthr(2)),我们测量了数据库的百分比,其中的像素数与正确对齐于前景的对象和误报 - 不正确的背景像素的百分比 分类为前景。图中“实验室”序列的实现特征(ROC)曲线。我们观察到分割结果略有改善。对于其他两个序列也可以注意到这一点(这里没有给出ROC曲线)。在缩短的处理时间内可以观察到很大的改进,图2。在320times;240图像的处理时间内,在2GHz的PC上测量。在图2中,我们还说明了新算法如何适应场景。灰度值表示每个像素的亮度值。黑色代表一个高斯每像素,如果最多使用4个分量,则像素为白色。例如,序列实验室具有在场景中具有滚动干涉条的监视器。来自风景的植物由于风力的变化,动态区域采用更多的组件进行建模。因此,处理时间不符合场景的复杂性。对于高度动态的“树”序列[4],处理时间最接近于原始算法[3]。引入对象引入了一段时间后删除的新组件的生成(参见“流量”序列)。这也影响了处理速度。
6.结论
我们提出了一个改进的GMM背景减法方案。 新算法可以自动选择所有的组播数据,并将其全部覆盖到观察到的视频中。处理时间减少,而且分割也略有改善。
致谢
本文中描述的工作是在欧盟综合项目COGNIRON(“认知伴侣”)内进行的,由欧盟委员会FP6-IST未来与新兴技术合同FP6-002020资助。
参考文献
[1] C. R. Wren, A. Azarbayejani, T. Darrell, and A. Pentland, “Pfinder:Real-timetrackingofthehumanbody,”IEEETrans. on PAMI, vol. 19, no. 7, pp. 780–785, 1997.
[2]N.FriedmanandS.Russell,“Imagesegmentationinvideosequences:Aprobabilisticapproach,”InProceedingsThirteenth Conf. on Uncertainty in Artificial Intelligence, 1997.
[3] C. Stauffer and W. Grimson, “Adaptive background mixture models for real-time tracking,” In Proceedings CVPR, pp. 246–252, 1999.
[4] A.Elgammal,D.Harwood,andL.S.Davis,“Non-parametric background m
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[26655],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。