英语原文共 19 页,剩余内容已隐藏,支付完成后下载完整资料
多分辨率小波框架模型亮度感应效应
摘要:本文提出了一种新的多分辨率小波模型,它在统一的框架内考虑了亮度同化和对比度效应,包括了灵长类视觉系统中已知的心理物理和生理属性(如空间频率通道、定向接收场、对比灵敏度函数、对比度非线性和统一的参数集)。与其他底层模型一样,如ODOG模型[Blakeslee,B.amp;McCourt,M.E.(1999).一种同时考虑白光效应、亮度对比度和光栅感应的多尺度空间滤波方法。视觉研究,39,4361-4377],该模型再现了视觉效果,如同时对比度,白色效应,光栅感应,特多罗维奇效应,马赫带,雪佛勒尔效应和阿德尔森-洛格维年科瓷砖效应,但它也复制了其他以前无法解释的效果,如地牢错觉,它们都使用了单一的参数。
1.介绍
在视觉感知中,亮度一词通常是指由视觉目标的亮度引起的非定量的光感知(见Gilchist,2006,第6页)。这种亮度不仅取决于从视觉目标到达视网膜的光线,还取决于周围环境中光的空间分布。亮度感应是指由周围光线而引起的外观变化,并根据变化的感知方向对其的影响进行分类。当目视目标的亮度变化偏离周围的亮度时,称为亮度对比度(Heinemann,1955),当变化向周围亮度而变化时,称为亮度同化(Helson,1963)。在接下来的章节中,本文回顾了几种在文献中被广泛研究的亮度感应效应。
1.1亮度感应效应
亮度感应最古老的例子之一是同时亮度对比度(SBC)效应(Heine mann,1955;Wallach,1948)。随着测试字段大小的增加,这一效应会减少,但对于10度的测试字段仍然是很强的(Yundamp;Armington,1975)。因为这远远大于猴子视网膜和外侧膝状核神经元的接收场(de Valoisamp;de Valois,1988),这表明其他类型的神经元可能参与了这一过程。这种具有小的兴奋中心和大的抑制周围(可用于将亮度转移到或远离大型测试场的任务)的神经元在灵长类视觉皮层V4区中发现(Scheinamp;Desimone,1990;斯皮尔曼和维尔纳,1996年)。
第二个已知的亮度感应例子是所谓的光栅感应(GI)效应(McCourt,1982)。感应光栅的感生对比度随测试场的增大而减小,但随空间频率(S.F.)的增加而减小(Foleyamp;McCourt,1985年)。在大到6度的测试贴片中,感应光栅仍然被感知到(Blakesleeamp;McCourt,1997)。有人认为,这两种现象(SBC和GI)只是同一潜在机制的表现(Blakesleeamp;McCourt,1997),其生理基础与猫(Rossi,Rittenhouse,amp;Paradiso,1996)和猴子(Gilbert,Das,Ito,Kapadia,amp;Westhemer,1996)的皮层神经元的发现有关。
另一个众所周知的亮度效应是白光效应(White,1979),在这种情况下,将相同亮度的灰色测试片放置在正方形光栅的黑白条上时,其亮度似乎不同。在这里,亮度偏移与测试片的高宽比无关(也就是说,它不依赖于接近或接触到测试贴片的白色或黑色边框的数量)。使这一效果更有趣的是,灰色斑块与其边界(或周边地区)之间的对比似乎不如与其所在条纹的对比那么重要。
特多罗维奇(1997)也描述了类似的效果,其中亮度变化似乎与与测试贴片接触的黑白背景的数量无关。有几种解释在接受皮层层面和更高的知觉层面,都试图解释白效应(见下文)。然而,很明显,在接受水平上对这种影响最合理的解释既需要拉长的皮质过滤器(Foleyamp;McCurt,1985年;White,1981年),也需要空间广泛的操作。而不是各向同性接受场和较短范围的空间相互作用,例如在视网膜中发现的一样。
马赫带分别是亮度梯度开始和结束时感知的亮度最大值和最小值(Mach,1865)。它们被解释为视网膜神经节细胞的横向抑制(Goldstein,2002年),以及最近以来现实世界亮度梯度的物理特性(Lotto,Williams,amp;Purves,1999)。
雪佛兰幻象(Chevreul,1890年)是亮度极小值和极大值命名的名称,分别感知在亮度楼梯中每一步的底端和尖端。有人试图用单通道和对比敏感度函数来解释这种错觉(CornSweet,1970),但这一解释已被放弃,转而在步骤中选择了多通道模型和局部特征(Morrone,Burr,amp;Ross,1994;Peromaaamp;Laurinen,2004年)。然而,在不同空间尺度的边缘引发的填充过程中,也有对这一效应的替代解释(Pessoa,Minagolla,amp;Neumann,1995)。
“阿德尔森瓷砖幻象”(Adelson,1993)出现时,一堵由均质块体构成的“墙”在空间上被一条水平的深色条纹所调制,使得形成区块顶部的一些菱形落在波浪的较亮部分,而有些菱形则落在较暗的部分。积木的顶部(水平菱形)的构造在物理上是相同的(即它们反射的光量相同),但落在光带中的菱形看起来比深色条带中的菱形更暗。通过重新安排图案,使这种效应消失,同时保持菱形周围的局部对比不变,阿德尔森(1993)证明,这个解释需要纳入长期的接受场相互作用。
Logvinenko(1999)提出了对阿德尔森瓷砖错觉的修改,他模糊了水平条带的对比边缘,从而消除了任何明显的透明度(并证实幻觉仍然存在)。对这些阿德尔森幻想他有各种各样的解释,从基于局部对比和多尺度空间滤波的“低层次”解释(Blakesleeamp;McCourt,1999;CornSweet,1970)到基于边界或亮度连接的作用的解释(Adelson,1993;Adelson,2000;Anderson,1997),“高层次”的解释中解释的基础是视觉系统如何处理光照(Gilchist等人,1999年;Logvinenko和Ross,2005年)和“多层次”解释(王国,2003年)。
特别引人注目的是,从SBC效应的简单预测(黑色环境诱导较轻的目标,等等)似乎完全颠倒了。其中一个例子是Agostini和Galmonte(2002)提出的Necker立方体,它们的虚线边被认为更轻,即它们完全被白色背景所包围,反之亦然。其他例子是地牢幻象(Bressan,2001年)和车臣板对比幻象(de Valoisamp;de Valois,1988年),其中灰色特征被白色包围看起来更浅,灰色特征被白色包围看起来更深。这些被解释为更高层次的“分组因素”,例如,Necker多维数据集中的每一组破折号都由多维数据集锚定(Gilchist,2006)。
在下一节中,我们回顾了在计算框架内对亮度感应建模的几次尝试。
1.2建模尝试
一些最成功的亮度感知计算模型是使用多尺度的低水平视觉方法开发的。他们假设边缘和线条是早期视觉的驱动特征,一组操作员(接受域)负责检测这些特征(du Buff,1994;Fiorentini,Baumgartner,Magnussen,Schiller,amp;Thomas,1990;Morroneamp;Burr,1988;Tolhurst,1972)。这些模型可能在这些操作符相互作用的方式上有所不同。例如,Tolhurst(1972)和Morrone和Burr(1988)的模型都使用了一对正交算子,但前者在它们之间相互抑制,而后者集中它们的响应。Fiorentini等人的模型(1990)在不同的空间尺度上使用单一的滤波器类型,而Du Buff(1994)提出的模型使用以同一位置为中心但却正交的一对简单细胞的算子。
第二类模型是以Marr(1982)最初提出的框架为基础的。其中一个例子是幻影(Wattamp;Morgan,1985),它在不同的空间尺度上过滤刺激,生成“原语”列表,并使用一组规则来检测线条和边缘。王国和穆尔登(1992)提出了一个更复杂的版本,称为MIDAAS,其中包括增益控制机制(光适应)、空间尺度滤波、阈值和符号描述,然后在每个空间尺度上应用一套规则并结合不同尺度输出。
第三类模型提出,视觉系统的主要任务不是提取场景的显著特征(与其他两种模型一样),而是建立保持场景几何结构的知觉表示(Pessoa等人,1995年)。该模型使用对比度驱动和亮度驱动表示,然后对第一个表示进行过滤以生成边界。在重新组合对比度和亮度信号以提供模型的输出之前,填充被这些边界所捕获的滤波超调和欠调,这意味着类似于感知的空间分布。这些模型可以解释几个亮度感应效应,如马赫波段和雪佛兰错觉的不同程度的准确性(审查见Pessoa等人,1995年和吉尔克里斯特,2006年)。
Blakeslee和McCourt(1997)提出了一个基于低水平各向同性滤波器(高斯或DOG的差异)的统一亮度模型,用于解释GI效应,他们认为这种效应不能用填充型模型来解释。这一模型与以前的模型的主要区别(王国和莫尔登,1992年;莫尔登和王国,1991年)是存在更多的S.F滤波器(对较低的空间频率敏感)和加权方案调整以匹配心理物理数据。这个简单的模型能够考虑其他亮度效应,如SBC和Hermann网格错觉。它开发了一个更复杂的版本,其中包括非线性混合各向异性滤波器(高斯或ODOG的定向差异)和标准化以均衡每个方向的全面响应,以考虑需要定向滤波器的各种亮度效应,如White效应(Blakesleeamp;McCourt,1999年;Blakesleeamp;McCourt,2001年;Blakesleeamp;McCourt,2004年;Blakeslee,Pasieka,amp;McCourt,2005年)。ODOG的最新扩展是由Robinson、Hammon和De Sa(2007)提出的,他们限制了正常化,使其在神经上更合理,并扩大了模型预测的幻象范围。另一个多分辨率知觉模型是Dlsquo;Zmura和Singer(1998)和Drsquo;Zmura和Singer(1999)提出的模型。在这里,视觉空间被分解为s.f.和方向轴,并根据其空间特性细分为几个区域。作者使用四个(八度范围)s.f通道和六个30度宽的方向,在该模型中引入了环绕声的对比度,作为全波整流频率信道的高斯模糊(称为对比度的空间池)。
本文提出的亮度感应小波模型(BIWaM)与ODOG、Dlsquo;Zmura和Singer(1998,1999)模型都有相似之处。虽然对刺激进行了多分辨率分解,但是S.F的输出,通道处理方式都不同(见下文),并明确地引入了对比度灵敏度函数和刺激距离。在ODOG模型中,中央刺激及其周围的交互作用是通过对整个视觉空间的规范化来实现的(在Dlsquo;Zmura模型中,这种显式的比较是不执行的)。在本文的模型中,引入了与中央刺激相比,环绕声的对比能量的精确依赖性。本模型的另一个关键特征是,对于下面描述的每个错觉模拟中,所有参数都保持不变。
2.亮度感应小波模型(BIWaM)
在本文中,提出了一个新的低亮度感应模型(BIWaM),它结合了空间频率、空间方向和周围对比度这三个重要的刺激特征来解释亮度同化/对比现象。这是通过一种多分辨率小波分解来完成的,它将消色差输入图像分成不同的空间频率和方向分量(使人联想到微小细胞S.F通道和皮层定向-选择性接受场)。感知亮度图像的恢复是通过使用修正版本的对比度灵敏度函数(CSF)的加权小波系数来实现的。这种改进的CSF考虑了(空间)周围信息,因此当周围对比度减小时,对比度灵敏度的值会增加,反之亦然。为了推广该模型,还考虑了观测距离。
之所以选择小波变换作为这项工作的主要框架,是因为小波与早期视觉系统的几个数学性质有着很好的契合(例如,二维接收场剖面由二维Gabor函数很好地描述(Jonesamp;Palmer,1987)。虽然神经元的感受场形状有相当大的变异性(Tolhurstamp;Thompson,1982;de Valois,Albrecht,amp;Thorell,1982),而且没有一个单一的基集能够捕捉到这种变化,但小波提供的基函数在其他数学性质(如自相似性、易于数学表示等)中具有良好的定位性(在空间和频率上)。(Field,1999;Harveyamp;Doan,1990年;Olshausenamp;Field,1997年;Van Rullenamp;Thorpe,2001年;Zetzscheamp;Nuding,2005年)。
本文的目标是产生最简单的数学公式(并包括尽可能少的自由参数),它以一套统一的参数与当前生理和心理物理研究相一致的方式对这三个特性进行建模。
尽管BIWaM与其他同类型的多分辨率模型(主要是ODOG和Dlsquo;Zmura的模型)有许多共同的特点和理念,但BIWaM与这些模型有一些重要的区别,例如:
它基于小波分解,允许对原始图像(即可逆性变换)进行完全重构,基函数具有类似于Gabor函数的轮廓。
它通过加权每个空间尺度将亮度感应与CSF联系起来(见下一节)。
它考虑了观测距离,在其他模型中没有明确定义(它根据观察者的物理位置预测不同的亮度感应效果,这是人类视觉系统(HVS)的真实行为)。其他作者承认这一存在问题(例如,FLODOG模型,Robinson等人,2007年)。
它明确地介绍了刺激--环绕反差能量。ODOG家族模型使用规范化,无论是全球还是局部,而Dlsquo;Zmura的模型执行局部增益控制,以修改不同的规模。
它的参数是固定的,并且(同时)对下面描述的所有结果负责。
2.1对比灵敏度函数
正弦光栅的检测阈值依赖于光栅S.F。这种关系由对比度灵敏度函数C(v)描述,其中m表示空间频率,这是消色差刺激的带通(Mullen,1985;Simpsonamp;McFadden,2005)。
用方波周期模式进行的实验表明,当S.F目标的特征值高于一定的感应阈值,亮度同化效应增加。对于亮度感应,这一过渡点MTHR估计接近4 CPD(Smith,ji
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[239527],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。