英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
什么在自然环境中控制注意力?
Hiroyuki Shinoda 1, Mary M. Hayhoe *, Anurag Shrivastava
罗切斯特大学视觉科学中心,美国纽约罗切斯特,4627
2000年9月29日收录;2001年6月22日修订
摘要
在执行自然任务中显示的高度任务特异性固定模式证明了根本活跃的性质的视觉,并建议在许多情况下,自上而下的过程可能是获取视觉信息的一个主要因素。了解自上而下的视觉系统如何运作需要了解控制启动的机制在适当的时间不同的任务特定计算。这在动态环境中特别困难,例如驾驶,其中视觉输入的许多方面可能是不可预测的。因此,在虚拟环境中当标志在有限的时间段可见时,我们检查司机检测停车标志的能力。检测性能受到严重调制通过指令和本地视觉环境。这表明,迹象的可见性需要主动搜索,这种搜索的频率受到环境的概率结构的学习知识的影响。copy;2001 Elsevier科学有限公司保留所有权利。
关键词:注意力;扫视
1.介绍
在日常生活中,视觉操作被嵌入正在进行的行为的环境,并且严格依赖在这个直接的环境。 然而我们几乎没有理解,视觉过程如在何扩展行为序列的环境中及时演变。在自然界中视觉的调查已经揭示了固定的模式和持续时间都是高度专业的针对每种情况。Land已经表明, 驾驶时驾驶员可靠地注视曲线的切点来围绕着曲线控制转向(Land&Lee,1994)。在板球运动中,球员展示出非常精确的定位模式,只关注球的反弹点(Land&McCleod,2000)。 一个相似的模式见于乒乓球运动中(Land&Furneaux,1997)。Ballard,Hayhoe和Pelz(1995)在一个板块复制任务中发现了刻板印象的固定模式。茶制作(Land,Mennie,&Rusted,1999)和三明治制造中(Hayhoe,Land,&Shrivastava,1999)观察者与任务性能一步接着一步紧密地联系着。固定的持续时间也因为不同的任务而不同。 Epelboim et al.(1995)表示用于敲击和查看桌子上的一组点的所需的固定持续时间是不同的。在所有的这些案例中,视觉刺激在整个任务中是相似的,但观察者的目标不同。观察者会主动选择瞬时认知所需的特定信息目标。到底编排这些选择的过程是个什么样的调节机制?
从一个场景中选择特定于任务的信息是一种有效的策略。但预测和计算一个可能需要提前的场景中的所有信息是不可能的(乌尔曼,1984)。某种选择对于处理表示的计算复杂度甚至很简单对象和场景的属性很必要的。(Bajcsy,1988;布鲁克斯1986;巴拉德,1991)。特定于任务的策略不仅限制需要获取的信息,但也允许视觉系统利用已知的环境来简化计算(巴拉德,et,al.1997) 然而这种计算的优势是要付出代价的。任何任务驱动或自上而下的系统必须处理如何调度特定计算的问题。必须要有一些机制向观察者提供不在目前的议程上的感知信息。视觉系统必须平衡正在进行特定计算任务的选择性和对小说保持响应的需要以及不可预测的可能改变任务议程的视觉输入。在第一时间不清楚的情况下,我们如何选择我们需要看到的?这个问题在动态环境中特别具有挑战性。例如在驾驶的环境中,通常是预先不知道交通标志的位置,或当前面的汽车可能会转向。这个问题已被(乌尔曼,1984)描述为“初始访问”问题。我们在这里和其他地方(Hayhoe,2000)称之为“调度”问题。
观察者如何从一种行为切换到另一种行为?什么决定观察者何时将会注意到一个交通标志而不是前面的车?这个问题的传统解决办法一直是假设有些正在进行的视觉图像的“注意”分析发生,并且这个分析的产物吸引观察者对用于进一步处理的图像的重要方面的关注(Neisser,1967;Treisman.1993;Wolfe,1994,1999;Itti&Koch,2000)。例如,时间瞬变是感性的突出并且通常引起注意(Yantis,1998)。在这种观点中,基本的视觉反应是通过形象“自下而上”驱动和作为更广泛的基础处理。但是,自下而上视觉的程度和有效性是不清楚的。大量的研究表明应对刺激如一个独特的颜色或突然发作吸引注意力的能力是由当前的注意集调制(Yantis,1998)。例如,福克,雷明顿和约翰斯顿(1992)表明单色在搜索彩色对象的视觉中吸引注意,但不是在搜索的期间突然发作。他们建议项目采用“注意控制设置”,来确定哪些功能将控制任何给定任务中的注意力调度。这可以是一种在解决调度或初始访问问题的同时受益于注意选择的优点的方式。然而仍有不确定性,是否无论什么任务,总有一些刺激如开始或新的对象来吸引注意力(Gibson amp; Yiang,1998;Gibsonamp;Kelsey,1998;Yantis,1998;Turatto amp; Galfano,2000)。
由于吸引注意力的特殊刺激物的能力对实验条件非常敏感,这是很难预测特性驱动注意力如何向自然界推广。视网膜瞬变不能依赖于吸引注意力,因为瞬变连续产生整个作为观察者自身运动的结果的视野。在日常生活中,视觉系统需要处理整个视野,它呈递出了一个复杂的不分节的空间阵列。相比之下,典型的实验显示器仅针对视野的一小部分,并且刺激通常是简单的,容易分割的几何形式。另一个重要因素是时间。在自然环境中行为的时间演变发生在几秒到几分钟,并且难以在标准实验范例中解决。调度的问题或者如何启动行为只能间接解决,因为观察者的任务由实验者定义,并在实验的范围内保持恒定。观察者如何定义任务也不是一直清楚的。因此,在实验中显示器的整个区域可能被记录为一些相关的潜在注意力。Gibson和Kelsey(1998)和Mack和Rock(1998)表明观察者改变他们的注意力集合,以响应单个试验中的意外事件。
对控制议程的前注意机制的能力的研究通常从无人参与的刺激寻找干扰效果,而受试者从事另一个任务。本研究采用了不同的方法,并询问自上而下机制在多大程度上可以满足处理正常视力的需求。这可以通过利用渲染的进展来创建虚拟环境来完成,该虚拟环境可以以创建自然世界的真实印象的速率更新。在这样的环境中,在正在进行的行为序列中的关键点处可以引入任意改变来操纵任务相关信息的可用性,同时保持来自视觉世界的输入的连续性。通过操纵任务特定信息的时间位置,我们可以评估观察者的策略来获得它。
需要处理不可预测性的功能驱动分析的自然世界?为了解决这个,我们用了一个驾驶任务,观察者必须在适当的时间里从复杂而不断改变形象中选择任务执行所需的信息。驾驶有明显的持续视觉效果。有一些需要的任务与图像不同的信息:转向,避免障碍物,检测交通信号和制动,观察周围的布局等等这些任务是否启动?在纯粹自上而下的系统中,仅仅存在诸如停止标志之类的刺激,如果与观察者正在寻找标志的情节不一致,则不足以确保检测。然而,如果刺激本身引起关注,那么每当它被呈现时,都应该被检测出来。因此,实验的逻辑是检查停止标志的可见性,当符号是仅在驾驶序列期间出现短暂时间时,它可以在简单的颜色特征的基础上检测到。观察者可以处理自上而下系统中的环境不确定性的一种方式是通过使用环境概率结构的学习知识来在可能的点发起任务特定的计算。Chun和Yiang(1998,1999)表明,通过静态和动态环境中的空间结构的隐性学习以及对象集合之间的协变来促进视觉搜索。为了检查这是否是正常观看的一个因素,我们操纵了刺激的先验可能性,并观察了这种调节对符号的响应概率的程度。 除此之外,我们还操纵了主题的整体目标。如果观察者依靠自下而上的场景分析来启动特定的视觉计算,则这些操作应该没什么效果。然而,只要它受自上而下的因素控制,受试者的行为就应该对这些操作敏感。
另一个难题在于确定停止标志何时对观察者可见。有意识的报高可能是视觉不完整的测量,因为它必然仅仅反映了观察者的记忆,而不是瞬时处理(Wolfe,1999)。此外,Hayhoe等人 (1999)表明,固定持续时间显示对不能口头报告的刺激变化敏感。由于注视轨迹和注意焦点紧密相连,因此眼睛运动可能是对观察者注意状态的更敏感的测量。这也是一个不完整的措施,因为在没有眼睛运动的情况下,受试者可以容易地将他们的注意力分散在视野内(Engel,1971; Saarinen&Julesz,1991; Summala,Nieminen,&Punto,1996)的信息上,如光流,需要来自整个视野的信息。然而,各种心理物理学和影像学研究都支持这样一种观念,即观察者的注意力转移通常反映在固定中。(Corbetta(1998)和Culham et al。(1998)已经证明,在明显和隐蔽注意力的fMRI研究中激活的顶壁和额叶皮层中的区域几乎相同。Motter和Belky(1998)和Findlay和Gilchrist(1998)也认为,定位反映了视觉搜索实验中的注意分布。如上所述,固定和自然情况下的任务执行之间的紧密联系也使得这些观点反映了主要的注意分布。然而,由于考虑到固定和注意状态的困难,我们还测量了司机的制动行为。因此,如果驾驶员在不固定的情况下检测到外围视网膜中的停车标志,则可能会通过制动显示停止标志。实验中使用了所有三种措施,眼动,停止和口头报告,因为它们都以某种方式提供了标志对主体可见的证据。
2.方法
2.1驾驶模拟器和眼动仪
驾驶模拟器是基于一个卡丁车车架,其中方向盘,加油踏板和制动踏板都配有电位计。图形系统,配有四个R10,000处理器的Silicon Graphics Onyx处理器和一个Infinite Realty渲染引擎,产生高达60 Hz的一对立体图像。立体声图像通过Virtual Research V8头戴式显示(HMD)。V8 HMD有一对1.3英寸(3.3厘米)液晶显示屏,分辨率为640times;480,提供了60°times;45°的视野,头盔的实际视野为54°。受试者头部的位置和方向由Polhemus Fastrak 3-SPACE运动跟踪系统测量,该系统以帧速率(通常约30 Hz)更新图像。受试者的左眼由安装在V8 HMD中的ASL Model 501眼睛追踪器进行跟踪。数据是呈现给受试者的图像的视频记录的形式,具有由白色光标指示的注视方向。汽车的距离,速度,以及他们的行为诸如转向,气体和制动器的数据被存储在图形计算机中。对于一个主体,除了视频记录之外,还在数据流中收集眼睛位置数据。
2.2虚拟环境
虚拟城市,硅图形表演城镇,由不规则的城市街区组成,面积超过600times;400平方米。纹理贴图和各种各样的建筑物和物体给了城市一个现实的外观。除了在实验过程中的引导车没有行人,没有车。
2.3程序
14名有偿志愿者参加了实验。所有受试者均具有正常色觉,无眼镜正常视力,驾驶经验丰富。他们都没有关于实验的经验。所有受试者都被给予了实践试验。实验始就习惯了虚拟环境。为了控制他们通过城镇的路径,并提供注意力的负担,我们要求科目试图和后面的牵头车保持一个恒定的距离。在一个特定的块中,0.5-1.0秒的停车标志被停车标志所取代。事件顺序如图1所示。在转换之前插入均匀的白框(130ms)以掩盖变化产生的视网膜瞬变。这种技术已经用于各种
图1. 标志交替序列。一个停车标志被替换为0.5-1.0秒的停车标志,而受试者在一个预定义的区域,设置在60-50米或40-30米之前的标志。符号交替发生在交叉点或块的中间。在符号变化的时候插入80毫秒的白色空白屏幕,以掩盖可能引起受试者注意标志的局部视网膜瞬变。这使我们能够分析停止标志本身的存在的影响,而不是视网膜瞬变。主车(L)沿着预定义的路径巡航。引导车的速度以13m / s的速度被正弦调制,振幅为2m / s,频率为0.25Hz,使得它在很大一部分时间内引起了人们的注意。
变化盲目实验(Rensink,ORegan,&Clark,1997; ORegan,Deubel,Clark,&Rensink,2000)。在实验期间,在随机点插入类似的白色帧,使得 科目不会将空白的发生与符号变化相关联。
为了操纵标志的行为相关性,要求被试要跟随一辆引导车,保持一定的距离(F任务),或遵循正常的交通规则(F S任务)。在每个任务中,没有给出其他指示。在F S任务中,没有提到停止标志。每个学科四次开车穿过该镇;前两次是F任务,最后两次是F S的任务。使用这个顺序是因为如果按照F S指令,F S指令似乎可能会影响F状态下的行为。在第一次试验和第三次试验中,临时停止标志出现在60-50米的距离处,在第二次和第四次试验中出现较近距离(40-30米)。我们并没有提前知道主体可能会寻找准备停止的标志。。这两个距离被选为跨越可能距离的范围。在这些距离之间,符号在7°和之间14°偏心,标志从0.8°到1.8°。对于每个距离,使用不同的路线,一个用于试验1和3,另一个用于试验2和4。
为了测试受试者是否利用有关环境的学习概率来控制视觉敏感性,我们操纵了标志的位置。 一半的科目,标志在一个十字路口。 另一半,它在一个不太可能的位置在一个区域的中间。(因此,位置因素涉及独立组,而指令操作涉及对相同主题的重复测量。)停止符号的图像参数,如大小,偏心率和持续时间,无论如何其位置(交点或质点块)都是相同的。
在每次试验中,只有一个关键板块块发生符号交替。除了监测凝视和制动性能外,如果他们注意到任何异常现象,则在实验结束时询问受试者。如果他们没有报告标志变更,那么他们被明确地询问。如上所述
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[140501],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。