英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
艺术的统计规律:与视觉编码和感知的关系
丹尼尔·j·格拉汉姆(Daniel J. Graham a) ,克里斯托弗·瑞迪(Christoph Redies )
达特茅斯学院,心理与脑科学学院,6207摩尔大厅,汉诺威,NH 03755,美国大学医学院,解剖学研究所,Jena大学医院,D-07740, Jena,德国
关键词:视觉、感觉、自然场景、高效编码、艺术、视觉系统、统计规律、视网膜、稀疏、美学
摘要:至少从1935年开始,视觉研究人员就利用艺术刺激来测试人类对复杂场景的反应。考虑到艺术的“内在兴趣”及其与自然视觉世界的关系是很明智的。艺术刺激的使用一直很受欢迎。特别是在眼球追踪研究中。此外,视觉科学家普遍使用的刺激因素受到着名艺术家作品的启发(例如蒙德里安)。艺术作品在视觉科学中也很受欢迎,因为它是许多视觉现象的例证,比如深度线索和表面属性。然而,直到最近,人们还很少考虑艺术品的空间、亮度和色彩统计。甚至更少的研究这些统计数据中的规律会影响视觉处理。此外,艺术图像中的规律与自然景物之间的关系很少或没有受到关注。在过去的几年里,人们一直在努力研究艺术中的统计规律,因为它们与神经编码和视觉感知有关,而艺术刺激已经开始以严格的方式进行研究,就像自然场景一样。在这篇小评论中,我们总结了定量研究在艺术作品中的常规统计和在视觉流中的处理之间的联系。这些研究的结果表明,艺术对于理解人类的视觉编码和感知尤其重要,因此需要更广泛的研究。
介绍
由于艺术是为其他人观看而设计的,因此与视觉科学息息相关。艺术代表了一类特殊的图像,视觉艺术的分析对于理解人类视觉可能是有用的。自然场景也有类似的提议。在过去20年的自然景观研究中,很明显,自然场景仅代表所有可能图像中的一小部分,并且它们包含大量的常规统计结构。 值得注意的是,自然场景包含高阶冗余,而不是被大多数人造刺激所捕获(综述参见Simoncelli&Olshausen,2001)。最近的研究表明,自然场景的结构影响脊椎动物和无脊椎动物的视觉编码策略。换句话说,视觉系统已经适应了进化和个体发育,通过共享和物种特定的策略有效地处理围绕个体生物的自然场景。反过来,视觉艺术也是通过艺术家视觉系统的反馈而创造出来的,因此艺术形象可以适应人类视觉的功能。因此,艺术图像和自然场景的研究以及两者之间的关系可能会导致对视觉系统生物学的重要见解。
在本次评论中,我们将重点关注艺术图像中空间,亮度和色彩统计的规律。本次审查的核心内容是艺术规律与人类感知的基本功能有关。通过现代视觉科学史的一系列研究都利用艺术刺激来研究人类视觉系统的反应(例如,Buswell,1935; Wooding,Mugglestone,Purdy,&Gale,2002:Yarbus,1967),可能是因为“固有的有趣“(Hochberg,1978)。然而,这些研究一般忽略了这种刺激的统计规律。本文件部分旨在作为这些规则的初步指南。
审查分为两部分。首先,我们描述了与人类视觉中的低级处理策略相关的艺术作品中的统计规律性,特别是与自然场景的处理(第2部分 - 第1部分)相关。其次,我们描述这些统计数据的变化,以及它们如何与感性判断联系起来,并用于区分不同风格的艺术(第3部分 - 第2部分)。
图1.(A)原始图像(A,D,G,J),它们的傅立叶功率谱(B,E,H,K)和对数平均傅里叶功率与空间频率(C,F,我,L)。 A-C。
来自面部照片AR数据库的例子(Martinez&Benavente,1998)。 d-F。肖像(雕刻)由15世纪艺术家Martin Schongauer创作。 G-我。例子来自
格罗宁根自然场景数据库(Van Hateren&van der Schaaf,1998)。 J-L,一个简单物体的照片(Redies,Hasenstein等,2007)。在傅里叶谱(B,E,
H,K),低空间频率表示在中心,较浅的阴影表示较高的功率。在对数 - 日志图(C,F,I,L)中,直线符合装仓数据
点数在10到256次循环/图像之间(Redies,Hauml;nisch等人,2007; Redies,Hasenstein等人,2007)。该线的斜率在每个小组中给出(平均见表1)
每个图像类别的值)。 D所示图像经1994年柏林Akademischer Verlag的“Das Berliner Kupferstichkabinett”许可复制(库存
号码:916-2; ? Staatliche Museen zu Berlin,Kupferstichkabinett)。其他图像经作者许可转载。
2. 第1部分,艺术中的统计规律
2.1. 成对空间统计
融合的证据表明,艺术作品展示了统计规律性。最近研究的一个特别重点,大部分来自我们自己的小组是研究傅里叶空间频率功率(或振幅)的视觉艺术,这是相当于成对(二阶)相关统计。在图中显示了不同类别图像的傅里叶光谱的例子(图1B,E,H,K)。功率谱测量相对贡献率,作为一个整体,图像的不同空间频率。脆弱性指数来自神经生理学研究的暗示暗示了视觉系统包含频率特定的响应元素,在信息处理的早期阶段形成类似的分析(DeValois&DeValois,1980)。
a标准偏差。
b每个类别中的图像数量。
c来自Redies,Hasenstein等人的研究数据。 (2007年)。
d van Haterenvan der Schaaf的数据库中的图像(1998)。
e来自Redies,Hauml;nisch等人的研究数据。 (2007年)。
f AR面对马丁内斯和贝纳文特的数据库(1998)。
图2.径向平均傅里叶功率对空间频率的
对数 - 对数图。给出面部照片数据集的平
均曲线(AR人脸数据库;Martinez&Benave-
nte,1998),格罗宁根自然景观的200个例
子数据库(Van Hateren&van der Scha-
af,1998)和306单色艺术西方出处的肖像。
请注意,艺术肖像的平均曲线自然场景具有
相似的斜率并且比平均值更少用于脸部照片
的曲线(也参见表1)。在Redies之后修改
的数据,Hauml;nisch等人。 (2007年)。
在独立研究中,Graham和Field(2007.2008a),Redies,Hauml;nisch。 Blickhan。和Denzler(2007)以及Redies。 Hasenstein。和Denzler(2007)观察到。一般。艺术图像的傅立叶频谱功率倾向于根据幂律1 IJP随着空间频率下降。其中p约为2(图1D-F和2;表1)。
这个结果意味着艺术图像的功率谱大致是尺度不变的(即分形)。如果径向平均的傅里叶功率作为对数 - 对数域中的空间频率的函数绘制(图IC.F.I.L和2),则可以将尺度不变性可视化。通常情况,对于大多数图像,这样的图中的光谱功率线性下降:曲线的斜率对应于上述项中的-p。用于比例不变的图像。曲线的斜率值为-2(或者-1,如果幅度被绘制而不是功率)。
自然场景是另一种平均表现为粗糙尺度不变性的图像类(图IG-I和表1; Burton&Moorhead,1987; Field,1987; Tolhurst.Tadmor,&Chao,1992) 。由于自然场景的结构(Field&Brady,1997; Ruderman,1997),它表现在各种不同尺度上,傅立叶统计特性中低和高空间频率的相对功率变化很小,当放大时并且在一系列尺度范围内的图像之外。其他类别的图像,如植物或植物部分的照片,以及物体或人脸的照片,具有显着较低的范围在-2.5和-3.5之间的斜率值(图1A-CJ-L和2;表1; Redies ,Hauml;nisch等,2007:Redies,Hasenstein等,2007; Torralba&Oliva,2003)。
尽管斜率值的差异较小。这可能取决于不同类型的艺术图像的采样策略。我们的独立成果证明,粗糙的尺度不变性是不同文化和艺术风格中视觉艺术的普遍属性。Redies,Hauml;nisch等人。(2007),Redies,Hasenstein等人(2007)分析了数百件艺术作品,它们代表来自不同艺术家,国家的各种各样的单色(主要是灰度)西方出土艺术作品。(15-20),主题(风景,肖像,摘要等)和技术(蚀刻,木刻,绘画等)。不同图像变量的测量斜率值的差异相对较小。如果有意义的话。与非复杂对象的图像差异相比(表I)。对于考试派。平版印刷通常更粗糙地构成并且具有大约-2.2至-2.3的斜率值,而雕刻通常由细线组成并且具有在-2.1附近的略低的斜率值。格雷厄姆和菲尔德(2007,2008a)的研究也发现了来自艺术博物馆的124幅绘画中的近似尺度不变的统计特性,代表了西半球和东半球绘画的大致相同份额。此外,抽象艺术似乎也表现出类似的结构(Graham&Field,2008a:Redies,Hasenstein等,2007)。虽然缺乏这种缩放的图像可以被认为是美术 - 例如单色。或者只用一种空间频率进行动力处理,例如Agnes Mar锡的网格画 - 这种例子很少见。此外。这些结果反映了音乐中llf结构的发现(Beauvois.2007:Dagdug.Alvarez-Ramirez.Lopez.Moreno。&Hernandez-Lemus.2007; Voss&Clarke.1975)。
这些结果概括了泰勒和同盟者的早期发现,他们专注于美国20世纪艺术家杰克逊波洛克的工作。使用箱子计数测量(在数学上与空间频率功率谱相同:参见Knill,Field,&Kersten,1990)。 Taylor,Micolich和Jonas(1999)以及Taylor等人(2007年)显示,Pol锁抽象滴油画的油漆层轮廓显示出分形样的缩放。 Alvarez-Ramirez的证据支持了这一发现。 Ibarra-Valdez,Rodriguez和Dagdug(2008)以及Mureika,Dyer和Cupchik(2005),尽管Taylor的一些分析已被Jones-Smith和Mathur(2006)驳斥。
由于艺术家所描绘的许多自然场景与场景本身相比,呈现出相似比例的大型结构和精细的细节,艺术作品中自然场景统计的使用可能被解读为对这些统计数据的模仿。如何。Redies, Hanisch等人(2007)比较了人类脸部照片和人脸的艺术肖像。令人惊讶的是,他们发现艺术家们把人的脸描绘成自然景色的傅里叶特征(斜率值为-2),而不是真实的脸(大约为-3的坡度值)(图)。我和2:表1)这一结果表明,艺术家不仅仅是模仿真实世界的统计数字。但是可以优先使用特定的图像统计数据在其工作中。
综上所述,这些结果暗示了早期视觉编码策略在艺术创作中的影响。从每个spective一个,这种影响表现在艺术,平均而言,拥有相同的相关结构自然场景,见sub武功,艺术家创作的作品通常适合视觉系统已经适应了这些统计数据(手工制作图片的困难没有这个结构也会导致这个规律;参见Graham amp; Field, 2008a)。从另一个角度看,在功率谱中,艺术家强加的规律在一定程度上有助于审美感知——尤其是对事实的感知——因为与自然场景的统计匹配(第3.1节;Redies,2007)。
2.2.稀疏
统计上的稀疏性已成为自然景物中一个重要的基本规律。这反映在稀疏分布的神经编码策略中(用于评论,参见Graham amp; Field, 2006: Simoncelli amp; Olshausen, 2001)。有证据表明,艺术也表现出稀疏的结构。艺术家们似乎是在描绘出一幅画面的稀疏统计,一旦画面的亮度范围被压缩到与艺术相匹配。特别地,虽然模拟视网膜和自然景物的皮层表现比艺术作品表现出更高的稀疏性,但当图像被一种光感受器的亮度非线性(Graham amp; Field, 2007)所改变时,艺术作品表现出了更高的稀疏性。
稀疏也可能与高层次的艺术属性有关。如第3.2节所述。近年来,稀疏编码模型已经被证明优于其他的图像表示(如小波和曲线)来表现风格的分类(Hughes, Graham, amp; Rockmore, 2010)。有人认为,稀疏编码在这种情况下是成功的,因为它捕获了一个艺术家的局部空间特征。此外。研究表明,inten分布的稀疏性与艺术的相似度(见第3.3节)有关。
2.3.亮度
如上所述,由于绘画的光学性质和照度(Graham amp; Field, 2007, 2008a),艺术的亮度统计与自然景物的基本方法有很大的不同:艺术作品所表现出的动态范围比自然场景中要小得多。此外,考虑到自然场景亮度分布通常是高度倾斜的和粗略的对数正态,并且考虑到艺术家通常使用非线性的转换形式来表示场景亮度(Graham amp; Field, 2008b;Graham, Friedenberg, amp; Rockmore, 2009)的结果是,与自然场景相比,艺术品中的亮度分布更少(Graham amp; Field, 2007, 2008b)。考虑到光感受器也克服了每个形成非线性尺度的动态范围限制,在艺术上的亮度变换可能是有效的,因为许多相同的原因,在光感受器水平上,类似于对数的非线性是有用的,尽管它可能不是光感受器亮度压缩的结果。
2.4.颜色
颜色当然是艺术的一个重要方面,但我们注意到,到目前为止,只有少数几项研究考察了色彩统计在艺术感知中的作用(例如,Wallraven等人)。2009年。下面讨论)。值得注意的是。Pinto、Linhares、Carvalhal和Nascimento(2006)对文艺复兴时期绘画的高光谱图像进行了彩色统计,以
全文共24668字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[14009],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。