正强化和负强化,不再需要区分
原文作者:Jack Michael 单位:剑桥大学行为研究中心(CCBS)
关键词:积极心理学
技术术语的发展
技术语言实践的发展是专家对他们的主题和彼此的行为的结果。最终,语言社区的有效性的提高是这种发展的主要决定因素,但就像生物进化的情况一样,至少有许多非功能因素可能产生短期的影响。一个有声望的人物的言语行为可能会被采用和传播,因为他在其他领域的成就,而不是在这个术语出现的领域。语言区分可能对演讲者有用,而不是他与他的科学主题的关系。例如,他们可能会认为他是一个久负盛名的子群体的成员。更重要的是,一些术语的区别可能在一个领域的发展过程中相当有用,因为它们与其他概念的关系;然后,当这些其他概念发生变化时,这种区别可能会持续在个别科学家的作品中,因为改变所需要的努力相当大,而强化太延迟了。
虽然文化进化而不是社会协议似乎是术语发展的最重要的决定因素,但我们似乎仍然能够通过谈论我们的语言实践,在某种程度上改变或加速这种进化过程。当然,这是“科学哲学”和“科学方法论”领域的本质,也是我在这里要说的前提。我希望改变我们目前的用法,或者更确切地说,加速一个似乎已经开始的改变,通过确定一些导致消极和正强化之间最初区别的因素,并提出为什么这些因素不再相关。
关于正、负强化区别的简史
行为实验和应用分析的一个合理起点是B.F.斯金纳于 1938 年出版的《生物体的行为》。在第一章中,他讨论了使用一套术语的必要性,并给出了他不轻易采用流行术语的理由。
在描述行为时,对方言的重要异议是,它的许多术语暗示了概念方案。我并不是说行为科学是要放弃一个概念方案,而是说它不能不需要仔细考虑大众演讲的基础方案。方言笨拙而肥胖;它的术语相互重叠,有不必要或不真实的区别,对处理数据远不是最方便的。它们的缺点是作为历史产品,被引入是因为日常的便利,而不是一个简单的科学系统的特殊的便利特征。
关于反射的术语发展和斯金纳所说的 44 被调查者的条件反射已经发生了,其中一些术语适用于受其后果影响的行为类型——皮肤者 14 操作性行为/“外行对有效后果的术语是“奖励”和“惩罚”,但这些术语显然有上面引用中提到的一些缺点。”强化在当时被广泛用于指应答条件反射的无条件刺激,因为它 44 或加强了条件刺激与相关反应之间的关系。因此,这个词是“奖励”的合理替代品,因为奖励的效果是在特定情况下增加未来反应的可能性,或“加强”反应。但是如何指后果的结果,°坏,“事情呢?lsquo;rsquo;惩罚“在当时似乎有一些与“奖励”相同的缺点,显然需要一个替代品。皮肤解可以从下面的段落中看到,其中介绍了操作性条件反射的主题:
第二种条件反射,即强化刺激与一种反应相关,可以表现如下:
s.R° — S1.R1
在哪里。R°是生物体和 S 的无条件操作行为的一部分 1 又是一种强化刺激。对条件反射的要求是一些相当强的S。1R1 和由-所表示的连接。效果是s 的变化。R°],这可能是增加,也可能是减少。在目前的按压杠杆的例子中,强度可能会增加,如果 S1 例如,是食物,如果它是一种冲击,它可能会减少。1 因此,有两种强化刺激:积极的和消极的。积极强化的停止是消极的,消极强化的停止是积极的。这两种条件反射之间的差异将在后面(1938),页进行总结。[“震惊”后的脚注说但请参见本章和下一章中关于负强化的部分。1]
换句话说,“奖励”和“惩罚”被“积极的”和“负的强化”所取代。这一点从引用的段落中很清楚,我们现在所说的用负强化的惩罚行为在 1938 年的书中一直存在。例如,在描述现在著名的“酒吧拍”实验中,他说:
第一个实验涉及到负强化对物种灭绝的影响。4 只大鼠定期强化后的灭绝曲线。第三天,杀手在20 分钟结束时第一次连接,在剩下的一小时和第二天的所有反应都得到了负面强化。(1938, p. 151)
虽然这种术语手段成功地消除了方言的一些缺点,但它引入了一种新的笨拙,即两个词产生的矛盾心理,其中两个词是由某种意义上相反或不相容的变量控制的。“lsquo;rsquo;强化”在许多用法中都是“强化”的同义词,尽管“消极强化”作为“削弱”的同义词在逻辑上并非不合理,但它有点混乱,就像“积极削弱”这样的术语一样。然而,在 1938 年,这种矛盾心理似乎并没有造成太大的麻烦,这可能是因为斯金纳的取向取向只有专家才感兴趣。15 年或 20 年后,当斯金纳的修订方法(如下所解释)被教授给大学新生时,这个问题的另一个版本变得更加严重。
用“负强化”代替“惩罚”也留下了这两个术语中固有的一个日益严重的问题,即通过一个行为有效性可疑的操作来识别一个重要的自变量,或者至少是相当复杂的。积极强化刺激是那些发生增加他们的行为的概率,遵循一一个简单和无争议的识别操作。负强化刺激是指那些发生降低了他们所遵循的行为的可能性,但到 1938 年, 斯金纳有证据,这与对这种效应的简单解释不一致。这包括几个实验的结果,包括在固定间隔的正强化后,基于杠杆按压反应的负强化刺激。理论分析是根据后来被抛弃的反射储备的概念,但即便如此,研究结果的含义也是相当清楚的。 综上所述,周期性负条件反射的实验表明,任何真正的储备量的减少充其量是暂时的,这种刺激的情绪效应可以充分解释实际观察到的反射的暂时减弱,(第 157 页)
行为分析领域发展的下一个主要里程碑是 1950 年出版的《心理学原理》,这是 F.S.Keller 和 W.N.的极具影响力的介绍性文本。Schoenfeld.斯金纳开始质疑负面强化刺激的弱化实验效果的持久性随后是 Estes(1944),他的工作普遍支持斯金纳早期的结论。凯勒和舍恩菲尔德文本的第三章被称为“操作性条件反射”,在这一章的结尾是一个题为“积极和消极强化”的章节,其中介绍的概念如下:
桑代克在他 1911 年的效力定律声明中,谈到了^满意度对情境和反应之间的联系的“加强”的加强作用。今天,避免了关于本质的争议 44 满足/“我们可以说,他给猫打开问题盒门的食物是积极的强化。在观察水平上,这将恰恰意味着桑代克所说的一,即食物的影响是增加了产生它的反应的频率。我们也知道,给口渴的动物喝水,也会产生类似的效果。食物和水属于一类正性强化物。这并不是桑代克说的全部。他还谈到了“不适”对情境-反应联系的减弱效应。某些刺激(电击、响亮的声音、强灯光等)有助于减少他们跟随之后的反应频率。如今,我们称它们为负强化物,但它们的弱化功能并不是最好的定义。到 1932 年,桑代克自己认为,奖励和“惩罚”并不像他早期表述所暗示的方式彼此相反;在下一章,我们将提供证据,表明负强化刺激的减弱效应不是永久性的。另一种,可能是更好的处理方法是将强化物的积极反应定义为那些在呈现时增强反应的刺激(例如,食物强化压棒或拉环行为),将强化物的负反应定义为当它们被移除时强化的刺激。(凯勒和舍恩菲尔德,1950 年,第 61 页)
他们下一章提出的证据包括斯金纳早期实验的结果加上埃斯蒂斯的发现。
斯金纳、凯勒和舍恩菲尔德提到的负强化刺激的减弱效应的无常需要一点进一步的解释。当然,人们认识到, 正强化的强化效果是暂时的,因为没有强化的先前强化反应的发生——被称为“消失*”的操作——将导致反应频率的降低。在这个意义上,负强化的弱化效应不会更持久:当反应没有负强化的影响时,负强化的效应会“消失”。,但负强化物的减弱效应显示出另一种类型的无常,这被认为不是正冰渣强化物强化效应的特征。凯勒和舍恩菲尔德对这个关键发现的描述如下:
hellip;Estes 发现,在短的灭绝时间内以通常的方式进行惩罚,然后是两个小时的时间,老鼠被留在反应室,没有酒吧,也没有进一步的惩罚是,当酒吧被重新引入并恢复消失时,冲击的影响几乎完全消失。把老鼠留在没有酒吧的房间里,导致由电击引起的情绪不安几乎完全消失。除了一开始的一个小的萧条之外,最终的灭绝曲线与从未被震惊过的动物所提供的曲线没有明显的不同(第 109 页)换句话说,负强化物对反应的减弱效应可以通过其他方式被消除,而不是通过反应的发生而没有结果。此外,这种形式的无常(被斯金纳、凯勒和舍恩菲尔德)认为具有重要的实际意义,这表明广泛使用负强化来消除行为是一种值得怀疑的做法。
回到术语的问题上,从上面引用的段落中可以看出,凯勒和 1950 年的舍恩菲尔德比 1938 年更愿意使用“惩罚”这个词。在一个例子中(可能是因为他们的文本的介绍性),他们甚至似乎更喜欢 44 处罚到 44 他们给斯金纳的两个人物重新标记了“惩罚的效果”。他称之为“负强化的影响”(凯勒和舍恩菲尔德文本的图 28 和 29 页,在第 107 和 108 页:斯金纳的《生物体的行为》的第 45 和 47 页,第 152 和 154 页)。
在他自己的入门教科书中。科学和人类行为。出版于 1953 年的斯金纳完全逆转了他以前的部分用法。在一个标题为“什么事件正在加强?”他对这两种强化类型的区分如下:
被发现是强化的事件有两种类型。一些强化措施包括呈现刺激,添加一些东西,例如,食物、水、性接触。这些我们称之为积极的强化物。其他一些则包括rem 两——例如,巨大的噪音,非常明亮的光线,极端寒冷或高温,或电击。这些我们称之为负性的强化物。在这两种情况下,强化的效果是相同的——反应的概率增加了,(第 73 页)这些事件与惩罚的关系将在后面的一节中描述,在假设的惩罚的直接削弱效果的现实被提出质疑之后。
我们必须首先定义惩罚,在没有任何效果的前提下。这可能似乎很困难。在定义一个强化刺激时, 我们可以通过吸引对行为强度的影响来避免指定物理特征。如果惩罚后果的定义也没有参考它的物理特征,如果没有类似的效果作为试金石,什么课程对我们开放?答案如下。我们首先将积极强化物定义为任何刺激,它的行为。我们将负强化物(厌恶刺激)定义为任何会强化行为的刺激。两者都是字面强化意义上的强化物。就科学定义对应于世俗用法而言,它们两者都是*r 在病房。”在解决惩罚的问题中,我们只是简单地问:撤回一个积极的强化物或呈现一个消极的强化物的效果是什么?前者的一个例子是从婴儿那里拿走糖果;后者的一个例子是打婴儿。(p. 184-185)
在行为分析中使用的术语“刺激”似乎通常指静态刺激条件;刺激的变化通常用“刺激开始”或一些这样的表达来表示。存在一些歧义,但这通常是不严重的,因为上下文提供了附加的信息。然而,在试图定义与有效的行为后果相关的各种术语时,任何这类歧义都很容易导致更严重的混淆。因此,在下面的章节中,我通常会使用一些繁琐但明确的“静态刺激条件”和“刺激变化/”,斯金纳在上面提到的章节中提出的是,我们将一种强化行为的刺激变化指定为^强化。”当变化可以被描述为表示时,这种变化应该被称为正强化广:当它可以被描述为撤回(或去除或终止)时,这种变化应该被称为^ 负强化/nef。”
在这一点上,我们可以很方便地注意到,要描述任何形式的变化,我们必须至少要描述变化前存在的静态条件,以及变化后存在的静态条件。为了更精确的目的,通常还需要说一些关于前者取代后者所需的时间,以及一些关于任何中间条件的东西。一个变化只包含这样一个事实:变化前条件,即变化后条件以某些时间方式和某些中间条件被变化后条件所取代。(当然,这忽略了连续体的问题,在连续体中,数学语言变得至关重要。)
斯金纳对“强化”这个词的建议是,它应该指那些刺激变化中的一个静态刺激成分,即 reinforces 函。当刺激变化是正强化时,也就是说,当变化可以被识别为一种表现时,那么静态的变化后条件应该被称为正强化。当刺激变化是一种去除,因此是负强化时,静态的^-变化条件应称为负强化物。惩罚也是一种刺激性的变化,包括对那些我们发现是强化的变化的逆转。
因此,斯金纳的新方法的本质是,**负强化现在应用于刺激变化,强化之前的行为,而之前它则指的是同样的变化,但方向相反。虽然之间的区别 4,“强化”和^强化之前没有明确规定,“强化”通常指的是静态的变化前条件(负的强化),或静态的变化后条件(积极的强化),然后在新用法中也是如此。
在 20 世纪 50 年代末或 60 年代初的一段时间里,大约有一半的行为分析专业的学生从凯勒和舍恩菲尔德的文本中学习他们的基本概念,另一半从斯金纳的《科学与人类行为》中学习关于关键术语“负强化”的相当大的混淆。当这两篇文章在同一课程中使用时,这种混乱尤其强烈。
1961 年,J.G.霍兰德和 B.F.斯金纳编写的程序文本《行为分析》9已发布。它自然地延续了斯金纳在 1953 年的书中引入的术语实践,并开始取代凯勒和舍恩菲尔德作为介绍性文本,从而打破了平衡,有利于斯金纳的负强化的新定义。关键帧出现在打印文本的第 9 集(从第 53 页开始)和第 37 集(从第 245 页开始)中。
自 20 世纪 60 年代中期以来一直保持相对稳定,斯金纳的方法自 1953 年以来一直保持相对稳定。
目前的用法的问题
“负强化”及其相反的含义是一个相当混乱的来源。自 1953 年以来,一定有人类花了数千个小时,试图阻止行为术语的学习者将这种刺激的变化等同于惩罚,而惩罚的方向恰恰相反。看来,斯金纳早期的用法,尽管它有自己的歧义形式,但比修订后的用法更符合我们的其他语言实践。常识上的反对,奖励和惩罚,可能是涉及技术术语的原因:如果奖励是正强化,那么惩罚应该是负强化不是合理吗?由于这种用法是如此自然,人们可能会建议回归旧的“负强化”作为解决问题,但我们目前还不知道另一种类型的错误会变得多常见。早期的使用并没有在未经选择的大学新生、小学教师、医院护理人员等身上进行真正的测试。很有可能我们会花费数千个小时来试图防止将负强化解释为一种强化的刺激变化,因为强化在我们语言中的所有其他用法中肯定会加强。
试图通过要求明确区分“强化^”和 44 强化可能受到这样一个事实的阻碍,即对于
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[594827],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。