英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
计算的合理性:在大脑、精神、机械中聪颖的趋同模范
Samuel J. Gershman,1* Eric J. Horvitz,2* Joshua B. Tenenbaum3*
在一起成长,并在20世纪后半叶逐渐成长,人工智能(AI)、认知科学和神经科学的领域是重新汇聚到智慧的计算基础上的共享观点在问题、方法和结果上促进有价值的跨学科交流。我们在过去的几十年里绘制了一些进展,以应对知觉的挑战通过计算的镜头,在不确定的情况下采取行动。进展包括对大规模概率的表示和推理过程的发展推理和机制,用于在工作中进行权衡和权衡,计算的精确性和及时性。这些工具被部署到计算合理性:用最高的预期效用来确定决策考虑到复杂现实问题中计算的成本最相关的计算只能近似。我们强调了关键概念这些例子展示了计算机科学和认知之间的交流的可能性科学和神经科学。
我想象一下,在你的公路上开车给出重要陈述的方式突然你看到前面有交通堵塞。在接下来的几秒钟里,你必须决定是否停留在你目前的路线或采取即将到来的退场,最后一个是几英里—当你的头脑在思考时关于即将到来的事件。从种意义上说,这问题很简单:用让你参加你的活动的可能性最大准时.然而,充其量只能实现此解决方案仅大致为:评估可能高期货的完全分支树未来的不确定性很可能是不可行的,你可以只考虑几个考虑到紧迫性,广阔的可能性空间决定和你分散注意力。怎么最好做这个计算?你应该做一个吗?根据你所见的正确决定现在,或者明确地设想下一个每条路线都有几英里?也你应该停止思考你的演讲,集中注意力在这个选择上,或者甚至靠边站,所以你可以不必担心你的想法开车吗?是否退出的决定衍生出一系列内部决策问题:如何多想想,你应该提前多久,甚至思考什么。
这个例子突出了几个中心主题。在智力研究中。首先,最大化一些期望效用的测量提供了一种通用的不确定决策的理想选择。第二,期望效用最大化对于大多数现实世界的问题来说,这是非常必要的。近似值的使用。第三,选择如何最好地接近可能本身就是一个决定。服从预期效用演算思想在时间和其他资源上花费很大,有时智慧最懂得如何最好分配这些稀缺资源。
广泛接受指导行动预期效用,制定的复杂性和解决决策问题,以及多方面的近似方法不确定因素下的决策动机人工智能(AI)研究人员采取通过计算镜头重新审视概率。这次考试导致了发展。计算表示和执行大规模概率的过程推理;识别最佳行动的方法,为了便于思考和决策权衡努力、精确性和及时性有限资源下的计算。相似的思想变得越来越重要。认知科学家和神经科学家想想人类头脑中的智力大脑,经常受到AI研究者的显著影响有时影响他们回来。在这篇综述中,我们描绘了这种思想的交汇点。围绕智能作为计算的观点合理性:用表示、算法计算,设计为近似的体系结构具有最高期望效用的决策,而考虑到计算的成本。我们分享我们对这个观点的思考智能,它如何包含跨学科目标和洞察力,以及为什么我们认为它会作为共同的观点越来越有用。
建立了计算合理性模型基于感知的推理过程,不确定性下的预测、学习和推理(1 - 3)。这样的推理过程起作用。编码概率依赖性的表示变量捕获可能在世界上有关国家的。鉴于传入感知数据流,贝叶斯更新程序或近似用于传播。信息与计算修正状态变量上的概率分布。超出评估概率的基本过程,计算合理性模型需要论证可行性的机制行动的含义。审议有关最好的行动取决于一个人的能力。预测不同行动将如何影响可能的结果和考虑结果的价值或效用(4)。学习过程对参数进行更改概率模型,以便更好地解释知觉数据并提供更准确的推论关于指导行动的可能性世界。
最后,有界计算系统权力必须考虑重要的权衡。世界上行动的精确性和及时性。因此,计算理性模型可能包括政策或审议机制推论和决定在“中级”为了规范基数推断。这些决策依赖于对计算的反思。与此相关联的努力、准确性和延迟不同基准层算法的调用设置.这种层次的决策,或“元推理,可以通过实时反射或作为计算期间的策略离线优化。无论哪种方式,目标都是确定基本进程的配置和使用以最大化期望为目标世界上采取的行动的价值。这些计算考虑越来越重要的是当我们考虑更丰富的表现支持的(图形、语法和程序)人类智力的特征,例如作为递归和组合性(5)。
AI在计算机械进行推理的关键进展,确定理想的行动,并考虑系统的端到端的业务有协同效应和资源的资金与人类认知。在简要介绍了他在AI的发展之后,我们考虑了计算理性与认知心理学和神经科学研究结果之间的联系。
基础与早期历史
人工智能的研究在20世纪30年代发展和稳定的理论根源。努力那么高把基本的计算系统的电源(图灵机)支持任何可行的计算实际的机械化(6)。这种普遍计算的承诺和电子计算机的快速发展,激发了早期计算机科学家对计算机系统发展前景的想象,这可能有一天会解释和复制人类智能的各个方面(7, 8)。
图1。使用近似推理和决策的现代人工智能系统的例子。
这些系统不能依赖于所有相关实用程序和概率的穷举枚举。相反,他们必须分配计算资源(包括时间和精力)来优化推断概率和确定最佳行动的近似。(a)沃森处于危险状态时的内部状态!代表几个高概率的假设。[房间]允许IBM新闻照片(B)的谷歌自动驾驶汽车的内部状态,这代表这些方面的世界,可能是最有价值的昂贵的或在可预见的未来,代理,如位置和自动驾驶汽车的速度,其他车辆和行人,和交通信号的状态。[转载]从谷歌许可(C)的助理(左),交互式自动书记部署在微软的研究,认识到在其邻近的多人(右);审议关于他们当前和未来的目标,专注,和话语;从事自然对话的不确定性。
人工智能的早期先驱者反映了概率和贝叶斯更新在学习、推理和行动中的应用。考克斯,Jaynes的分析,和其他人提供的基础观点的概率作为评价和修改在感知数据的合理性的充分衡量事件。在有影响力的作品,冯诺依曼和Morgenstern发表在效用理论,定义理想的结果,或“理性”决策代理人的行为(4)。他们提出了一个公理的形式化推导偏好”的最大效用的期望原理(默河)。具体来说,他们发现,接受一个紧凑和具有吸引力的偏好次序,绝对意味着理想的决策行动,最大限度地提高代理人的期望效用,并计算每个动作动作的平均效用考虑世界的状态的概率。
概率和MEU决策的使用很快遍及多个学科,包括人工智能研究的某些领域,如项目的机器人。然而,该方法并没有获得大量在AI的研究直到20世纪80年代末。几十年来,由冯诺依曼和摩根斯坦的工作后,概率和决策的理论方法,在人工智能研究界许多人认为过于死板,SIM plistic,顽固性用于理解和构建复杂的智能系统。为探索替代模型,包括各种启发式程序定理证明和逻辑。
在制定和解决现实世界的决策组合复杂性的脸,一个学校的启发式模型有限理性的发展在上世纪50年代后期的研究。在这个范式研究包括西蒙及其同事的有影响力的工作,他探索的非正式的价值,启发式策略,可能使用的人以及由计算机推理系统穿越概率推理和决策的复杂性(9)。每个这样的启发式概念的有限理性角度来主宰一大片人工智能研究。
概率计算透镜
在上世纪80年代末,概率复兴席卷主流AI研究,部分由执行声音对应用机器推理的结果可能干扰等高风险领域的压力,药物刺激。尝试用机械化概率推理和学习导致了关于概率的新的见解和刺激的关于人类认知相关的陈述和推理策略的角色思考解决问题。也许最有影响力,AI的进步导致了丰富的网络表示的配方,如贝叶斯网络,一般称为概率图形模型(铂族金属)(1, 2)。提出了利用并行和分布式计算更新网络中随机变量星座的信念更新过程。
甘糖酯的研究进展从这些最初的大量方向发展:高效的近似推理方法;在网络结构的组合空间结构检索;获取共享结构在数据集的层次模型;主动学习来指导数据的收集;并可以指定概率编程工具丰富,上下文敏感的模型通过紧凑,高亲克。这样的发展已经把概率推理和MEU决策的概念在许多当代心AI的方法(3),加上不断增加的计算能力和数据集的可用性,在最近几年一直负责戏剧性的AI的成功(如IBM的Watson,谷歌的自动驾驶汽车,而微软的自动助理)。这些发展也提出了新的计算和理论的挑战:我们如何能从一个理性的代理人的期望效用最大化在一排地枚举状态动作空间到所面临的资源决定理论界的AI系统部署在现实世界的经典视图(图1),它把严格的要求实时计算在复杂的概率模型?
有限计算资源下的理性决策
感知和决策产生的计算成本。这样的成本可能是以不同的方式,包括损失来延迟时间关键的设置作用,干扰多推理组件之间的影响,以及精力投入的措施。AI的工作探讨了在元层次上思考感知和推理的性质和程度的价值。元层次的分析已旨在赋予计算系统与努力或延迟和世界采取行动的质量之间的理想平衡使期望效用决策的能力。这种理性的metareasoning使用有限理性决策理论模型中起着核心的作用(10–14)。
理性的metareasoning已在多个领域的问题进行了探讨,包括概率推理和决策指导的计算(11, 13, 14),控制定理证明(15),在输入流的问题处理积极的推理(16)、引导启发式搜索(13, 17),和动作序列优化(18–20)。除了实时metareasoning,努力探索离线分析学习和优化实时元推理和提高实时推理通过预计算和缓存的推理问题的快速响应等方法为反射部分政策(21)。
对中级反射计算的合理性的价值是由贝叶斯网络概率推理的复杂度,这已被证明是在非数定多项式时间复杂性类–(NP)难(22)。这种最糟糕的复杂性凸显了开发利用现实世界问题结构的近似的重要性。开发了一个近似推理方法的织锦,包括使用蒙特卡洛模拟、边界方法和将问题分解为更简单的子问题的程序(1)。有些方法允许系统将计算时间用于精确度。例如,抽样程序可以用额外的计算时间来压缩EST概率的界限。特征的权衡terizations可能不确定自己。近似考虑产生与调制模型的复杂性权衡其他的方法,如改变模型的大小和证据,抽象水平的行动,结果是(11, 21)。
在不同层次的精度和成本推理价值之间的相互作用的高级视图捕获示意图2A。
在这里,计算的附加值的最终行动和计算延迟成本的价值是在同一单位的效用。一个行动的净价值是衍生为期望值的行动基于电流分析和计算需要达到的层面分析成本之间的差异。在形势的描绘,成本增加以线性的方式,用额外的计算延迟,而行动的增加与减少边际收益的价值。我们看到,达到一个最优停时问题,在这种计算额外的精度在网中行动的价值损失。如图所示,增加计算成本会导致较早的理想停止时间。实际上,我们很少有这样简单的计算成本和收益的经济学。我们经常对成本和预期继续计算值等不确定必须解决一个更复杂的计算期望值分析。一个中级REA Soner考虑当前的不确定性,继续计算时间临界损失和预期收益与额外的计算推理精度。
作为一个例子,考虑一个推理系统,它被用来研究推理的计算合理性,并在时间关键的情况下为行动提供建议。该系统需要考虑因延迟增加而造成的损失,而这种行动源于推断在一个设置中采取最佳决策所需的时间。最好的决策期望值可以作为一个系统考虑对病人的症状减轻,使推论
生理学。微量的推理在急救医学会议的时间关键的呼吸情况合理的元推理引导在图2b所示(14)。一个推理算法(称为有界条件),继续收紧一个关键变量的上限和下限,代表病人的生理,使用贝叶斯网络来分析证据。系统对病人的状态不确定,每个状态都与不同的时间临界性和理想动作有关。系统继续讨论关于继续进一步加强边界值的元级。这周一器这个值通过计算期望值计算。当推断的期望值计算为零,这使得分析指导基层系统停止并采取目前最好的推断的基础水平的行动成为可能。
思维与大脑的计算理性
与AI的发展同步,人类智能的研究也取得了类似于计算合理性的进展。从20世纪50年代开始,心理学家提出人类是“直觉统计学家”,利用贝叶斯决策理论来模拟不确定性下的直觉选择(23)。在70年代和80年代,这一假设会见谁发现了系统的谬误在概率推理和决策者的阻力(24),导致部分采用基于正式的启发式和偏差的模型而不是正常性原则概率与效用理论(25)。广义的成功概率和决策在过去的几十年中,人工智能的理论方法,然而,有助于恢复这些观念认知建模中心(5, 26–28),近似贝叶斯更新通过分布式消息传递变量的大型网络表明,类似的程序可能被用于脑组织大规模的概率推理方法的发展(29)。同时,研究人员在研究人类的判断和决策的不断发现,人们的认知本能似乎远离我的理想,经济学家和政策制定者所期望的方式。
计算理性提供了一个框架来调和这些相互矛盾的人类智力图像。如果大脑适应有限资源的合理计算,那么这种优化的自然结果可能会产生“谬误”(30)。例如,逼近贝叶斯推理的一般策略是通过采样与样品近似假设,基于收敛到真实后更多的假设表明,相信一点是在跟踪设置强度(红色=更高的信心)之后的一段时间间隔,一个粒子滤波的目标跟踪。不确定度随速度的变化,解释高速物体为什么难以追踪的原因(32)。(c)对于一个基于抽样的近似贝叶斯决策者,面对一系列二元选择,每项决策的预期效用,单位时间的决策数可以计算每单位时间的预期效用,作为后验样本数和行动/样本成本比率的函数。在右边的图圈表示样品的最佳数量在一个特定的动作/样品成本比率。对于许多决策,精度和计算时间之间的最佳选择权衡建议只考虑一个样本。[转载(38)经许可]
A |
B |
lt;
全文共13871字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[10036],资料为PDF文档或Word文档,PDF文档可免费转换为Word
Value of result in |
1.0 |
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。