自适应进化的策略和网络导致空间的最优的合作水平的囚徒困境博弈外文翻译资料

 2022-09-07 15:24:36

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


自适应进化的策略和网络导致空间的最优的合作水平的囚徒困境博弈

陈含爽a),侯中怀a)b),

张季谦c),辛厚文a)

  1. 中国合肥230026,中国科技大学,化学物理系
  2. 中国合肥230026,中国科技大学,微尺度合肥国家物理科学实验室
  3. 中国芜湖241000,安徽师范大学,物理与电子信息学院

(2009年7月30日收到, 2009年10月28日收到了修改后的稿件)

我们在很多参与者和他们的交互网络同时共同演化出来的自适应网络上研究演化囚徒困境博弈。在共同进化的过程中,相互作用的参与者与相反的策略要么以p的概率重新连接要么依靠他们的支出以1-p的概率更新他们的策略。数值模拟表明,最后的网络要么分开一些不连接的群体,这些群体的参与者在所在的每个群体中共享相同的策略,要么形成一个单个连接的网络,在这个单个连接的网络中,所有的节点都是在相同的策略中。有趣的是,通过在网络动力学和节点动力学的时间尺度竞争中,合作者密度的最终状态可以在一个中间范围p内最大化。最终,平均场的分析有助于对数值模拟结果的分析。在现实情况中出现的合作,我们的结果可能会提供一些富有洞察力的理解,在这些现实情况下个人的行为和他们的关系自适应同步进化。

关键词:囚徒困境博弈,自适应网络,同步进化,合作

论文全文数据库:0250,0175,0565

  1. 介绍

复杂网络近年来受到相当大的关注。他们出现在各种各样的实际工作系统中,从生态学、流行病神经学科、社会经济学到计算机科学中。到目前为止,网络研究的两个主要主题可以明显的辨别:第一个是与网络的动态相关联。在这里,网络的拓扑结构本身被视为是一个动力系统,在时间上它的发展根据一些特殊的规则。在这一领域的研究表明某些进化规则产生特殊的网络拓扑结构。著名的例子包括小世界网络的形成(SWN)和无标度网络(SFN)。网络的第二主题研究主要集中在动态网络中,在动态网络中,节点代表动力单元和它们之间的交互连接。很多研究表明网络拓扑结构在系统动力学中起着关键作用(例如,最近的一次审查和引用中)。

直到最近,网络研究的两个主题在文学上的报道几乎是相互独立的。然而,在大多数实际网络中,网络拓扑结构和节点的状态都是动态而不是静态的,并且网络拓扑结构的演化往往是相关节点的状态,反之亦然。一些著名的例子是:在熟人网络中,如果他们的观点和价值观是相似的话,人们更有可能保持社会联系。在人工神经网络中,网络拓扑结构可以根据节点的状态来改善训练过程,然后修改拓扑结构决定了在下一个试验中国家的动态。在交通网络中,网络拓扑结构对交通流量有直接影响。通常对于一个拥挤的道路,为了缓解拥挤的情况,一些新的道路将会建立。这类自适应进化的研究主要包括同步、观点动力学、博弈论和流行病在自适应网络上的传播。这些研究表明网络和个人动力学的自适应进化可能带来一些非凡的结果。

在描述由自私的个体组成的系统的演化中,博弈论提供了一个有用的框架。像囚徒困境博弈一样一个简单的博弈,在理论和实验的研究上吸引了最多的关注。Nowak和May表明一个简单空间结构上的囚徒困境博弈可能导致合作的出现和持续,在不同图形上的演化游戏已经收到了足够的关注。特别是在描述合作进化的种群结构的研究上,图形理论的发展和复杂网络上的成就提供了一个自然并有意义的框架。节点代表参与者,而边缘表示参与者之间的联系。广泛的研究表明,在很多实际网络(例如SWN和SFN)上的博弈和普通网络上的博弈大不相同。特别是Ref已经认可了SFN作为在PDG上合作行为极有力的推动者,还有另一个著名的博弈,随风飘飞博弈。对这一领域的研究进行全面评估看到Ref。另一方面,在自适应网络上PDG研究的重要性最近被解决。在这类自适应网络上,根据一些奖励和惩罚的规则,为了提高竞争地位,有认知的参与者可以减少合作伙伴或者重新建立新的社会联系。例如,Zimmermann和Eguacute;ıluz已经展示一种相互演化模式导致比固定网络博弈更强健的合作,并且在合作出现上自适应适合的网络类型方面带来一些启示。当节点和网络拓扑结构都自适应演化时,确定了两个时间尺度:一个与节点动力学有关,另一个与网络动力学有关。

在目前的工作中,我们考虑一个共同演化模型的描述如下。最初一对已连接参与者及其相反的策略是随机选择的。然后底层网络通过以p的概率重新连接他们来更新其拓扑结构;如果一个参与者的支出小于另一个,在这次连接的末尾他将以互补概率1-p改变其策略。请注意p和1-p分别是网络动力学和节点动力学的时间尺度。因此,一个有趣的问题是,整个网络的合作水平如何将取决于网络动力学的相对时间尺度到节点动力学的相对时间尺度。有趣的是,我们发现在最终状态的合作者密度,在全部博弈中获得的描述,可以在两个时间尺度的相对比率的中间值上最大化。平均场分析是用来帮助理解仿真结果的。

本文的结构如下。在第二部分中,我们提出了共同演化模型。自适应网络结构和合作行为的数值分析的结果在第三部分呈现。第四部分提出了平均场分析,还有第五部分就是主要结论。

  1. 模型描述

在PGD标准中,参与者可以采用合作(C)或背叛(D);两个相互作用的参与者都被提供一定的收益,相互合作的合作报酬为R,相互背叛是较低的背叛惩罚P。如果一个参与者合作,另一个背叛,那么合作者得到最低的受骗支付S,而背叛者获得最高的收益,背叛诱惑T。因此,我们有了公式T gt; R gt; P gt; S。很容易看到不管对手的选择,背叛是更好的选择。处于这个原因,在混合种群中,背叛是唯一的稳定演化策略。我们用C或D来描述一个参与者的状态,分别通过一个状态向量s = (1,0)或s =(0,1)。每个参与者与邻居相互作用,并且依靠收益参数来收集收益。某个参与者i的总收益可以表示为

(1)

公式中si和sj表示节点i和j的策略、运行在i的所有与相邻站点(这个集合由Ωi表示)还有支付矩阵表示为

(2)

共同研究后,我们也可以通过重新调节博弈开始,以至于它取决于一个单个参数,例如,我们可以选择R = 1,P = S = 0,T = 1 r(0 le; r le; 1)来代表背叛者对于合作者的优势(或者背叛诱惑),在普遍的博弈中没有任何的损失。

有三种可能成对的交互网络。两个C类参与者连接到一起(C-C连接)将试图保持互动,因为这两个参与者都会从贸易过程中受益。虽然两个D类参与者连接到一起(D-D连接)获得最低收益,他们两个都可能希望另一个参与者改变目前的策略,以至于他将获得最高的收益。当一个C类参与者和一个D类参与者连接到一起(C-D连接),C类参与者的收益远低于D类参与者。在这种情况下,这个连接被C类参与者破坏然后重新连接或者他们更新他们自己的策略是合理的。因此,演化更新只发生在C-D连接。由于缺乏新邻居策略的先验知识,目标节点关联的一个新连接指的是随机选择。

根据上面的合理假设,演化运行如下。每一步,每一个个体扮演着与他的所有邻居当前相同的PDG状态。并收集一个总收益。然后,一对已经连接的参与者(i,j)从总种群中随机选择的。如果所有的参与者都有着相同的策略,那么什么也不会发生。否则,试图重新连接的联系取决于概率p(为了方便我们假设i是一个合作者,并且他的邻居j是一个背叛者):一个新参与者k随机选择后,(i,j)连接以概率p重新连接到(i,k)连接,或者以概率1-p重新连接到(j,k)连接。策略更新以互补概率1-p发生:两个参与者比较他们的收益,收益更少的参与者模仿其他玩家的策略。演化过程最终直到所有C-D连接消亡。

  1. Monte Carlo模拟

最初,N类个体定位在Erduml;os–Racute;enyi(ER)平均连通性lang;krang;随机图,他们以1/2等概率随机分配策略C或策略D。我们执行Monte Carlo(MC)模拟网络的共同演化过程和策略更新的详细描述在上面的部分。

很明显,模型朝着C-D连接数量减少的方向移动,这样就没有C-D连接在最终的网络中存在。因此,网络可能会被一组断开连接的社区分开,每个断开连接的社区的所有个体共享着相同的策略。我们模型中的主要兴趣是,通过自适应演化的过程合作现象是如何出现的。

首先我们考虑q = 1的情形。我们描述合作者的密度rho;C作为一些不同r值的p的函数,如图1所示,每个点对应于平均超过100的完成的初始网络和初始条件。对于一个给定的r值,当p超过某个值后,rho;C迅速增加,当p再次增加时然后减少,从而表明在PDG的研究网络中,p的中间范围存在最大值rho;C。总而言之,个体策略和互动网络的共同演化能够促进自私个体的合作,并存在一个最优p使合作水平最大化。

图1 合作者密度rho;C作为一些不同r值的p 的函数。其他参数是N = 500,lang;krang; = 20,q = 1。

对于小型p,即重新连接C-D连接的概率小,一些C-D连接成为C-C连接,因此C类参与者的平均度约等于D类参与者的平均度。在这种情况下,背叛者的收益通常高于合作者的收益,以此来作为背叛者患病率的结果。对于非常大型的p,在重新连接的过程中,几乎所有的C-D连接会快速转换成为C-C连接,这导致更新策略的可能性很小。因此,在这种情况下,最终状态的合作者密度显然接近初始水平。更重要的是,p的一个中间范围能够确保重新连接时间和策略更新之间的平衡。这种平衡导致中心(高连通性的节点)的形成,这在底层网络的促进合作中起着主要作用。

为了证实这一点,我们使用归一化方差来衡量网络的异构型,定义为sigma;k2 = (lang;k2rang;minus;lang;krang;2)/lang;krang;。一个更大的sigma;k2更多的网络异构型。从图2中可以看出,当p值相对较小,网络度分布的结果接近泊松分布时,以至于sigma;k2 ≃ 1,类似于最初的一个。当p增加,sigma;k2迅速增加到最大值然后下降。图2显示了最后网络三个典型p值的最大社区的度分布P (k)。p = 0.75对应的广泛度分布的情形,与其他两种情况之间有显著差异。有趣的是,我们发现度分布似乎遵循幂律度分布P (k) sim; kminus;gamma;范围中的一个重要组成部分。因此,最优p应该存在于最大合作水平。此外,这个最优p依赖于背叛诱惑r;详细的说就是,r变大p就随着变大。随着r的增加,重新连接事件必须足够的频繁来确保合作的存在。尤其是对相对较大的r来说,一个个体选择重新连接社会关系的概率应该超过策略更新的概率,以确保合作伙伴的可持续性。

图2 归一化方差sigma;k2作为p的函数。插图用对数刻度描述了最终网络不同p值的度分布的全部组成。对于p = 0.75分布似乎遵循幂律分布范围的一部分,与指数4.0 plusmn; 1.0的虚线所示。其他参数为N = 500,lang;krang; = 20,r = 0.5,q = 1。

回忆里最终网络可能被分成一些断开连接的社区,每个社区的所有个体都共享着相同的策略。在实际生物学或者社会系统中,物种隔离现象在许多水平细胞、功能、组织、生态、文化的持续多样性中起着至关重要的作用。例如,在人类社会中,许多亚群体或社区可能出现相互矛盾的文化特点,这些社区之间的相互作用是稀缺的,因此可以有效的视为相互脱离。这是有关社区的数量和最大社区的大小如何依赖于p。图3显示了最大社区S/N的标准化规模和对不同的r值作为p函数的社区NC的数量。对每个r值,我们发现除了临界值pc,S/N从一个地方开始持续减少,如图3(a)所示,NC从一个地方开始增加然后开始减少,如图3(b)所示。也就是说,当p gt; pc时网络开始分裂。与图1对比,可以注意到当p变化只是发生在p = pc时,合作者密度的位置开始从零增加。

图3最大社区S/N的标准化规模和对不同的r值作为p函数的社区NC的数量。其他参数为N = 500,lang;krang; = 20,q = 1。

图4 对不同的q值,合作者密度rho;C作为p的函数。其他参数为r = 0.3,N = 500, lang;krang; = 20。

我们现在考虑的是qne;1的情形。图4显示了对不同的q值,合作者密度rho;C作为p的函数,与其他相关参数r = 30,N = 500, lang;krang; = 20。对任何q,也存在一个p的中间范围使合作水平最大化。当q减少,最大rho;C转移到正确的位置。我们也计算了一些其他r值的情况,发现在主要结果中没有本质区别。

  1. 平均差分析

在自适应网络中,为了理解上述结果,我们在这里利用近似平均场(MF)的方法提供了一些分析说明。首先,我们介绍一些量来描述系统的状态:(i)磁化强度m = rho;C minus; rho;D,其中rho;D是背叛者的密度;(ii)策略C中参与者连接的数量NlCC;(iii)相反策略中参与者连接的数量,即主动连接NlCD = NlDC。因为保护规则rho;C rho;D = 1, lCC l

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[146476],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。