在公共产品博弈中基于声誉和习惯的可持续合作外文翻译资料-外文翻译网

英语原文共 6 页，剩余内容已隐藏，支付完成后下载完整资料

在公共产品博弈中基于声誉和习惯的可持续合作

摘要：声誉可以促进人与人在公共产品博弈中的合作，而人与人之间的合作不是单纯的经济理性行为，所以习惯也会影响他们的行为。一个人的习惯可以通过日常生活中的重复行为来形成，同时也会受到习惯偏好的影响。我们旨在调查基于声誉和习惯形成的可持续合作，为了更好地调查声誉和习惯偏好对合作的演变和可持续性的影响，我们引入了三种类型的agents到空间中的公共品博弈。通过数值模拟，我们发现较大的习惯偏好使合作更容易产生和维持。另外，我们发现一定数量的想要获得更高声誉（ICs）的agents对合作的可持续性有最好的效果。最后，我们发现ICs捐赠的变化会很大程度上的影响公共品博弈的均衡性。当ICs减少他们的捐赠时，适当的贡献对维持合作行为将会更好。

1.介绍

每个人都可以自由使用的公共物品的问题曾在很多社会困境中出现（Hardin, 1968,1998;Berkes et al.,1989;Ostrom et al.,1999;Orbell and Dawes, 1996）。因此，对于研究人员来说，促进合作是一个长期的追求。演化博弈理论已经成为研究各种社会困境合作最普遍的方法之一（Nowak，2006）。在演化博弈论体系中，公共产品博弈（PGG=Public Goods Game）被认为是研究合作演化的经典模型（Binmore，1994）。在一个经典的公共产品博弈（PGG）中，选择合作的个体会为公共池贡献c，而背叛个体选择不贡献。总贡献值乘以因子r，然后分配给所有小组成员。在这里，我们就可以发现背叛总是最好的策略。合作已经成为一种社会困境（Wanget al.,2009; Axelrod and Hamilton, 1981; Wedekind and Milinski,2000; Rand and Nowak, 2013）。

习惯上，参与公共产品博弈（PGG）的agents都被认定为理性和利己主义者。然而，最近很多研究表明，无论出于何种目的，许多人都愿意为公共物品作出牺牲（Hauser et al.,2014）。为了解释合作行为的产生和维持，已经提出了许多促进合作的机制（Wu et al., 2014; Chatterjee et al., 2012; Milinski et al., 2002; Rocaand Helbing, 2011;Lu,2015;Forsyth and Hauert, 2011; Ohtsukiet al.,2015）。Hauert等人提出了PGG的自愿参与机制，并发现合作可以由孤独者推动（Hauer and Szaboacute;，2003;Hauert et al.,2002）。Santos等人指出，社会多样性可以促进和保持合作行为，并解释了基于声誉和惩罚的合作的产生（Santos et al.，2008）。Cheng-YiiXia等人介绍了有不同策略转移可能性的人可以推动合作（Zhu et al.,2014）。

更重要的是，许多理论学家已经表明合作也可以通过间接互惠来促进（Nowak and Sigmund,2005, 1998; Lotem et al., 1999）。人们通过帮助他人建立良好的声誉或者正面的形象（Nowak and Sigmund, 1998,2005; Alexander, 1987）。Milinski的研究表明，当人类的主动与间接互惠博弈交替时，这种交替能够在公共品博弈（PGG）中产生高水平的合作（Semmann et al.，2004）。Semmann等人（2005）研究表明，声誉是促进公共品博弈（PGG）合作和维持公共资源的动力，人们很有可能做出更多贡献，同时这些额外的捐赠可以提高他们的声誉（Vugt and Hardy，2010）。实际上，这与现实情况非常相似。总有一些人给公共社会捐赠为了赢得声誉，比如一些企业家。他们希望通过慈善捐赠来建立良好的声誉，然后他们可以通过良好声誉获得一定的好处，从而使他们长期受益（Wedekind and Braithwaite，2010）。事实上，人们生活在不同的社交网络中，他们的行为将在许多网络中被观察到，当不同的网络交织在一起时，由于总体收益的变化，会影响到人们的合作水平（Deng et al.，2016）。如果我们对其他人慷慨，此时那些正在观察我们的行为的，我们称之为观察者的人，会认为我们也会慷慨地对待他们。相反，如果我们很讨厌别人，观察者们在将来会希望避免与我们打交道。声誉在社交网络中发挥着重要作用，并且会创造出那些非合作者无法获得的机会（Van Vugt et al.，2007）。因此，在人们作出决定时，不仅要考虑到PGG的收益，还要考虑他们在其他网络中行为的收益。这就是我们称这些收益为长期利益，并且有人愿意贡献更多的原因。例如，许多企业家会做慈善事业，以建立良好的社会声誉。这些行为可以提高他们的品牌知名度，使他们能够获得更多的收益，就像广告一样。然而，捐赠者不会一直在现实世界中捐赠更多的公共产品，这是为了方便在某个时候减少捐赠的数量。此外，他们的声誉也将随着捐赠数量变化而变化。

因此，根据这种情况，我们这里的目标是调查合作的可持续性。现有的研究主要介绍了声誉机制可以推动合作行为。如上所述，一些人例如企业家愿意为了获得从他人来的声誉而贡献更多。这些思想促使他们在公共品博弈（PGG）中进行合作，并且他们的行为会对邻居产生影响，从而能显著促进合作。尽管如此，在现实世界中，他们捐赠的边际效用将会下降。由于敏感性下降，邻居们会慢慢适应他们的行为（Wathieu，2004），这意味着他们声誉的增加将逐渐减少。因此，他们将来会减少捐款。当时合作行为会如何改变？我们假设三种类型的agents随机分布在一个正方形格子上（Roca et al., 2009; Nowak and May, 1992; Szolnoki et al., 2009a; Liet al., 1847; Wang and Chen, 2015），包括投资者（IC），合作者（C），叛逃者（D）。投资者是想通过得到声誉而获得长期利益的人，他们总是合作，但他们可以独立地改变他们的捐款。他们将空间公共品博弈（PGG）中开始时贡献更多并且在未来减少贡献。当他们提供额外的捐赠时，他们的声誉将会增加，相反，当他们减少捐款时，声誉会减少。他们声誉的价值将受到一个参数h的影响，我们称之为习惯偏好，它表示ICs额外的贡献或减少的贡献造成的影响程度。值得注意的是，投资者贡献更多的目的是为了获得长期利益，因此我们可以将他们的声誉视为他们在PGG中获得的好处。基于上述假设，我们主要研究投资者的重要性和观察习惯偏好的影响，ICs的数量以及其捐赠变化对空间公共品博弈（PGG）合作演化的影响。本文组织如下：我们在第二部分介绍了我们的模型。在第三节中给出数值模拟结果。在第四节中提供结论。

2.具有三种类型agent的PGG模型

在具有周期性边界条件的Ltimes;L规则网格上，我们用三种类型的agents（ICs，Cs和Ds）模拟我们的模型。我们假设N个agents随机分布在方格中，每个agent i有k个邻居。最初，ICs的比例是动态的以满足实验需求。其他agents被认为是等概率的Cs和Ds。同时，每个agent将同时做出决定。

每个agent加入到G=k 1个公共品博弈（PGG）组中（Szaboacute; and Fath，2007），并根据下面的公式计算回报

（1）

其中r（1lt;rlt;N）代表协同因子（Szolnoki and Perc，2010）; 表示agent i（IC，C，D）参与的公共品博弈（PGG）组的集合。j是一组公共品博弈（PGG）组中的一个。和表示分别在公共品博弈（PGG）组j中的ICs和Cs的数量。（=u）代表IC agent捐赠的数量。（ = 1）表示C的捐赠。是PGG组j中中央代理的邻居数量。是公共品博弈（PGG）组j中中心agent邻居的数量。是agent i的声誉。我们假设只有ICs有声望，所以和被设置为0. 由等式（3）和（4）计算，/50是agent i通过声誉获得的的长期利益,只有ICs有这些好处。/50有两个原因,首先，从现实的角度来看，投资者可以通过声誉获得收益,然而，如上所述，收益是一种长期利益,这意味着声誉无法立即成为收益,所以这里50可以被视为声誉的时间成本。其次，就数学而言，Ri由方程式（3）和（4）计算，若的数值太大，会让演化过程损失一定的真实性，50是通过实验演化的适当值，它能够使模型更加准确。

此外，想要获得声誉的ICs始终与团队合作并给团队贡献u，随着时间的推移，他们的声誉会随之增加，他们的策略难以被其他人改变，然而Cs和Ds更容易受到ICs的影响。因此，agent Cs和Ds将通过以下列概率随机选择其邻居j（Szaboacute;和Fath，2007）更新其策略：

（2）

其中K表示邻居噪声的影响，我们在此基础上设定K=0.1（Szaboacute; and Hauert，2002）。根据这个公式我们可以知道，具有较高回报的agent将会以高概率被选择。

一开始，我们假设ICs为团队贡献u=2，同时他们的声望会随着时间增加，但声誉的增加会随着时间的推移而减少。在现实世界的系统中，像ICs这样的人也无法一直获得别人的声誉，因此他们的声誉是具有临界的数值。声誉的增加受到参数h的影响，我们称之为习惯偏好。所以我们可以按如下方式计算ICs的声誉：

（3）

当他们的声望达到最高时，声誉不会随着时间而提高。首先，系统将达到平衡，当tle;1000时，为了观察系统的稳定性，我们不会改变u的值。然后当tgt;1000时，我们降低u的数值。而ICs的声誉将会改变如下：

（4）

其中R（t）表示在t（tgt;1000）时间步长的ICs的声誉，并且R（t）的值总是正的。等式（3）和（4）是用来计算投资者每隔一个时间步长的声誉值。前者等式（3）表明声誉的提升，h表示习惯偏好，u表示ICs的捐赠，u设为2。u-1意味着如果贡献更多的钱，ICs可以获得更多的声誉，反之亦然。1-ht表示声誉增加值会随着时间的推移而减少。对于等式（4），首先，我们应该知道，当tgt;1000时，我们减少u的值，然后IC的声誉开始下降,所以当我们计算ICs的声誉时，我们需要减去1000。2-u意味着如果他们减少更多的钱，声誉会降低得更快。这两个等式都表明ICs的行为可能会失去声誉。然而，他们行为的影响会随着时间的推移逐渐减少并最终消失。

Fig.1 对于不同h值的合作者比例（P）的随时间的演变。最初，ICs的比例被设定为0.25,Cs和Ds的比例分别设为0.375，u的值设为2。当tgt;1000时，u的值为1.2，h的值设定为0.0004,0.0006,0.0008和0.001。图形中的每个数据都是在经过20次独立运行的5000个时间步长后，以平均1000多个时间步长获得的。

3.仿真和分析

在平方格上，有许多研究合作演化的仿真，以前的研究表明，只有当公共品博弈（PGG）中的r/Ggt;0.76时才能出现合作（Szolnoki et al.，2009b）。因此，主要参数设定为L=100，N=Ltimes;L=10,000，协同因子r=3（对结果的影响不明显）。冯诺依曼邻居数量k=4。其他重要参数提供如下分析：

图1显示了演化过程中不同h对应的合作的比例P。首先，我们只考虑ICs声誉的增长过程，在此期间，我们可以看到，与反叛策略对比合作战略是一种平衡方法，然后我们将u的值减小到1.2。毫不奇怪，合作者的比例会急剧下降，但随着时间的推移，合作行为会得到明显的提高。图2显示了许多agents在t=100时的反叛，只有一些小的合作集群会抵制背叛者的产生（Wang and Chen，2015）。一方面，ICs减少了他们的捐款，他们将被大多数邻居视为反叛者；另一方面，ICs仍然可以用声誉影响其邻居，所以ICs的大多数邻居都会反叛。然而，随着时间的推移，图3显示IC的声誉正在下降，这意味着他们对邻居的影响力会下降。从图3可以看出，随着ICs声誉的下降，合作者的比例将会增加。另外，图1指出agents在有较大的h的情况下会尽快达成合作。较大的h也可以慢慢地提高声望。这也意味着ICs的声誉可能会更快降低，因此较大的h可以加速合作。例如，北京政府在2014年提高了地铁票价，最初，许多公民对这项政策并不满意，但是，他们在外出时习惯于乘坐地铁，随着时间的推移，他们接受价格上涨。因为政府提供地铁是为了让公民养成习惯，这意味着它会创造了公民的需求以至于人们不想改变他们的习惯，因此他们愿意为这项公共利益付出代价。

Fig.2 系统特征快照，包括不同时间步长的ICs（黄色），Cs（蓝色）和Ds（红色）。最初，ICs的比例设定为0.25，Cs和Ds在整个正方形网格上随机分布。参数值是h=0.001，r=3，u=1.2。（a）t=0，（b）t=1000，（c）t=1001，以及（d）t=5000.（为了解释这个图例中的颜色参考，读者参考web版文章）。

Fig.3 合作者比例和ICs的声誉随时间演变。最初，参数值是h=0.001，r=3，u=2。当tgt;1000时，u的值被设置为1.2。图形中的每个数据都是在经过20次独立运行的5000个时间步长后，以平均1000多个时间步长获得的。

Fig.4 ICs的不同部分的合作者比例（P）的随时间的演变。初始时，h的值被设置为0.001并且u的值被设置为2。当tgt;1000时，u的值被设置为是1.2，IC的比例设定为0.1,0.2和0.3。图形中的每个数据都是在足足20次独立运行的5000个时间步长之后，以平均1000多个时间步长获得的。

Fig.5 不同的u对应的合作演化。最初，ICs的比例设定为0.25。Cs和Ds的分数分别设定为0.

全文共8049字，剩余内容已隐藏，支付完成后下载完整资料

资料编号：[14324]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

以上是毕业论文外文翻译，课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

在公共产品博弈中基于声誉和习惯的可持续合作外文翻译资料

您可能感兴趣的文章

登录

您可能感兴趣的文章