英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
第六届自动谈判代理竞赛(ANAC 2015)
Katsuhide Fujita, Reyhan Aydo˘gan, Tim Baarslag, Koen Hindriks, Takayuki Ito and Catholijn Jonker
摘要 在2015年的五月,我们与AAMAS 2015联合举办了第六届国际自动谈判代理竞赛(ANAC 2015)。ANAC是一项国际性的竞赛,它挑战研究人员在没有关于对手的完整信息的情况下开发一个成功的自动谈判器。本次竞赛的目标之一是帮助指导多议题谈判领域的研究,并鼓励设计能够在各种场景下运行的通用谈判代理商。来自9个不同研究机构的4个团队参加了2015年的ANAC。本文介绍参赛代理人和比赛设置,包括比赛中使用的不同谈判场景。我们报告了比赛的资格赛和决赛的结果。
K. Fujita (B)
东京农工大学工学部,日本东京
e-mail: katfuji@cc.tuat.ac.jp
R. Aydo˘gan
计算机科学系,土耳其伊斯坦布尔Ouml;zye˘gin大学
e-mail: reyhan.aydogan@gmail.com
T. Baarslag
英国南安普敦南安普敦大学代理,互动和复杂组
e-mail: tb1m13@ecs.soton.ac.uk
T. Ito
日本爱知县名古屋市技术工业管理局(MTBA)
e-mail: ito.takayuki@nitech.ac.jp
K. Hindriks ・ C. Jonker
荷兰Delft代尔夫特理工大学人机交互组
e-mail: K.V.Hindriks@tudelft.nl
C. Jonker
e-mail: C.M.Jonker@tudelft.nl
copy;斯普林格国际出版公司2017年K. Fujita等人 (编辑),基于代理的复杂的现代方法,自动谈判,计算智能研究674,DOI 10.1007/978-3-319-51563-2_9
1引言
成功开发具有谈判能力的自动化代理具有很大的优势和意义。为了帮助重点研究精通谈判自动化代理,我们组织了自动化谈判代理竞争(ANAC)。不同实现的结果很难比较,因为在ad hoc协商环境中使用各种设置进行实验[6]。ANAC的另一个目标是建立一个社区,进行谈判工作可以通过标准化谈判基准来比较代理人,以评估新代理人和现有代理人的表现。最近,ANAC的分析成为多智能体系统中自动化谈判的重要领域[1]。在设计熟练的谈判代理人时,标准的博弈论方法不能直接应用。博弈论模型假定完整的信息设置和完美的合理性[8,9]。然而,人类的行为是多样的,不能被整体模型所捕捉。人类倾向于犯错误,并且受到认知,社会和文化因素的影响[7]。 克服这些限制的手段是使用启发式方法来设计谈判代理。 在使用启发式方法设计谈判代理时,我们通常需要通过模拟和实证分析进行广泛的评估。我们采用的环境使我们能够在谈判中评估代理商竞争:天才[6],与智能交流的一般环境
多用途使用Simulation.Genius有助于促进设计和评估自动谈判者的策略。它允许轻松开发和集成的现有谈判代理人,并可用于模拟个人谈判会议,以及各种谈判中谈判代理之间的比赛场景。可以熟练地进行谈判的通用自动化代理的设计是具有挑战性的任务,因为设计师必须考虑不同的可能环境和限制。通过允许不同的规格,Genius可以协助完成这项任务
协商域和偏好配置文件通过图形用户界面。可以用来通过与自动化谈判的方式来培训人类谈判者代理商或其他人。此外,它可以被用来教通用的自动谈判代理的设计。
首届自动化谈判代表大赛(ANAC 2010)举行在2010年5月,在AAMAS 2010大会期间进行决赛。 七个团队参与并使用了三个领域。 由TheNagoya Institute of Technology团队生成的AgentK获得了ANAC 2010 [2]。 第二届自动谈判代理竞赛(ANAC 2011)于2011年5月在AAMAS 2011大会上举行。 18个团队参与并使用了8个领域。ANAC 2011的新功能是折扣因素。 由代尔夫特理工大学生成的HardHeaded获得了ANAC 2011 [3]。 第三届自动化谈判代表大赛(ANAC 2012)于2012年5月在AAMAS 2012大会上举行。 17个参赛队参加了比赛,并使用了24个领域。ANAC 2012的新功能是保留价值。 CUHKAgent生成由香港中文大学获得ANAC 2012 [10]。 第四届自动谈判代理人...
自动谈判代理竞赛(ANAC 2013)与AAMAS 2013会议于2013年5月举行。 共有19支参赛队伍和24个领域被使用。 ANAC 2013的新特点是代理商可以使用投标历史记录。由代尔夫特理工大学生成的福克斯荣获2013年ANAC大奖
[5]。 第五届自动谈判代理竞赛(ANAC 2014)与AAMAS 2014会议在2014年5月举行。21个参赛队和12个参赛队域被使用。 ANAC 2014的新功能是非线性效用函数。由名古屋技术学院生成的AgentM赢得了ANAC 2014 [4]。
ANAC组织者每年都会使用一些新功能来开发ANAC竞赛和自动化谈判社区。 2015年ANAC的挑战是在与两个对手同时谈判的时候达成协议。 此外,效用函数又是线性的,就像它们在ANAC 2010-2013中一样。 多玩家协议是双向交替提供协议的简单扩展,称为多方协商堆栈交替提供协议
(SAOP)。
ANAC 2015的时间表主要由两部分组成:资格赛和决赛。 首先,为了挑选入围决赛,进行了资格赛从24个代理人考虑个人效用和纳什产品。 在里面资格赛,24名代理被随机分为四组(池),并且这些池中最好的两个代理进入每个类别的最后。 之后,最后一轮是在两个类别的8个代理之间进行的,赢得了资格赛回合。 在排位赛和决赛中的领域和偏好简介是由组织者生成的10个域名。 整场比赛中,在8名球员进行在每个类别中,ANAC 2015的排名是确定的。
本章的其余部分安排如下。 第2节提供了一个概述ANAC的设计选择,包括谈判模式,锦标赛平台和评估标准。 在章节 3,我们介绍ANAC的设置2015年接着是章节 4介绍布局竞争的结果。 最后章节 5介绍轮廓我们的结论和我们未来比赛的计划。
2ANAC 2015的组织
2.1谈判模式
鉴于介绍中概述的目标,在本节中我们将介绍该设置和ANAC中使用的协商协议。谈判之间的相互作用缔约方由一个谈判协议来规定,该谈判协议定义了如何和何时的规则建议可以交换。双方就一系列问题和每个问题进 行谈判有一个相关的选择范围或值。谈判结果包括每个问题到一个价值的映射,以及所有可能结果的集合Omega;被调用谈判领域。该领域是谈判各方的常识并在单个谈判会议期间保持不变。除域之外,双方也都有偏好配置文件在Omega;之上描述的私人偏好。这些偏好使用映射可能的效用函数U来建模结果omega;isin;Omega;到范围[0,1]中的实数值。在ANAC 2015中,效用是线性相加的。也就是说,整体效用包含一个加权和每个问题的效用。虽然领域(即结果集合)是常识,每个玩。家的偏好情况都是私人信息。这意味着每个玩家只能访问自己的效用函数,而不能知道对手的偏好.1此外,我们使用术语场景来指代到域和一对偏好配置文件(针对每个代理)的组合。
最后,我们用截止日期,保留价值和贴现因子对其进行补充。这样做的理由既务实又有利于从理论角度提高竞争力。 此外,与固定轮次数相反,折扣因子都是实时测量的。 尤其是,它引入了另一个不确定因素,因为目前还不清楚会有多少次谈判回合,以及对手需要多少时间来计算还盘。 在ANAC 2015中,折扣因素和预留值取决于场景,但截止日期设置为3分钟。 ANAC 2015中折扣因素的实施如下:
谈判持续一段预定的时间(秒)(截止日期)。 时间轴被标准化,即:时间tisin;[0,1],其中t = 0表示谈判的开始,t = 1表示最后期限。 当代理商可以在截止日期前达成一致时,每个代理商的个人效用就是预留价值。 除了截止日期之外,情景还可能包含折扣因素。 随着时间的流逝,折扣因素会降低谈判中出价的效用。 令[0,1]中的d为折扣因子。 设[0,1]中的t为时间线定义的当前归一化时间。 我们计算来自未折现效用函数U的结果omega;的折扣效用UtD如下:
UtD (omega;) = U(omega;) · dt
在t = 1时,原始效用乘以折扣因子。 此外,如果d = 1,电力公司不受时间影响,并且这种情况被认为是未折扣的。
在竞争中,我们使用多层协商的堆叠式交换协议(SAOP)作为新特性,协商各方轮流交换报价。 桌子周围的所有参与者都会轮到每一轮;轮流在桌子周围按时间顺序进行。 第一方立即开始与所有其他人观察到的要约谈判。 无论何时提出要约,下一方可以采取以下行动:
注1我们注意到,在比赛中,每个代理都播放所有的偏好配置文件,因此它会理论上可以学习对手的偏好。 但是,这些规则明确禁止在谈判会议之间进行学习,并且只在谈判会议内进行。 这样做是为了代理商需要设计来处理未知的对手。
第六届自动谈判代理...
bull;提出还价(从而拒绝并覆盖以前的报价)
bull;接受报价
bull;离开(例如,在没有任何协议的情况下结束谈判)
这个过程以时钟方式轮流重复,直到达成协议或达到最终期限。 为了达成协议,各方都应该接受这个提议。 如果在最后期限未达成一致,谈判就失败了。 下一章将介绍SAOP的细节。
2.2运行锦标赛
作为运行和分析谈判的锦标赛平台,我们使用Genius环境(通用环境与智能多用途模拟的谈判)[6]。 Genius是一个自动化多问题谈判的研究工具,有助于自动谈判策略的设计和评估。它还提供了一个易于访问的框架,通过公共API开发谈判代理。 这种设置使执行代理变得简单,并专注于在一般环境中工作的策略的开发。
Genius结合了一些旨在支持一般自动谈判者设计的机制。 第一种机制是分析工具箱,它提供了各种工具来分析代理人的表现,谈判的结果和动态。 第二种机制是域和实用程序功能的存储库。 最后,它还包含自动谈判人员的知识库。 另外,Genius可以评估使用该工具设计的自动代理所使用的不同策略。 这是一个重要的贡献,因为它允许研究人员通过经验客观地将其代理人与不同领域和环境中的代理人进行比较。
2015年ANAC的时间表包括两个阶段:资格赛和最后一轮。 比赛期间使用的域名和偏好配置文件未提前知道,由组织者设计。 代理人的成功是
在所安排的锦标赛的所有谈判中使用评估指标进行衡量。
首先,为了从参赛队提交的24名代理中选出入围名次,进行了资格赛。 由于代理人太多,在不同的领域,排位赛中的整个比赛是不可能的。 因此,24个代理人被随机分为四个组(池),每个池中纳什产品和个人效用中最好的两个代理人进入最后一轮。 花了两周的时间才完成了预选赛的所有资格赛。 在ANAC-2015中,我们不允许资格赛和最后一轮之间的更新代理
最后一轮是在排位赛中取得最佳成绩(个人效用和纳什产品)的代理商中进行的。 我们在ANAC 2015的最后一轮准备了两个类别:个人实用类别和纳什产品类别。 域和偏好配置文件与资格轮相同。 整个比赛在代理商之间发挥,并且决定了ANAC 2015的最终排名。 为了减少结果变化的影响,最终得分计算五次试验的平均值。
3竞争领域和代理商
3.1情景描述
ANAC的目标是在不确定的开放环境中为多问题谈判建模,其中代理人不知道对手的偏好情况。 谈判场景的大小,问题数量,反对,折扣因素和预留价值等各种特征对谈判结果都会产生很大影响。因此,我们在竞争中产生了十种类型的领域和概况。 特别是在资格赛和决赛中,我们使用了所有10种不同的折扣因子和预留值和资料。 换句话说,它们在问题数量,可能的提案数量以及偏好概况的反对方面有所不同(见表1)。 图1中用图形表示每个域中的3D协商空间绘图。
表1 ANAC 2015中使用的域
图1每个域的3D协商空间绘图
3.2代理描述
ANAC2015有24个代理商,分别来自7个国家的9个研究机构:中国香港大学,香港; 新加坡南洋理工大学;朗伊斯法罕大学; 名古屋工业大学,日本; 东京日本农业技术大学; 代尔夫特理工大学,荷兰; 荷兰马斯特里赫特大学; 挪威科学大学和挪威科技局; 美国塔尔萨大学。 表2显示了所有参与者在ANAC 2015年。
决赛入围者是资格赛的获胜者。 在本书的其余部分,我们
提供ANAC2015入围者个人战略的章节。
4比赛结果
我们描述了排位赛和决赛的结果。
4.1资格赛
首先,为了从参赛队提交的24名球员中选出入围名次,进行了资格赛。 24名代理被随机分为四组(池),每个组中最好的两个代理商
全文共8661字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[15009],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。