英语原文共 14 页,支付完成后下载完整资料
决策支持系统87 (2016)80-93
内容列表可在ScienceDirect上找到
决策支持系统
我们的主页:www.elsev ie r .com/ locate /dss
基于会员贡献的群组推荐系统
王伟,张广泉*,陆洁
澳大利亚悉尼工业大学工程和信息技术学院量子计算和智能系统中心决策系统和电子服务智能实验室
文章历史:
2015年5月20日
2016年5月10日收到修改后的表格,接受2016年5月10日
2016年5月18日在线
在许多在线服务系统中,开发群组推荐系统(GRSs)是在涉及到一组用户的上下文中提供推荐的重要需求。不幸的是,传统的个人推荐技术不能有效地支持GRSs,因为它需要新的模型来达成一致,以满足这组成员的所有成员,因为他们的偏好相互冲突。我们的目标是通过对各成员的重要性进行加权,将各成员的贡献考虑进去,从而产生建议。为了实现这一目标,我们首先提出了一个成员贡献评分(MCS)模型,该模型采用可分离的非负矩阵因子分解技术对一个组评价矩阵,分析每个成员的重要性程度。然后,一个基于曼哈顿距离的当地平均评级(MLA)模型被开发出来,通过解决胖尾问题来细化预测。通过集成theMCS和mlamodels,开发了基于成员贡献的群组推荐(MC-GR)方法。实验表明,我们的MC-GR方法在群体推荐的性能上取得了显著的改善。最后,利用MC-GR方法,我们开发了一个名为GroTo的团体推荐系统,可以有效地向基于网络的旅游团体推荐活动。
爱思唯尔版权所有
关键词:
推荐系统
群组推荐系统协同过滤
旅游
电子商务
1. 介绍
许多在线服务,如电子商务、电子政务、电子学习等,都存在信息过载的问题,即用户可获得的信息量大,很难找到用户最需要的信息[1-3]。推荐系统是通过分析用户的个人偏好和目标相关信息来解决这一问题的最成功的技术之一。
虽然在改进推荐系统方面已经取得了重大进展,但以前的大多数推荐系统研究都集中于向个人用户(企业或客户)提供推荐。群组推荐系统(GRSs)最近被提出,为用户群体提供推荐。GRSs必须对用户的最新偏好做出响应,并提出满足整个群体的建议。GRSs已经在许多服务领域中设计和实现。Sharon等人设计了一种网络浏览器GRS,它为一组具有类似导航历史的浏览器推荐相关链接。[5]提出的另一个名为GRec_OC的示例可以推荐文本信息
并为在线阅读社区推荐书籍。除了文本推荐外,还可以推荐多媒体内容。例如,[6]建议家庭观看电视节目,而不是个人观看;[7]可以为一群朋友推荐电影;而[8]中的MusicFX则是为了在健身房播放适合所有人口味的音乐而设计的。当为不同类型的旅游团(如带孩子和老人的家庭)推荐旅游计划时,[9]的情况就更加复杂了。
从形成的角度看,GRSs中无论系统域如何,都有两种主要的组类型:稳定组和随机组[10]。稳定组的成员可以主动加入或离开组,并可以指定他们的首选项。在这样的组中,成员之间具有高度的内部相关性,因此随着时间的推移,组首选项可以集中起来,并且可以很容易地找到满足组中每个成员的项。例如,一个阅读小组可能会缩小阅读范围,最终专注于现实主义小说或诗歌。相反,随机群体是由成员被动地组成的,他们没有机会指定自己的偏好或协商一致的偏好。这些随机群体可能是同质的,具有高度冲突的群体偏好;例如,派对上所有人都应该听的音乐类型。
在GRSs中,大多数关于组偏好建模的工作都是基于评级信息,当评级矩阵是稀疏的或者组是大的时候,这些信息可能并不准确。许多研究人员试图解决这一问题,但他们只关注于通过引入额外的信息(如社交信息)来构建复杂的个人偏好
⁎通讯作者:决策系统和e-Service情报(DeSI)实验室,量子计算与智能系统中心(QCIS) 123年悉尼科技大学的邮政信箱,百老汇,2007年新南威尔士,澳大利亚。
电子邮箱:Wei.Wang-17@student.uts.edu.au (W. Wang), Guangquan.Zhang@uts.edu.au (G. Zhang), Jie.lu@uts.edu.au (J. Lu)。
http://dx.doi.org/10.1016/j.dss.2016.05.002
爱思唯尔版权所有
81 W。王等/决策支持系统87 (2016)80-93
网络信息、标签或上下文信息,用来描述成员的互动或个性[7,11 - 14]。然而,没有普遍接受的跨应用程序域的附加信息可用,并且在许多场景中没有机会访问关于随机组中的成员的附加信息。
群体的类型影响GRS的设计,而向随机群体提出建议的一个主要问题是,当成员在不考虑其他成员偏好的情况下追求自己的个人偏好时,会出现偏好冲突。当涉及到更大的随机群体时,这个问题会变得更糟,因为为不同的利益找到一个折衷方案更难建模,因此更难以提出建议。减少冲突的一个合适的解决方案是考虑和数值评估群体和个体成员之间的关系,并根据代表性成员的偏好对群体概况进行建模。更具代表性的成员的偏好超过了代表性较差的成员,这确保了GRSs能够在组配置文件之间建立一个高水平的折衷。然而,与处理偏好冲突类似,大多数计算代表性偏好的工作需要额外的信息,如社会关系或信任网络[15]。
本研究的目的是开发一种群组推荐方法,通过对贡献成员评分的分析,建立偏好模型,最大限度地提高随机群组的满意度。我们的建议以子评级矩阵的形式衡量每个成员的重要性,这使得即使在矩阵高度不完整和稀疏的情况下也是可行的。该方法包括两个主要阶段:(1)组概要生成器和(2)建议生成器。我们首先为第1阶段提出一个成员贡献评分(MCS)模型。在第2阶段,我们开发了一个基于曼哈顿距离的本地平均评级(MLA)模型,该模型通过对一组与目标项目接近的缩小后的项目进行评估来解决胖尾问题。通过集成MCS和MLA模型,提出了一种基于成员贡献的群组推荐(MC-GR)方法。最后,介绍了一个团组推荐系统及其在网上旅游团组中的应用。
本文的贡献可以总结如下:
1)针对一般的群组推荐问题,提出了基于成员贡献的群组推荐(MC-GR)方法,即只考虑评级信息,不需要额外的信息,根据成员贡献生成群组简介。实验结果表明,该方法的性能显著优于同类基线。
2)建立MCS模型,利用子评级矩阵来度量成员贡献,利用可分离非负矩阵因子分解(SNMF)来识别有代表性的成员,并计算相应的贡献。因此,即使在评价矩阵高度不完整和稀疏的情况下,也可以精确地建模群轮廓。
3)提出一种基于曼哈顿距离的模型,获取群体平均评级的局部近似,提高预测精度,从而缓解潜在的胖尾问题。
本文的其余部分组织如下。我们在第2节中回顾了个人推荐方法和对团体推荐方法的关键改进。第3节详细介绍了MC-GR方法。实验和结果分析见第4节。针对基于网络的旅游群体开发了一个群组推荐系统GroTo,其框架如第5节所示。第六部分是结论和进一步的研究。
2. 文献综述
在本节中,我们将介绍生成个人和组建议的两种一般方法。我们回顾这两种方法,因为要聚合单个建议或构建
小组简介需要了解个人推荐方法。我们还提出了一些与这些方法相关的详细方法,并在此基础上讨论了这些方法和现有方法的局限性。
2.1。基于单独协作过滤的方法
大多数grs允许用户将自己的首选项指定为标量评级(例如从1到5)或二进制评级(例如对帖子的大拇指)。基于评分的协同过滤(CF)技术在GRSs中得到了广泛的应用。一些先进的个人推荐方法[17]超出了本文的范围,将不再介绍;相反,我们回顾了两种最流行的CF推荐方法:基于项目的CF (ICF)和基于用户的CF (UCF)。ICF方法推荐与用户以前喜欢的项目[18]相似的项目,而UCF方法推荐具有共同兴趣的人喜欢的项目。未知秩可以通过加权平均、平均z分数、平均离均值偏差等聚集方法进行预测[19,20]。
2.1.1。基于项目的方法
ICF方法首先测量项目之间成对的相似性。一旦获得了这些相似性,就可以预测未知的评级,并确定与过去的首选项相似的项目。ICF方法的目的是推荐最接近前k的项目,如式(1)所示。我们表明,对于用户uisin;u的iisin;i, ru,为了预测未观测到的打分ru,i可以通过对u观测到的打分的加权平均,再加权相应的相似项,来估计i。
俄文,我frac14;rithorn;
sum;俄文;j - r j相似度i;jeth;THORN;
sum;相似我;jeth;THORN;j j eth;1THORN;
2.1.2。基于用户的方法
相比之下,UCF方法首先度量用户之间的相似性。未观察到的打分ru, i,是由用户u对项目i的打分,由与u有相似偏好的用户打分来预测,预测方程如式(2)所示。
俄文,我frac14;俄文thorn;
sum;rv;i - rv相似度u;veth;THORN;
sum;u相似;veth;THORN;j j eth;2THORN;
ICF和UCF也称为基于邻居的方法,因为它们分别标识相似的项或用户。显然,一旦我们可以为一个伪用户建模,该用户的配置文件表示整个组的偏好,UCF方法就可以用来生成组推荐。
2.2。组推荐方法
根据应用程序场景,组定义过程可以是主动的,也可以是被动的。有些场景允许用户主动地声明他们在特定的组中,而在其他场景中,用户被被动地分配到组中。例如,阅读小组的成员积极地组成小组,然后为所有成员获得推荐书籍。另一方面,当人们因为参加一个音乐节目而被动地成为一个群体时,对其他音乐节目的推荐不能仅仅基于一个人的出席。在这两种情况下,当群组推荐系统为系统用户提供一般性的项目(如书籍或音乐)时,可以将其定义为R。然后系统确定组中的所有成员,并在组形成后作为单个实体为他们提出建议。我们将R中的所有项表示为I,所有用户表示为U,组表示为G,其中Gisin;U是集合
82 王等/决策支持系统87 (2016)80-93
积极收集的用户(例如,选择相同的阅读小组的人)或被动(如参加节目的人),而他们的偏好或资料收集的R组推荐系统可以表示成三元组〈R, G,〉,选择一个条目的数量的年代isin;我匹配尽可能多的G的偏好。
许多grs了[21],一般来说,大多数现有的推荐方法在grs可以分为两类,如图1中所示:(a)聚合个人偏好,这个概要文件的伪用户建模通过聚合个体成员的偏好来代表整个群体的偏好,然后伪用户的配置文件是用于生成组建议;(b)聚合个别建议,其中个别成员的建议是独立产生的,而小组建议是通过聚合个别建议[22]产生的。在[23]中对这两类方法进行了比较,发现前者略优于后者。伪用户方法的挑战在于,组成员可能并不总是共享相同的首选项,当对组概要文件建模以表示所有组成员的首选项时,可能会发生首选项冲突。一般来说,需要许多策略来减轻和尽量减少由偏好冲突引起的不满。
已有许多策略被用于对群体概况进行建模,其中大部分在[24]中进行了总结。我们将这些策略分为四类,以反映不同的观点。
bull;基于共识:公平;基于平均
bull;边缘:最少的痛苦,最多的快乐bull;独裁:最受尊重的人
在这四个类别中,基于多数的策略通常用于聚合个人推荐,而其他三个类别用于聚合个人偏好以构建一个群组概要。如前所述,在对组概要进行建模时,有两个方面需要重点关注。一是群体的共同利益,二是偏好冲突导致的失望;这两个方面驱动了生成小组建议的基本设计原则:最大限度地满足和最小化失望。以共识为基础、以多数为基础和以独裁为基础的战略被广泛使用,以最大限度地提高满意度;例如,[25]中的平均策略,以及[26]中用于汇总排名的平均策略的变化。边缘策略,如[27]中的最小痛苦策略,被用来最小化失望。有人提出了一种被称为“没有痛苦的平均”的综合策略[8,28],通过兼顾这两个方面来平衡这两个原则。然而,该策略需要确定一个阈值,该阈值将显式地排除不满足要求的成员。
让groupbeG和任何属于g的用户都是u, ProfileG和Profileu是对应的配置文件。策略可以总结为式(3)。
ProfileGfrac14;sum;uisin;Gomega;! uProfileu; eth;3THORN;
whereomega;!你是吞噬能力向量u和differentomega;!你导致了不同的策略。Whenomega;! ufrac14;1 jGj, Eq。(3)成为strategy.When平均
只有一个成员的权向量的元素等于1,其他成员的权向量为零,式(3)成为独裁策略。
通过提供复杂的模型来计算权重,已经提出了许多改进。要为复杂的组建模组概要文件,许多系统需要额外的信息,比如社会关系或标签。在[29]中,社会关系被用来确定最具代表性的衡量标准。这背后的基本思想是,用户倾向于购买那些用户的社交联系人首选的产品。[30,31]提出了一种集群体成员的社会利益和内容利益于一体的群体推荐方法。带有标记的pro-files组是由[11,32,33]构建的。这些改进的问题是,当所需的额外信息不可用时,它们就不能工作,而当涉及到随机组时,问题可能会更糟。例如,在飞机上识别一群陌生人之间的社会关系是困难的,乘客不可能事先标记他们的偏好。其他额外的信息,如领域知识,也应用于组概要文件的建模。旅游活动的用户原型是由[9,34]预定义的,用于为随机组建模伪用户概要文件,这证明是有用的;然而,也有必要将领域知识引入系统。在[35]中给出了一个包含领域知识的更复杂的例子,其中针对电视观众的不同偏好训练了三个支持向量机。综合三个方面与基于案例的推理相结合,构建整体的观看偏好。请注意,我们提到的独裁战略都依赖于吸收额外的信息。例如,在[23]中,家庭日志模型根据用户的评分数量对用户进行加权。所有这些改进都需要额外的信息来纳入评级。
另一种提高组概要建模效率的方法是,为组成员提供交互函数来显式地指定他们的首
资料编号:[3262]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。