基于犹豫模糊集的群体推荐外文翻译资料

 2022-01-06 21:12:23

英语原文共 20 页,剩余内容已隐藏,支付完成后下载完整资料


基于犹豫模糊集的群体推荐

豪尔赫 Castro,1,2,dagger;Manuel J. Barranco,3,Dagger;Rosa。

Luis Martiacute;nez3,lowast;

1格拉纳达大学计算机科学与人工智能系,西班牙格拉纳达E-18071

2大学量子计算与智能系统中心(QCIS)

科技悉尼,Ultimo NSW 2007,澳大利亚

3Jae#39;n大学计算机科学系,s / n 23071 Jae#39;n,西班牙

群体推荐系统(GRS)推荐由群体使用的项目,因为某些活动(例如,听音乐,看电影,在餐馆用餐等)是由分享他们的品味的人群执行的社交活动,以及他们的选择会影响所有人。GRS根据所有组成员偏好帮助人们在超载搜索空间中做出选择。通用GRS方案聚合用户首选项以生成组首选项配置文件。然而,聚合过程可能意味着信息的丢失,负面影响GRS的不同属性,例如群组推荐的多样性,这是一个重要的质量因素,因为这些推荐针对的是由具有个体和可能相互冲突的偏好的用户形成的群体。为了避免和管理由聚合引起的信息丢失,本文提出通过使用犹豫模糊集(HFS)来保持所有群体成员的偏好,并解释诸如群体犹豫之类的信息,这些信息将在群体推荐过程中使用。为了评估HFS GRS提案的性能和排名质量,进行了案例研究。QC 2017 Wiley Periodicals,Inc。

介绍

人们常常面临需要在众多选择中进行选择的情况:书籍,电影,餐馆,度假,电视节目等。推荐系统(RS)1–3在这些情况下帮助人们,其中大量的信息使得通过过滤无用的物品很难根据他们的口味或必需品找出相关的物品。在文献中,有不同类型RS,以下是最受欢迎的几款:(i)本研究中使用的协同过滤(CF)RS,4–7,(ii)基于内容的RS,8–11和(iii)混合RS。12,13主要差异在这些方法中,他们依靠提供建议的信息来源。

RS的性能通过精确度指标2进行了经典评估,但最近其他功能在RS的评估中变得越来越重要,例如多样性14,它测量系统推荐的项目与目标用户。多样性的改善会导致准确性降低15,因此应该考虑它们之间的权衡。因此,RS应该平衡两个功能以提供高质量的建议。

RS专注于向个人推荐项目。然而,存在具有社交特征的项目被群体消费,例如,一些想要在餐馆吃饭的朋友,选择要观看的电影,选择假日目的地等。在这些情况下,建议应该不满足仅限于一个独特的个体,也适用于整个群体。为了解决小组建议引入的问题,小组推荐系统(GRS)提出了已在文献中广泛探索的解决方案。16–18

传统的GRS基于面向个人的经典RS,其通过聚合机制扩展以解决一组用户而不是唯一用户。不幸的是,聚合过程可能意味着丢失有用信息,例如初始数据的分布,多样性或形状。这种信息丢失可能会导致偏差或导致错误的结果。因此,GRS的一个重要挑战是在信息融合期间保持关于该组的最大信息,以提供更好的建议。然后有必要找出并开发正确的偏好建模和信息融合工具,以在GRS中实现这一目标。

假设模糊集(HFS)由Torra19引入,作为模糊集20的扩展,其中,给定参考集,隶属函数不仅提供一个值而是一组它们,这提供了一种方式建模犹豫。因此,对于给定项目,我们可以解释不同用户对组的偏好,作为对这样的项目的偏好的群体犹豫。

我们的提议将包括基于CF和HFS的犹豫组推荐模型(HGRM),它能够向一组用户推荐,同时保持所有信息避免聚合过程。通过对广泛使用的RS数据集进行案例研究,然后讨论从不同观点(如准确性和多样性)获得的结果,将对该提案进行评估并与传统GRS进行比较。结果显示我们的提案与基线相比有一些改进。

此篇文章的结构如下。第2节提供了GRS和HFS的背景。第3节进一步详细介绍了我们的HGRM提案。第4节显示了为评估提案并讨论调查结果而进行的案例研究。最后,第5节总结了论文。

1.协作过滤。

正文前书页

本节回顾了有关HFS和GRS的主要概念,这些概念对于理解我们的提案是必​​要的。

群组推荐系统

GRS处理一组用户,U = {u1,hellip;, uq},一组项,I ={i1,hellip;im}和一组评分,R = {r11,hellip;, rqm},其中rij为评级的用户界面,表示为域间隔D = [dmin,hellip;dmax]。此外,还有一组用户,G = {u1,hellip;,un}sub;U n lt; lt;q问,目标群体;在不失一般性的情况下,我们将考虑G是第n个用户U。

通常,GRS基于传统的RS方法,但GRS可以应对针对个人的建议中未出现的其他问题。一些作者提出了GRS应该应对的新挑战。16,17如前所述,我们的建议集中在传统的CF RS6上,该RS RS向目标用户推荐过去喜欢其他类似品的其他物品。从评级历史获得的用户简档被比较以测量用户之间的相似性。给定目标用户,策略是找到他/她的最近邻居并组合他们的简档以发现和排列最合适的项目(参见图1)。

最广泛使用的GRS方法是基于CF RS的CF GRS,其中添加了聚合过程。21,22关于何时应用聚合过程,CF GRS16有不同的方法(见图2) :

  1. 合个人偏好:聚合用户的偏好(由他们的评级rij 表示)以获得该组的偏好。其余步骤与CF RS相同(参见图2a))。

2. CF GRS的三种方法。

  1. 合个体预测:相似性度量单独应用于每个用户ui,使用算法找到K个最近邻居(KNN),获得个体用户预测。聚合这些是为了获得小组推荐。

该过程最终确定为CF RS(参见图2b)。

我们的目标是按照图2c所示的方案开发没有聚合过程的GRS方法。

GRS最流行的方法之一聚合了各个偏好,如图2a所示,称为伪用户方法。一旦组配置文件表示用户配置文件的摘要,就可以应用任何传统的推荐方法。存在许多聚合策略来获取组概要,17突出显示以下内容:

思是:评级的平均值是关于公平性的最直观的聚合策略之一。项目ij的组评级rGj计算为

方根(RMS):每个评级都被考虑在内,但高评级比低评级更重要。

小的痛苦:当GRS的优先级是降低用户对推荐不满意的可能性时,使用最小聚合。

均无痛苦:在排除个别评级低于特定阈值的项目后,平均个人评级。

聚合总是意味着对原始信息的概括,这可能意味着从不同的角度来看信息的丢失,例如分布,多样性或数据形状。无论聚合运算符如何,这种信息丢失都可能导致偏差或导致错误结果,如以下示例所示:

1.使用平均聚合,则以下情况难以区分:(a)用户u1 率6到项目i1 和用户u2 率5,平均值:5.5,(b)用户u1 率10到项目i1 和用户u2 率1,平均值:5.5。考虑到项目i1 的这一组评级(在两种情况下均为5.5),GRS可以推荐与i1类似的项目i2 。但是,这两种情况非常不同:在情况(a)中,两个用户都应该对推荐的用户满意item(他们喜欢项目i1,类似于i2),但在情况(b)中,用户u2 可能会不满意,因为他/她不喜欢我1,尽管用户u1 会很满意的。

2.的运算符,用于最少的痛苦和平均而没有痛苦的聚合运营商也常用于GRS,因为它试图最大限度地减少成员的痛苦,以满足集团的大多数用户。然而,它有一个重要的缺点,主要是对于大型团体。在这种情况下,只有一个低评级足以惩罚一个项目,因为组评级是整个评级集合中的最小值。对于大型团体,每个项目可能至少有一个低评级,因此,与大组相关联的组配置文件将主要由负评级组成,从而导致低质量建议。

我们的目标是提出一种新的群组推荐模型,该模型保留所有群组评级(每个项目的n个评级,n为用户组的大小),而不是每个项目仅有一个聚合评级,从而消除聚合阶段以避免丢失信息。为此,我们将使用HFS的概念,这将在下一节中介绍。

群推荐的犹豫模糊集

HFS是模糊集的扩展,由一个函数定义,该函数返回域中每个元素的一组隶属度。

1.令X为参考集,X上的HFS是函数h,它返回[0,1]中非空的值子集:

此外,HFS可以定义为一组模糊集

2.设M = {mu;1, . . . , mu;n}是一组隶属函数。与M,hm相关的HFS定义为

Xia和Xu26完成了HFS的原始定义,包括犹豫模糊元素(HFE)的概念,它是[0,1]中特定xisin;X的值的特定子集。

3.设X为参考集,X上的HFS可表示为

E = {(x, hE(x)) : x isin; X} (3)

特定x的值集合he(x)被称为HFE,其表示特定元素x的可能的隶属度。

这样,对于X中的每个项目,我们都有一个HFE,即[0,1]中的一组成员资格值。在我们的例子中,犹豫来自群组的基数:对于每个项目,我们没有唯一的评级,而是一组n个评级,每个用户一个。

为了在小组建议中应用HFS,有必要进行扩展为脆性值或模糊集定义的一些函数.Torra和Narukawa27提出了一个扩展原则,允许将操作从模糊集输出到HFS。

4.设E = {H1,...,Hn}是一组n HFS和0 a函数,0:[0,1]n→[ 0,1],然后我们将模糊集上的0导出到HFS定义

特别是,该原理已应用于Pearson相关系数(PCC),28,29,这是RS中广泛使用的函数。Gonzalez-Arteaga等人30将PCC(以rho;表示)扩展到犹豫的Pearson相关系数(HPCC)。

图3显示了这种情况的一个例子。鉴于两个估值,X和Y,以及三个项目,i1,i2和i3,目标是测量两个估值之间的相关性。由于犹豫可能似乎评价每个项目,而不是只提供一个值,HFS用于表示每个估值。通过HPCC测量X和Y之间的相关性。

5.设X和Y为S和h上的两个HFS , hx(si)*hy (si)是所有HFE对的集合,

3.犹豫不决估值的相关性。

每个si isin;S的所有对HFE的集合由下式给出

R 中的值对的数量计算为

6.X和Y为S上的两个HFS,HPCC,rho;hfs 定义如下:

其中SSC对应于两组的协方差,并定义为

是hx 和hy 的第一个和第二个对应值的算术平均值

并且SS(hx)和SS(hy )对应于各组的标准偏差,定义为

该措施用于拟议的GRS,旨在提高建议质量。

3.犹豫组推荐模型

在此,介绍了基于CF GRS和HFS的新的群体推荐方案。当CF RS的目标不仅是一个用户而是一组用户时,通过找到一组用户的最近邻居,找到找到最近邻居的策略以处理组而不是单个用户。通过这种方式,该提议改变了使用经典相关度量的传统KNN算法,另一个使用相关系数HPCC。

所提出的模型适合图2c中所示的GRS方案,因为它使用基于HPCC的修改的KNN算法,这并不意味着聚合过程,因为它使用整组来计算目标组与邻居之间的相似性。收视率。该提案的总体方案HGRM如图4所示,分为三个阶段:

1.HPCC的相似性度量。使用HPCC的修改的KNN算法为G组提供了一组KNN。

2.评级预测。一旦计算出G的邻域,系统就能够预测根据KNN的评级对该组进行评级。

3.小组推荐。具有最高预测的前N个项目被推荐给该组。

本节的其余部分结构如下。首先,3.1节介绍了提案中使用的符号。然后,进一步详细解释HGRM方案的每个阶段。第3.2节描述了如何使用HPCC来查找该组的邻域。3.3节解释了如何计算预测。最后,第3.4节显示了如何提供建议。

4. HGRM的一般方案。

3.1符号

CF GRS使用以下信息:

U={u1,hellip;.uq}是一组用户

I={i1,hellip;.im}是一个项的集合

R={r11,hellip;rijhellip;..rqm}是一个评分的集合,ri,j是ui对itemj的评分

D = [dmin,hellip;, dmax]是用户用于对项进行评级的域间隔。最

使用的定义域是1-5星标度。

G = {u1,hellip;un}sub;U,目标群体,nq。

Gc = {un 1,hellip;, uq} = G \ U是G的补集

此外,拟议的HGRM将处理由HFS代表的两种类型的概况:

该组的概况由HFS,Xg定义,用于处理每个项目的G组成员提供的多种评级。Xg 是组配置文件的HFS,其包括组G的整组评级

Yk 是用户配置文件的HFS,uk isin;Gc。这是一个仅由一个成员组成的HFS

lt;

全文共16840字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[2075]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。