基于微信小程序的个性化青少年图书借阅系统的设计与实现外文翻译资料

 2022-08-21 23:12:09

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


摘要

近年来,基于二分网络的推荐引起了广泛关注。与传统的面向对象推荐不同,微博网络中的推荐有两个重要的区别。一个是高权威用户或一个人的特殊朋友通常在推文推荐中扮演非常积极的角色。另一个是微博网络中的对象对应于同一主题的一组推文,而不是一个实际的单一实体,例如传统网络中的商品或电影。因此,在自己收集的话题中重复推荐是不可或缺的。因此,本文通过原始链路矩阵和链路权重对基于网络的推理(NBI)算法进行了改进。本文最后提出了基于改进的基于网络推理和用户影响模型的微博推荐模型。调整这两个因素的权重可以在算法精度和推荐个性化方面产生最佳的推荐结果。

1、介绍

随着社交网络应用的快速发展,微博已经成为人们日常生活中非常重要的在线社交网络。在中国,新浪微博是最重要的微博平台,已经拥有约4亿注册账户。活跃用户通常每天更新超过1条推文。对于一个普通的新浪微博用户来说,他每天通常会收到成千上万条来自朋友的新推文,其中大部分很可能会被忽略,而最新的推文会占据他微博主页的最高位置。因此,微博网络中的推荐算法对于提高用户的利用率,为微博提供商带来更多的互动具有重要意义。

近几十年来,个性化推荐一直是一项非常有价值的研究,如亚马逊推荐的图书[1],改编的新闻[2],以及电视和电影的数字视频系统[3]。基于协同过滤的算法被广泛研究并广泛应用于当前的推荐模型中,[4],[5],[6],[7],[8],[9]。基于相似度的推荐的概念是首先计算用户相似度,然后推荐由最相似用户收集的大量对象。

然而,由于CF的推荐受到用户-对象矩阵稀疏性的影响。为了提高算法精度和降低计算复杂度,已经发现了一些动力学原理并将其用于推荐系统,包括热传导[10]、能量扩散[11],[12]等。Zhou et al. [13] 介绍了一种基于二分网络的推荐,称为基于网络的推理(NBI),它成功地提高了推荐的有效性,并降低了计算中用户-对象向量的维数。后来对NBI相关模型进行了许多调查。为了消除冗余的建议,实现了更高阶的相关性,[14],[15]。热传导理论强调共同收集不流行商品的用户比收集流行商品的用户更相似[16]。参考文献[17]结合了NBI和HC,并提供了一个综合建议。参考文献[18],[19]在基于扩散的推荐中引入标签相似性[20]并成功地提高了推荐准确度。此外,对NBI相关模型[21],[22]的研究得到了充分调查,并广泛应用于各种领域或实际系统,包括药物-靶标相互作用和药物重新定位的预测[23],[24]中的用户行为分析,[25]铁路运输系统中的车站设计和用户链接预测[26],[27]。

与传统网络中的对象推荐相比,微博网络有两个重要的区别:(1)微博用户可能对来自他们的某个密友或明星用户的任何推文感兴趣,而没有对内容和主题的偏好,我们用这一点来描述这种现象用户的影响,(2)在微博推荐中,我们将对象定义为一组关于相同主题的推文,通过Lingo算法[28],[29]聚类。因此,如果一个用户对某个主题感兴趣,那么该主题的推文也应该以合理的分数推荐给他。我们将这种现象定义为重复推荐。因此,微博推荐应该是NBI算法和用户影响的综合模型。已经通过加权NBI模型进行了一些研究,以获得更好的推荐准确度[30],[31],[32],[33]。本文通过原始的用户-对象矩阵和两轮链接权重对NBI模型进行了改进。我们结合改进的NBI算法和用户影响[34]作为最终的推荐模型。实验表明,该集成模型能够在微博网络中提供更加有效和个性化的推荐。

  1. 个性化推荐的NBI算法

在传统网络中,NBI相关模型被广泛用于面向对象的推荐。NBI的概念是利用具有资源分配的用户-对象拓扑来推荐由二分网络引用的新的非收集对象。我们从图1、图2、图3、图4中演示了NBI算法[35]的资源分配过程的示例。在图1中,x,y和z是网络中代表三个不同对象的节点。该网络由三个对象和四个用户组成,其中用户A、B和C链接到x,用户B和用户C链接到y,用户A、C、D链接到z。将用户A设置为目标用户。本示例的目的是向用户推荐未收集的对象A。

  1. NBI算法的改进

当在微博推荐中实现NBI算法时,不再使用用户-对象(用户-推文)矩阵是不切实际的,因为(1)推文集的巨大大小和(2)推文-评论关系的稀疏性。因此,在传统的基于内容的推荐中,我们使用主题作为基本的推荐单元,而不是根据对象来推文。微博中的一个主题是由一组推文组成的,这些推文是由Lingo聚类算法生成的相似主题。因此,我们最终利用用户-主题矩阵来描述微博推荐关系。

3.1原始链接矩阵的改进 在原始NBI算法中,当用户beta;已经收集了对象i,aibeta;=1时,否则aibeta;=0。同样,在微博推荐中,如果主题i已经被用户更新beta;aibeta;=0,则为aibeta;=0。第一个争论是NBI模型是否足以描述微博网络中的用户行为。例如,当所有来自用户A的推文都附加到主题和主题,而一些关于主题的推文也由用户B更新,而一些关于主题的推文也由用户C更新时,网络推理关系A-a-B可以等价于A-b-C吗?

为了回答上面的问题,我们做了第一个假设。假设用户A已经更新了10条推文,其中9条来自主题a,1条来自主题b。用户B更新了2条推文,1条来自主题a,另一条来自主题c。用户C还更新了两条推文,一条来自主题b,另一条来自主题d。从用户A来看,有两种用户-主题-用户关系:A-a-B和A-b-C。由于用户A在话题a和话题b上的推文比例,在这个假设中是9:1,我们可以认识到话题a比话题b对用户A有更高的偏好。用户B和用户C分别通过主题a和主题b链接到用户A,主题a拥有更高的优先级。因此,用户A与用户B之间的联系应该比用户A与用户C之间的联系更强。因此,来自用户A的任意推文更有可能吸引用户的注意力。

因此,关于主题c的推文将在用户A的推荐列表中占据更高的优先级。因此,改进的NBI原始链接矩阵能够更好地体现基于用户相似度的协同过滤的核心思想,给出更合理的推荐结果。
3.2第一轮链环重量的改进

在NBI资源分配过程的步骤2,由于主题i后面跟着3个用户,主题i的程度等于3,即根据等式(2)。这里我们提出第二个假设。假设网络中有3个用户,每个人都更新了5条推文。对于用户A来说,所有的5条推都来自主题a。对于用户B,4条推来自主题a,1条来自主题b。在用户C的推文中,1条来自主题a,4条属于主题c。将用户A设置为推荐的目标用户。图6示出了该资源分配过程。

在这个假设中,所有用户A的推文都属于主题a,即100%的用户A推文与主题a相关联,而主题a也由80%的用户B的推文和20%的用户C的推文组成。受协同过滤思想的启发,用户A和用户B之间应该更紧密地联系在一起,用户B的推文会根据经验优先推荐给用户A。然而,根据原始的NBI模型,对于来自用户B的主题b和来自用户C的主题c的最终计算结果是不明显的,其得分与图6(a)一样为1/6。

提出了一种改进的基于第一轮链路权重的资源分配过程。根据主题a的程度k(a)=3,每个用户(A、B和c)应得主题a初始分数的1/3,根据用户-主题矩阵,该分数为1。对于从主题a到用户B和从主题a到用户C的链接,hibeta;定义链接权重,该权重等于标准化的交互频率,即haB=4/5,haC=1/5。这样,用户B和C从主题a的原始值1/k(a)分别乘haB和haC,在步骤2中分别是4/15和1/15。在步骤3继续NBI进程。通过改进的NBI模型,第一轮链接权重的最终结果是主题b为2/15,主题c为1/30。因此,一个主题b一个a-B-b链接的推文将被优先推荐给用户A。这种改进可以用方程式来解释(9)代替方程式(2)。

  1. 具有用户影响力的改进的NBI推荐

4.1用户影响模型 与传统的面向对象推荐相比,用户影响力是微博网络中一个极其重要的特征[34]。由于不同的推文作者,类似的推文可能会导致不同的传播痕迹。因此,作者影响力是微博推荐算法不可或缺的因素。我们通过用户追随者的数量和质量来定义用户影响力。这个定义可以通过方程来形式化。Eq.(14)。在方程式中。Eq.(14) Ni是用户追随者的数量,i代表追随者的数量。对于每个追随用户j的用户来说,显示用户的影响力的是他的追随者的数量和他的朋友的数量。因此,用户影响力的积累可以体现用户追随者的素质。

在新浪微博平台上,一个用户最多可以拥有2000个朋友,而一个用户的追随者数量没有上限。这意味着当用户拥有很高的权威时,用户的影响可能是无限的。因此,在计算用户影响时,我们将公式归一化。(14)

在微博推荐中,用户通常只关注他关注的用户的推文,即他的朋友。因此在方程式中。(15),Wmax,i表示一个人的朋友集中最高权威用户的用户影响力。这样,对于任意用户i,在未来的计算中,Wi用户影响将下降到(0,1]。
4.2用户互易系数

微博推荐的另一个明显特征是不同用户对的用户互惠性。在大多数社交网络中,一个用户可能会关注和感兴趣一些好友的所有新闻,例如微博,这不是因为这些微博的内容和类型(图片、视频或网址),而是因为它们之间的特殊关系。因此,在最近一段时间,用户A回复和转发用户B推文的频率越高,用户B的任何推文引起用户A兴趣的可能性就越大。受这个想法的启发,我们利用用户互惠来描述用户交互关系。

公式揭示用户j与用户i之间的互惠关系。代表用户i在某个时间段回复的推特数,指用户i回复用户j的时间。同样,REi是用户最近的转发次数,而rei→j是用户转发用户推文的时间。显然Ri,jne;Rj,i,这与真实的用户交互行为是一致的。如果在测试期间没有交互作用,我们设置第一个分子1 ti→j,以避免值0出现在最后。考虑到新浪微博应用编程接口的政策,我们收集了最近最多(或少于)200条推/推和200条评论的数据。(16)。

4.3最终模型

最终模型结合了用户影响和改进的NBI模型,通过: Si,t(17) 在方程式中。向用户呈现推特的推荐分数。参数alpha;用于调整作为第一部分的用户影响和作为第二部分的改进的NBI模型之间的权重。当alpha;=0时,该模型退化为改进的NBI模型,该模型仅根据主题偏好来区分推文,即目标用户在特定主题上的推文将被给予相同的分数。在另一种极端情况下,推荐分数仅由用户影响决定,使得来自特定作者的针对目标存在的所有推文将被同等地评分,而忽略主题或内容的差异。当在alpha;位于[0,1]之间浮动时,我们提出的模型将在不同的用户影响权重和改进的NBI算法下给出综合推荐。参数lambda;用于平衡这两个部分之间的数值差异,以达到平均1:1的分割。在我们提出的模型中,推荐分数Si,t是将高的推文列在推荐列表顶部的标准。不同的参数lambda;值可能导致不同的排序顺序,而参数alpha;并不作用于的结果,而是作用于的分布。换句话说,当参数alpha;从0开始时,随着每一步增加0.01并最终在1结束,用户影响和改进的NBI模型的1:1的划分将导致推荐分值的值的大部分平滑变化。该模型的最后一个目标是找到参数alpha;的最佳值,以便提供最佳的推荐结果。

5、实验和算法评估

5.1训练集和探测集 我们从新浪微博收集数据,包括34,586个用户和6,124,765条推文,21,432,841条评论。我们最初设置了68个用户作为源节点,并分析了他们所有的34 518个朋友。对于每个源用户,我们收集他们最近的13 192条推文和12 986条评论。我们提出的模型的用途是向这68个源用户推荐来自这34 518个朋友用户的合适的推文。 为了评估我们提出的微博推荐算法,我们将整个微博-评论链接关系数据集分为一个由80%的链接组成的训练集(用于训练参数alpha;)和一个由20%的链接组成的探测集(用于评估推荐模型的准确性和有效性)。

5.2排名分数的评估

通常,准确率和召回率是评价算法准确性的重要指标。然而,由于微博网络中微博回复行为的稀疏性,仅有这两个标准是不够的。在现有的研究中,推荐评估有几个指标,[36],[37],[38]。Zhou et al. [13],[39]介绍了一个标准,称为排名分数,这是解释方程。(18)、(19)。RS的概念是,对于一个已存在的推文-评论链接,P(t)是推文在目标用户推荐列表中的位置,按照我们提出的算法排序,同时是推荐列表的长度。例如,如果我们向目标用户推荐100条推文,并且一条正确预测的推文位于前6位,那么这条推文的正确率为6/100=0.06。(19)是系统的所有被调查者的推文。显然,RS越小,我们提出的算法越好。

6、结论和讨论

如今,个性化推荐已经广泛应用于网络应用[40],[41],[42],[43],其中二部网络上的资源分配过程已经成为一种非常重要的方法,以获得更高的准确性和更低的计算复杂度[44],[21],[22],[45]。本文通过归一化用户-主题关系的原始链接矩阵和资源分配过程中的两轮链接权重对NBI模型进行了改进。基于用户影响模型的改进NBI算法能够更好地解释微博网络中的用户行为和微博推荐:(1)结合NBI的二分网络拓扑和基于内容的推荐;(2)主题偏好将通过NBI/改进的NBI模型得到充分实施;(3)利用改进的NBI模型解决目标用户对已有话题的重复推荐;(4)综合模型最终可以说明SNS网络中的高权限用户影响和交互互惠现象。通过对排名分数、汉明距离[13]、准确率、召回率和F-measure的评价,我们提出的推荐算法通过改进的NBI模型和用户影响,能够在微博网络中提供更有效、更个性化的高准确率推荐。

感谢

本研究得到了国家自然科学基金(61271308)、北京自然科学基金(4112045)、北京市科学技术项目(Z121100000312024)和中国高等教育博士专业研究基金(W11C100030)的资助。

Abstract

Bipartite network based recommendations have attracted extensive attentions in recent years. Diffe

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[409955],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。