基于混合的协同过滤算法的个性化新闻推荐系统研究外文翻译资料

 2022-03-29 22:05:21

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


2016第二IEEE计算机与通信国际会议

基于混合的协同过滤算法的个性化新闻推荐系统研究

摘要:

本文介绍了新闻系统的个性化推荐技术,尤其针对满足用户的个性化需求。本文在数据量较低的问题研究背景下提出了基于混合协同过滤算法的新闻推荐系统。在计算相似度时,通过改进相关系数公式,增加新闻热点参数,实现针对用户的混合推荐算法。混合推荐算法用于预测用户的评分以使用户评分矩阵为非零值。 实验结果表明混合推荐算法可以有效地增加推荐的准确性与稳定性以达到更好的推荐结果。

关键词

个性化推荐; 协同过滤; 混合推荐算法

一、引言

随着信息时代的到来,人们快速寻求快速便捷的生活方式,获取新闻等其他信息也依赖手机、PC和其他网络设备。人们每天阅读许多新闻,了解时事和热点话题[1-3]。虽然大多数门户网站会推出热门新闻专栏,以过滤每日发布的数千条新闻,但不同的用户有不同的需求。如果新闻信息系统中的个性化技术融入到信息系统中,可以更好地满足用户个性化新闻的需求,提高用户的阅读效率,满足各种用户的个性化需求。有关问题的新闻推荐算法的研究应该被视为很有必要的研究任务[4-6]。针对协同过滤算法的数据稀疏性问题,研究了基于新闻的混合协同过滤算法推荐,并将其与单用户协同过滤算法和基于内容的过滤算法进行了比较。这样可以直观地证明其优点。另外,在研究的过程中,一些传统的计算公式得到了改进。在计算用户相似度时,为了发现类似用户更有价值的结果,通过增加热门因子来降低热门项目对于相关用户的相对重要性,来提高皮尔森相关系数的公式。在计算用户的相似性时,按顺序为了找到类似用户的更有价值的结果,皮尔森相关系数提高了热门因子,降低流行项目的相对重要性来查找相似的用户。当预测相似度时,考虑到用户的分数习惯因素,将用户评分的加权平均值添加到公式中,以避免用户习惯,影响他/她总是高分或低分,进而影响推荐结果的准确性。

A.相关工作

个性化推荐已成为必不可少的网站服务。 新闻门户类网站,提供各种类型的新闻,这是一项传统的互联网服务,但个性化新闻服务与今天蓬勃发展的电子商务网站、咨询课程的用户网站相比,仍有很大差距,如果能够更好地挖掘用户的潜在兴趣并实现新闻推荐可以产生更大的社会和经济效益值。 更重要的是,个性化服务可以增强良好的用户体验从而提升用户的用户黏性

个性化推荐的核心技术是推荐算法的研究和应用,协同过滤算法是最为成熟的研究方法,也是推荐算法应用最广泛的方法。比如着名的新闻网站Digg [7-9],它试图在家中推荐系统。该网站根据用户的搜索历史记录计算用户之间的兴趣相似度,然后向目标用户推荐相似用户的喜爱文章。根据网站统计,使用推荐系统的用户搜索行为显着变得更加活跃,其中包括digg,总数提高40%,朋友数量平均增加24%,评论增加11%。基于用户的协同过滤算法和基于内容的协同过滤算法是协同过滤算法的两种主要类型。基于用户的协同过滤算法推荐具有较高的准确性,但存在内容数据量小和冷启动的问题。然而,基于内容的协同过滤算法对于用户的信息挖掘模式简单,但没有基于用户的高协作过滤准确率。

B. 原型

我们提出的研究工作对于我们来说意义重大

原因如下:

a.本文采用混合协同过滤算法。 基于内容的协同过滤理念被植入到基于用户的协同过滤中算法,交错预测使得用户化矩阵为非零值,有效地缓解了数据稀疏性问题。

b.在计算用户相似度时,为了找到类似用户更有价值的结果,皮尔森相关系数公式通过增加热门因子来降低由于寻找流行内容导致判定类似用户的相对重要性。

c.在预测相似度时,我们考虑到用户的行为习惯影响评分因素,用户评分的加权平均值添加到公式中以避免由于用户的习惯影响他/她对结果的推荐准确度总是得分高或低。

二、基于用户的协同过滤算法

A.改进的皮尔森相关系数公式

由于新闻具有较强的时效性,因此最新消息会让很多用户在特定的时间段内点击并发表评论。 当推荐系统分析用户的兴趣并计算用户的相似度时,两个用户就有争议的新闻项目达成共识,这些新闻项目比热点新闻更有价值。 可见,热点因素[10-12]将严重影响基于用户兴趣挖掘的推荐系统,从而影响向用户提供的个性化服务。

因此,通过引入热度参数来优化皮尔森相关系数公式,可以降低流行新闻对寻找类似用户的重要性,提高推荐准确率,增强用户体验。 新闻j的热点hj计算如下分析:

这里,N表示用户总数(包括没有在新闻中得分的用户),rij表示用户i对新闻j的评分。在计算评分总和时,如果用户i对新闻没有评分记录 j,跳过用户因此可以看出,新闻j上的人数越多,得分越高,新闻越受欢迎,其热值范围为:0 lt;hj lt;Max(rij)。每个用户对 他们访问的新闻可以被看作是一个向量,其表达如下:

用户对所有新闻项目的平均得分是(r_u r,用户x的评分新闻集合标记为Jx,用户y的评分新闻集合标记为Jy,联合新闻集评论用户x和y标记为 Jxy,使用传统皮尔森相关系数公式计算用户x和y之间的相似度,如下所示:

改进的皮尔森相关系数公式用来计算相似度的是:

从公式的改进可以看出,新闻比较流行,对于计算用户x和y之间相似度较小的角色影响越大

B.基于用户的协同过滤算法

1)预处理用户u的评分数据

为目标用户创建一个用户评分矩阵,并获得用户对所有新闻项目的平均评分sTu:

这里,N表示新闻总数,Jui表示用户u在新闻j上的评分。

2)用户之间进行相似度计算,选择目标用户u的邻近集合U.通过改进的皮尔森相关系数公式计算目标用户与其他用户的相似度:

其中,UI代表用户U和用户I的联合新闻集

3)预测用户u对候选新闻项目的评分,得到推荐结果。用户u对新闻j的预测评分公式为

其中,U是目标用户u的邻近集合,z是a的标准化因子

另外,在预测评级的过程中,在用户U的邻近集合对u产生影响之前,首先缩减到各自的平均水平。 它充分考虑了用户的先前评分习惯对预测结果的准确性和客观性得分可能始终高或低的影响。

三、基于内容的协同过滤算法

如果用户i没有评论新

全文共11453字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[14825],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。