英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
DOI 10.1007/s11036-017-0864-3
TempoRec:基于时间主题的社交网络服务推荐人
张茵1·涂志晓1·钱谦1
在线发布:2017年4月25日
copy;Springer Science Business Media纽约,2017年
摘要随着社交网络的普及,越来越多的用户选择使用微博获取信息。但是,随着用户数量的增加,微博上的信息也越来越多,用户难以找到自己感兴趣的正确信息。因此,如何推荐高品质的朋友关注微博是其中之一。基于微博的个性化服务的研究重点。在现有的微博社交网络拓扑和基于内容的混合推荐算法的基础上,研究提出了一种基于社交关系和时间顺序主题的混合推荐算法,该算法已通过Real Sina Weibo数据集进行了验证。结果表明,与现有的其他同类推荐算法相比,改进的混合推荐算法效果良好,平均平均精度
(MAP)更高。
推荐人·SNS·矩阵分解· 时间主题·协作过滤
引言
随着互联网技术的飞速发展和智能移动设备的普及, 越来越多的用户对微博平台表现出兴趣[1].来自2015 年的统计数据显示,到当年9月底,新浪微博每月活跃用户数
达到2.12亿,每日活跃用户总计1亿。1 大量的微博用户触发了数据的爆炸性增长。如何快速有效地从海量数据中检索感兴趣的信息并提高用户可访问信息的质量是当前研究的重点和挑战。
推荐系统在应用程序中扮演重要角色。在微博平台中,推荐系统能够基于用户信息来推荐用户感兴趣的 个性化标签;能够根据用户转发,评论和喜欢的微博 内容推荐对用户有吸引力的主题;它也能够根据他们 的社交网络拓扑向用户推荐他们可能熟悉的朋友。但 是,在微博平台中,用户不仅需要添加他们的共享好 友,而且还需要添加志趣相投的用户,以便根据自己 的兴趣查找更多信息。因此,对推荐算法的研究将在 满足用户对社交网络的需求,改善他们的社交网络体 验以及促进社交网络服务平台的长期发展方面发挥重 要作用[2].
但是,现有的微博社交网络拓扑和基于内容的推荐算法不可能全面分析微博数据的特征并动态分析用户 兴趣,存在以下两个缺点[3]:
– 现有的推荐模型主要从静态角度分析用户的社会关系,兴趣和偏好。但是在现实生活中,用户的社会关系,兴趣和偏好不是一成不变的,而是与时间相关的。
张茵
1 中南信息与安全工程学院
财经政法大学,武汉 1http://www.useit.com.cn/thread-10921-1-1.html.
- 现有模型并未区分所有历史数据。但是,在实践中, 微博用户的兴趣与时间有关。例如,在2014年6月至2014年7月的巴西世界杯期间,足球在微博上炙手可热。然而,赛后,对足球感兴趣的用户数量大 大减少了。
为解决上述问题,本文提出了一种基于社会关系和 时间顺序主题的混合推荐算法。具体来说,该研究的 贡献如下:
- 建立了时间社交网络功能模型;用户发布的微博内 容按时间段细分;使用潜在狄利克雷分配(LDA) 模型提取用户主题特征;使用Jensen-Shannon(JS) 散度计算兴趣相似度。
- 根据每个历史时期的最大相似度,使用时间衰减函 数来预测用户之间的最终兴趣相似度。在此基础上, 社交网络和兴趣相似度被线性整合。使用协作过滤 算法执行Top-k推荐。
相关工作
经过充分的调查,我们发现微博推荐的研究主要分为 两种模式:基于社交关系推荐朋友和基于微博内容探 索用户兴趣。
基于社交关系的推荐基于以下理论:具有相似社交网络偏好的用户更有可能成为朋友。它基于用户关系建立社交网络拓扑,使用特定算法处理社交网络拓扑并计算社交网络相似度,然后推荐朋友。根据“朋友之友”(FOF)理论,如果目标用户1和用户2有很多共享的朋友,则用户1和用户2很有可能成为朋友。因此, 我们可能会将用户2 推荐给目标用户[4]. 在[5] , Naruchitparames等。改进了FOF理论,结合复杂网络认知理论和共享好友特征,使用了帕累托最优遗传算法,预测了好友关系,优化了推荐好友列表。Akbari 等。改进了基于拓扑和FOF理论的好友推荐系统。改进后的系统不仅考虑了用户之间的社会关系,而且根据用户之间的社会关系有效地扩大了推荐朋友的范围[6].
尽管基于关系的朋友推荐享有较高的接受率,但推荐 的朋友基本上是离线熟人或用户熟悉的人。并且推荐 的范围和数量是有限的,这使得难以向用户推荐具有 相同兴趣的新朋友。
我们可以根据微博内容探索用户兴趣。Wu等。[7]使用术语逆频文档频率-IDF)算法从文本中提取权重较高的关键字来表示每个用户的特征向量,自动为每个用户添加兴趣标签,然后推荐合适的朋友根据兴趣标签之间的相似度来定位用户。唐等。[8]提出了一个基于主题的微博两级推荐模型, 该模型使用潜在Dirichlet分配来分析用户发布的微博主题,以避免在TF-IDF关键字提取中出现多义词,并探索潜在的语义微博主题并计算兴趣用户之间的相似度,以提高推荐准确性。
研究结果表明,使用基于微博文本的推荐算法做出的推荐比使用基于社交关系的算法做出的推荐更受用户欢迎[9].这是因为用户对自己熟悉的人的信任比对推荐的朋友共享相同的兴趣和偏好的朋友更信任。因此,许多学者开始将研究兴趣转移到将两种推荐方法结合在一起的混合推荐方法中。Chen等。[9],基于微博的内容和社会关系,提出了一种基于内容匹配和链接的混合推荐算法CplusL(Content-plus-Link),该算法使用TF-IDF技术提取关键字来表示用户的特征向量并计算用户内容之间的相似度,并根据内容相似度将相关用户之间的相似度提高50%。混合推荐方法比 仅基于社会关系或兴趣和偏好的方法更准确。Agarwal 等。[10]基于协作过滤和用户之间的社会关系建立了一个评分矩阵,并根据用户的自然属性信息和用户之间的互动强度特征校正了评分矩阵。他们还使用余弦相似度公式计算了用户之间的相似度,并列出了最相似的用户进行推荐。
但是,由于微博的实时性,经常会快速更新微博内容。微博用户具有不断变化的兴趣特征。尽管许多学者在使用潜在语义分析或改进的潜在语义分析模型来提取用户兴趣和偏好方面做得很好,但他们仍未能找到解决用户兴趣漂移问题的好方法。
针对此类问题,本研究提出了一种基于社会关系和时 间顺序主题的混合推荐算法。它使用改进的矩阵因子 化模型来计算用户之间的社交网络相似度并基于时间 进行动态分析
子组,根据其性别和年龄划分,并使用2k维向量表示用户所属的子组。基于用户性别和年龄建立的特征模型可以用等式表示。1.
2k
特色功能,微博的内容可以探索用户的兴趣和爱好。 该算法不仅会向用户推荐具有相似兴趣的朋友,而且
还会尝试推荐
rtilde;u
i
= yuqi = L yj
qi
(1)
用户朋友可能是他们认识的朋友,因此增加了用户对 推荐朋友的接受度。
系统设计
提出了一种基于社会关系和时间顺序主题的混合推荐 算法。该算法包括两个推荐模块,一个基于社交关系, 另一个基于按时间顺序排列的主题(图2)。1).
基于社会关系的推荐模块
-
-
- 特征分析与建模
-
性别和年龄特征微博用户的年龄和性别在很大程度上 反映了用户的兴趣。用户按性别和年龄分组,每个组 代表一种用户偏好。将性别和年龄信息引入矩阵分解 模型将大大提高推荐的准确性。
根据[11],将用户年龄分为k个(数量)组,然后根据性别将每个组分为两个子组,总共有2k个子组。每 个用户都映射到一个
j =1
其中,r〜ui表示用户u与用户i之间的预测亲密度; y 是用户所属组的特征向量;y 指示用户u是否属于j日特征值。
u j
在这项研究中,将年龄段在10至50岁之间的年龄段每2个年龄段进行细分,并针对年龄段在50岁以上和10
岁以下的人群进行细分,因此k 22以及性=别特征。用
户性别和年龄特征由44维向量表示。
社交活动特征对于微博用户,他们可以关注朋友,从微博朋友那里获取实时更新并找到符合他们兴趣的内容。同样,他们的朋友的交友行为也会受到用户行为的影响。例如,当用户发现朋友v跟随了用户w(形式 为uvw)时,用户u跟随w的可能性将大大增加。因此,
v的社→交网→络行为会对u产生影响。同时,随着用户与他人保持不同的亲密度,每个朋友对用户的影响程度
也变化。用户之间共享朋友的数量表示用户之间的互 动程度[11].
用户集合后跟用户u可以表示为Out(u);用户集合后跟用户v可以是
图1基于社会关系和时间顺序主题模型的朋友推荐框架
表示为Out(v);用户u和v之间共享朋友的集合可以表示为:
Comw = Out(U) cap; Out(v)
( 2)对于潜在因子矩阵分解,在介绍了朋友特征之后,
用户和他们共享的朋友,一旦用户u受到影响,就可以使用公式3-3计算潜在因子向量put。
用户使用余弦相似度公式。相似性越大,成为朋友的 可能性越大。此外,还向目标用户推荐了Top-k朋友。
基于时间顺序主题的推荐模块
put = pu
L
visin;Out(u)
1 ||Com紫外线
||
p v
||出(u)||
(3) 3.2.1 分词和特征词提取
因为数据集中的微博文本是用中文写的,所以CAS NLPIR中文分词系统2
1 其中pu表示用户u的原始偏好向量;
用于细分微博文本中的单词。它消除了停止-
| ||Comuv ||
|出(u)
||
表示朋友v的影响程度 根据停用词列表搜索单词,然后提取
在用户u上;pv表示用户v的潜在偏好向量;
||Com紫外线|和| Out(||u)表示||用户u和v之间共享的朋友数以及用户u的朋友数。
3.1.2联合矩阵分解模型和相似度计算
在前面的部分中已经介绍了年龄和性别特征
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[236250],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。