英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料
基于细粒度特征分析的推荐算法
Wenjie Lu , Gulila Altenbek
摘要
大多数现有的推荐方法没有足够的能力来捕获或恢复产品和用户偏好的细粒度特征。知识图包含了关于世界上产品和相互关系的大量信息。为了分析推荐过程中的细粒度特征,我们提出了一个知识感知的协作学习框架(KACL),这是首次将用户的历史回顾与知识图相结合的工作。首先,我们使用命名实体识别(NER)系统来识别与非结构化评论中的项目特征相对应的命名实体。之后,我们使用实体链接(EL)系统将第一步中标识的实体映射到维基百科中的相应实体。然后,通过知识图嵌入模型变速器, 构建了一个依赖于所提取实体和相关实体的子图,并将子图嵌入到一个低潜在向量空间中作为预 训练项的嵌入。 下一步,我们将通过4个层次的RELU构建的深度学习来微调项目嵌入,并将协作信息与预 训练项目嵌入相结合。 并根据用户评论行为,对项目嵌入进行平均化,以表示用户嵌入,将项目嵌入和用户嵌入纳入分类模型。最后,我们使用KACL将协同过滤与实体表示相结合,并提出建议。在真实数据上进行了实验,验证了新方法的有效性。结果表明,基于知识图的细粒度特征分析有助于提高推荐者的推荐准确率。
1. 介绍
网络数据量呈指数级增长,推荐系统(RSs)已成为缓解信息过载的有效方法。对于大多数现有的在线销售平台,应用程序开发人员通常为用户提供一个渠道,让他们撰写评论,描述他们对所购买产品的评估。目前,越来越多的用户愿意分享他们的体验。在选择产品的过程中,大多数用户都会浏览历史回顾。消费者评论和共享体验,包括用户偏好和产品特性,是重要的信息来源。这些有价值的信息可用于提出建议。
随着评论数量的不断增加和文本挖掘技术的发展,学者们致力于对推荐算法进行深入的研究(Musat,Liang,amp; Faltings,2013)。从丰富的评论中获得的在以下三个方面有利于RSs: (1)此类评论可能包含有价值的产品特性信息,有助于处理信息稀疏的问题;(2)它们可能有助于解决新用户的冷启动问题; (3)评价用于确定评分质量,发现上下文相关的偏好,并确定用户的潜在偏好因素(Tavakoli, Zhao, Heydari, Nenadic,2018)。-些现有文献已经证明,评论有助于预测各种推荐平台的结果。Ricci建议将评审信息纳入产品描述,并使用评审信息预测用户行为
(Ricci amp; Wietsma,2006;Wietsmaamp;Ricci,2005)。
Zhang、 Ding、Chen、Li和Zhang (2013)利用项目评论分析用户的情绪,然后将情绪分类结果融合到推荐中。Alsadat、Khadeer、Elizabeth和Khadeer(2018)提出了一个利弊情绪分析框架,用于分析利弊评论和评论,并提取客户讨论的产品特征。James提出了一种计算语义相似度的方法:在用户之间查看文本以反映用户偏好,并将结果用作评级预测的附加因素(Chambua、Niu、Yousif、Mbelwa, 2018)。Chen、Lin、Hoi、Xiao和Zhang(2014)提出了一个应用程序审查挖掘的机器学习框架,以帮助开发人员发现有用的信息。Aciar,zhang,simoff和Debenham(2006)将基于消费者产品评价的优先排序系统集成到推荐系统中,并用数码相机推荐说明了新方法。Shanmugavelet提出了一个系统,使用用户评论和评级来推荐餐厅
(shanmugavelravi,2016)。Lacopo Vagliano提出了一种基于知识图中可用知识的语义标注和评价实体的推荐方法(Vagliano,Monti,amp;Morisio 2017)。
然而,大多数现有的基于评论的推荐方法没有足够的能力来分析评论,因为大多数评论都是文本和非结构化的。很难捕获或恢复细粒度的用户偏好,例如交互序列中的属性或特性。此外,这些方法很难解释(wang,mao,wang,amp;guo,2017)。知识图包含了关于世界上实体及其相互关系的大量信息。用知识图连接网上购物平台有利于利用大量商品评论,有助于提高商业平台的效率(shen,Wang,amp;Han,2015)。
本文提出了一种基于细粒度特征分析的推荐算法。我们的新方法将用户的历史回顾与知识图联系起来,这有助于探索产品的细粒度特征。Wikipedia是一个众所周知的知识图,它包含了商品描述中使用的所有特性。然而,审查可能会发现项目之间的其他联系。为了利用这些非结构化评论,我们首先使用一个NER系统来识别非结构化评论中提到的命名实体,并过滤维基百科中不相关的实体。然后,我们使用EL系统将第一步识别的实体映射到结构化知识库领域中的匹配实体。然后,通过知识图嵌入模型变速器,构造一个依赖于提取的实体和相关实体的子图,并将子图作为预训练项嵌入到低隐向量空间中。下一步,我们将通过4个层次的relu构建的深度学习对项目嵌入进行微调,并将协作信息与预训练项目嵌入相结合。并根据用户的评论行为,对项目嵌入进行平均极化,以表达用户的嵌入行为。我们将项目嵌入和用户嵌入放入分类模式。最后,我们使用KACL将协同过滤与实体表示相结合,并提出建议。
本研究的贡献总结如下:
1.我们设计了一种新的基于细粒度特征分析的推荐算法,该算法从商品评论中识别出商品的相关特征。设计了一种基于细粒度特征分析的推荐算法,能够从商品的评论中识别出与商品相关的特征。我们引入非结构化用户评论来提取细粒度特征,并将已有的知识地图信息留给推荐。
2.我们设计了一个基于内隐反馈和知识图的KACL框架来学习用户和项目的潜在表示,并将学习到的表示用于提出建议。
3.我们的框架可以通过微调将用户行为嵌入到底层表示中,从而增强底层表示中表达的信息。
4.我们对推荐任务进行了实验,以评估新方法的有效性。在两三个数据集上的大量结果表明,我们提出的方法优于几种最先进的基线。
剩余报告的组织结构如下所示。在第2节中,我们对与我们的工作密切相关的研究进行了简要回顾。在第3节中,我们介绍了本报告“中使用的某些符号,并阐述了我们的建议问题。在第4节中,我们号详细介绍了我们的产品。推荐框架,包括EL过程、抽取知识图的构造和协同绘图过程。实验装置和结果见第5节。最后,我们在第6节得出结论。
2.相关工作
2.1.知识图
在过去的几年中,科学家们遵循关联数据的原则,发布了大量的语义数据,来自不同主题领域的大量异构数据被连接在一个统一的全球数据空间中。这些相互关联的数据形成了一个称为知识库的大型信息资源库。知识库通常用有向图来表示,其中节点表示实体,边表示关系,这种图又称为知识边图。KG由大量三元组表示,每个三元组(e1,r,e2)有两个实体(头实体和尾实体)和一个与e2的关系。给定所有三元组,我们可以构造一个包含各种实体和三元组之间丰富连接的大型异构图。有几个典型的KG,包括学术项目和商业项目,如YAGO、NELL2、DBpedia3、DeepDive、微软的Satori5和谷歌的KG5。充分利用KGs的异构互联信息有助于解决使用单个域数据难以解决的问题。许多应用程序都成功地利用了KGs,包括信息检索(Freitas、Oliveira、0rsquo;Riain、Curryamp;Silva,2011)、社区检测(Tiddi、d`apos、Aquinamp;Motta,2015)和情感分析。
2.2.知识图嵌入
AKG是由实体和关系组成的多关系图,KG提供流畅的信息、结构化数据和非结构化数据。在保留原KG固有结构信息的同时,对KG的三元组进行运算和简化,提出了KG嵌入(KGE),并得到了广泛的关注。KGE的目标是确定表示实体及其关系的低维表示向量;这些嵌入结果可以应用于许多下游领域,例如KG完成、关系提取、实体分类和实体解析(Wangetal,2017).已提出了几种有效的KGE方法,例如instanc-TransE(Bordes、Usunier、Garcia-Dur、Weston、Yakhnenk2013)。RESCAL(Nickel Tresp,2013)和变速器(Lin、Liu、Sun、Liuamp;Zhu,2015)。这些方法表示连续向量空间中的实体和关系,并定义每个实体和关系的评分函数三倍来衡量它的合理性。实体和关系的嵌入可以通过最大化观察到的三元组的总似然性来获得(Wangetalo,2017) .
根据评分函数的不同,这种嵌入技术大致可以分为两类。翻译距离模型使用基于距离的评分函数,语义匹配模型使用基于相似度的评分函数(Wangetal,2017).在这里,我们简要回顾两种最先进的方法,变速器(Linetal,2015)和RESCAL(Nickelamp;Tresp 2013)分别是平移距离模型和语义匹配模型的例子。
2.2.1.变速器
变速器假设实体和关系分别嵌入在实体空间Rk和关系空间Rdlt;中。通过投影矩阵将实体嵌入从实体空间转换到关系空间。具体地说,给定KG中的三个单位(h,r,t),第一个实体的和最后一个实体t分别嵌入到向量Vn和Vterk中。如图所示。变速器利用特定关系矩阵M将h和t映射到子空间Rk中(Wangetal,2017)。
变速器基于距离的评分函数定义如下:
2.2.2.重新校准
RESCAL使用三向张量表示三元组,其中三元组的每个元素用一维表示,并使用实因子分解来获得实体和关系表示。具体来说,RESCAL将每个实体与向量相关联,以捕获其潜在语义。每一种关系都被表示为一个矩阵,用来模拟潜在因素之间的成对相作用。三重(h,r,t)的分数由双线性函数定义,如下所示:
其中,是实体的向量表示,是与关系相关联的矩阵。这个分数捕获了h和t的所有成分之间的成对交互作用(见图2) .
2.3基于KG的推荐
RSs在各种在线服务中变得越来越重要。应用于阿里巴巴、亚马逊11等平台的推荐算法实现了推荐功能-
图1.加速器的简单说明(实体空间、关系空间)
图2. RESCAL的简单说明
向用户修补项目。向用户提供相对准确的推荐可以提高这些平台的收入。最著名和最广泛使用的推荐策略是基于协同过滤(CF)的迁方法。为了进行个性化推荐,CF方法通过利用历史用户-项目交互来利用用户偏好信息;CF方法已经取得了显著的成功。然而,CF处理冷启动和交互稀疏的能力有限,这在某些实际场景中是非常常见的问题。此外,在推荐过去从未收到任何用户反馈的新项目时,CF也存在某些缺陷。
目前,现实世界中的商业推荐平台往往考虑到异质信息的不同语义,例如社交网络数据和KG数据。KG中有各种实体,包括所有项目及其字符。研究人员试图通过使用KGs来提高推荐的性能。基于知识图的RSs从几个方面引起了学者们的极大关注。(1)将项目所包含的语义关系反映在一个KG中,有助于提取异构信息网络中用户和项目的潜在特征,提高推荐的准确性。(2)KGs包含关于各种类型项目的富有成效的事实和关系。KGs的复杂连接有利于合理扩展用户的偏好,并以高度的多样性提出建议。(3)KG将用户的历史记录与推荐记录联系起来,从而使推荐系统具有可解释性(Wangetal,2018)。
最近,研究人员提出通过加入KG来改进推荐结果。例如,从异构信息网络中提取用户的潜在特征,有助于表示用户和项目。(Yu,etal,2014)将KG视为一个异构的信息网络,并提取依赖元路径的特征来表示用户和项目之间的关系。(Shi,etal,2014)提出了一个加权异构信息网络和一个加权元路径来描述不同链接值下的路径语义,并用它来预测条目的使用率,首次提出了一个包含推荐系统和KG的混合异构信息网络。为了嵌入具有特征的项目,在一个统一的贝叶斯框架中集成了以下三个项目嵌入组件:知识嵌入、文本嵌入和图像嵌入(Zhang,Yuan,Lian,Xie,amp;Ma,2016)等人提出了一种深度知识感知网络。新闻点击率预测。(DKN)将KG中的实体嵌入和新闻中的单词嵌入视为不同的通道,并设计了一个卷积神经网络来生成一个知识感知的嵌入向量和一条新闻预测新闻点击率。Palumboe提出用KG来包含用户的反馈信息和链接开放数据中的项目信息,得到用户和项目的表示向量,用于秩算法(Palumbo, Rizzo, Troncy,2017)等人提出了一种灵活的符号异构信息网络嵌入方法来表示潜在空间中的用户。利用多个深度自动编码器提取融合情感网络、社会网络和知识网络的非线性表示(Wang,Zhang,Houetal,2018)。同一组人还模拟偏好传播,提出了RippleNet框架。RippleNet可以通过在KG中迭代传播偏好来提取用户的分层潜在兴趣(Wangetal,2018)。Zhao,H将KG视为一个异质信息网络,并基于元图提取潜在特征,以表示用户之间更丰富的联系和项目之间的各种关系。(Zhao,yao,li,song,2017)等人提出了一种层次化协作嵌入(HCE)算法,将RSs和KGs通过可扩展的条目和知识实体连接起来。网络结构和给定KG的文本信息都被用来补充现有的CF方法(Zhouetal,2018)。M.Alexander提出将基于RNN的网络与键值存储网络相结合。他们结合了KG信息来了解用户对某些相同属性的偏好特征(Milleretal,2016).
3.问题定义
本文的每一部分都引入了一些符号,并在这一部分提出了我们的推荐问题。在一个典型的推荐系统中,让将一个用户集n表示为用户数,让I={i1,i2,hellip;hellip;im}表示一个项目集,其中m是项目数。每个商品都有一些用户接受的评审信息,评审可能包含商品的某些特征,如品牌、材料等。组件和功能。具体来说,给定一个把用户u和他的评论历史, p是u以前购买的商品的数量,并仪且中
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[262524],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。