英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
基于多维相似度测量的 O2O服务推荐方法
【摘要】:随着信息技术的快速发展,消费者可以在网上搜索和购买服务或产品,然后在线下商店消费。这种新兴的电子商务模式被称为线上线下(O2O)服务,吸引了商业和学术界的关注。互联网上大量的O2O服务产生了一个可伸缩性问题,创建了大量但高度稀疏的矩阵,将客户与购买的商品联系起来。本文提出了一种基于多维相似度测量的新型O2O服务推荐方法。该方法包括三个相似度度量:协同相似度、偏好相似度和轨迹相似度。实验结果表明,多个相似度度量的组合比任何单一的相似性度量都有更好的效果。我们还发现,在稀疏矩阵中,轨迹相似度比基于速率的相似度度量(协同相似度和偏好相似度)好得多。
【关键词】: O2O服务 推荐系统相似性度量 稀疏矩阵
1.引言
电子商务继续快速发展,为消费者和供应商提供了巨大的机遇和挑战。在线市场准入在实时的规模上取得了进展,为消费者提供了几乎无限的产品和服务机会。因此,利用自动化系统来帮助消费者寻找供应商是很有价值的。Ramell[1]在2010年提出了线上线下(O2O)商业领域。
Yang等[2]研究了影响消费者选择线上或线下渠道的因素。O2O商业是一种商业模式,吸引潜在客户从线上到线下实体店。客户可通过在线渠道进行分类(如电子邮件或网站广告)。这些客户可能会被诱导通过不同的机制离开在线空间。这种商业方法将在线营销和实体营销的经验和技术有机地结合起来。O2O商业可以分为三类服务:O2O服务的信息评论、O2O服务的智能导航和支付O2O服务(即dianping.com和meituan.com)。
作为最具影响力和广泛应用的O2O商业类别,支付O2O服务对许多人的生活方式产生了影响。团购O2O服务让客户先购买优惠券,然后在线下商店消费。这些客户还可以提供他们离线体验服务的评级和评论。仅在北京,就有10万家餐厅提供团购O2O服务。顾客的选择太多了,很难做出选择最合适的O2O服务的最佳选择。
推荐系统在电子商务中得到了广泛的应用[3,4]。协同过滤(CF)的经典个性化推荐方法是处理信息爆炸问题最常用的方法。它在服务推荐中被发现是有效的[5],并被亚马逊和eBay利用。CF的核心是每对用户的相似度估计,反映了目标用户基于他们最相似的邻居的行为倾向。Pearson相关系数(PCC)是一种典型的相似性度量方法,但它忽略了排序偏好和用户服务历史。另外,由于PCC是一个数值计算,它不能对稀疏矩阵进行操作,在这个问题区域中,大多数用户服务矩阵都非常稀疏。
因此,我们提出一种基于多维相似度的O2O服务推荐方法,结合协同相似度、偏好相似度和轨迹相似度。其目的是比较稀疏矩阵中的性能。本文的其余部分组织如下:第2节回顾了关于O2O服务的文献,推荐系统,协同过滤,以及推荐系统中的相似性估计。第3节描述了协作相似度、偏好相似性和轨迹相似性度量。
第4节给出了基于第3节计算的相似度的O2O服务推荐模型。第5节报告了实验的比较结果,其次第6节给出了结论和对未来工作的建议。
2.文献综述
O2O近年来获得了大量的研究关注。许多报纸已经提出了在线和实体店的技术接受模型[6]。系统和信息的质量也被提出用来衡量在线消费者的态度[7]。事实上,消费者信任已经被发现在网上和线下传播[8]。相反地,有证据表明,忠诚度计划在网上的效果比在线下市场更好,至少部分是由于需要在线下实体店购物[9]。在O2O电子商务的声誉管理中,Xiao and Dong[10]使用半马尔可夫模型提出了一种新的声誉管理系统(HSMM-RMS),通过将可观察的线上和线下的原始信誉信息相结合。线上和线下的商业与价格机制有关,目的是寻找电子商务与传统购物模式的异同[11-14]。从不同方面研究了线上和线下系统的区别[15,16]。然而,大多数发表的研究都采用了O2O的营销视角,而不是O2O服务推荐。
个性化推荐方法是解决信息可伸缩性问题最常用的方法[3,4],在服务推荐中被发现更有效。Zheng等人研究了基于QoS[17]的web服务推荐,包括基于cf的[18、19]和基于内存的推荐[20]。这些研究人员还考虑了服务推荐的时间因素[21]。在服务推荐研究中,协同过滤(CF)是最常用的方法[22],包括图形[23]等其他推荐领域,包括基于项目的CF[24]和基于用户的CF。CF的核心是相似度估计,适用于所有类型的推荐方法[25]。皮尔逊相关系数(PCC)是最常见的相似度测量,可以精确地产生用户之间的数值距离[26]。然而,PCC并不适用于稀疏矩阵,大多数O2O应用程序都非常稀疏。
最近有许多研究在推荐系统中寻址相似度估计。由于PCC在处理不稳定和稀疏的评级问题上表现不佳,因此在使用中,排序相似度得到了广泛的应用,包括Kendall Rank Correlation系数(KRCC) [27], Spearman Rank Correlation Coefficient (SRCC) [28], AP相关系数[29]。考虑到服务消费,Jaccard的系数[30]被采用[31,32]来估计服务推荐相似度。此外,考虑到信任关系对用户决策的影响,采用基于社交网络分析的信任度估计的程度来提高推荐[33]中传统的相似度计算。随着深度学习的快速发展和大数据的出现[34],基于视频和音频信息的计算相似性具有很强的挑战性。
然而,关于推荐方法在O2O服务中应用的研究是有限的。在O2O推荐中,目前还没有关于多维相似度测量方法的发表研究。我们的论文试图填补这一空白。
3 O2O服务用户相似度估计
Assum OS={osi|iisin;{1,hellip;,n}}是一组n个 O2O服务集合,U={up|pisin;{1,hellip;,m}}是 m 个O2O服务用户的集合, R={ri,p |我isin;{ 1,hellip;,n },pisin;{ 1,hellip;,m } }是评级矩阵ri,p代表了up给osi的评级。考虑到不同的评价标准,我们将矩阵Rs分为两组(即“成本cost”和“效益benefit”),将R归为0到1的区间内。如果R是“收益”,那么更高的评级是,更满意的用户是O2O服务的用户。反过来说,R是“成本”。归一化评级rni,p可计算为:
其中,rmaxi和rmini分别是O2O服务osi的最大与最小额定值。我们估计了基于标准化评分的U中的每两个用户之间的相似性。这里,评级是为了“利益”。
3.1协同相似度计算
给定评级ri,p,我们可以获得协同相似度,从而准确地保证不同O2O服务用户之间的数值距离。它反映了潜在用户的偏好。我们利用Pearson相关系数(PCC)来估计协同相似度。PCC被广泛用于估计两个实体之间的线性关联程度[3],并通常计算推荐系统中用户的相似度:
CSp,q是up和uq的协同相似性,范围从minus;1到1。负的值是表示它们没有相互关系,而不是相反的行为。例如,如果up和uq有负的协同相似度,那么这并不意味着当up给予osi的高评级时,uq会反过来给出一个低的评级。因此,我们只考虑积极的协同相似度,这个值越高这两个O2O服务用户之间的行为越相似。分别是up和uq使用O2O服务的平均评级。OSp,q是up和uq共同消费的O2O服务集。
3.2 偏好相似度计算
协作式相似性度度量了用户之间基于评价具体值的相似性。然而,用户对O2O服务的排名可以更好地表达他们的偏好。如果一个特定O2O服务的两个用户给出了类似的排名,我们预料他们在一定程度上有相似的偏好,即使他们对每个O2O服务给出不同的评价。例如,如表1所示,我们假设用户up和uq给出O2O服务os1、os2、os3和os4的评级,范围为1到5。很明显,他们对这四种服务的排序是相同的,尽管协同相似度不等于1。
因此,为了产生有效的推荐结果,应该尽可能准确地计算不同O2O服务用户之间的偏好相似度。根据评级,排名信息可以提供有价值的见解和不同于协同相似度的独特信息。
我们采用Kendall等级相关系数(KRCC)来估计偏好相似度[32]。KRCC由于其简单的实现和良好的性能,经常被应用于以排名为导向的推荐系统研究中。PCC在推荐系统的相似度估计中得到了广泛的应用。但KRCC在服务排名相似性估计过程中更为合适。在偏好相似性PSp,q计算中,KRCC可以计算如下:
其中,OSp,q为up和uq联合使用的O2O服务集,|OSp,q|表示OSp,q的基数。f (x)是等于0 (xlt;0)或1 (xgt;0)的二元阈值函数。值得注意的是,如果两个O2O用户给出相同的O2O服务排名,PSp,q = 1。
根据KRCC计算的精确排序相似度估计,偏好相似度可以测量不同用户的一致性。然而,它可以过高估计那些不太相似的消极的O2O服务用户的相似度,因为他们没有共同消费的服务。
表2显示了一个示例,其中包含3个O2O服务用户(u1到u3)和4个O2O服务(cs1到cs4)。本例中的数据都是从一个实际的O2O服务数据集中提取的,该数据集如下所述。利用方程式。(3)和(4),我们计算用户之间的偏好相似度,得到结果:ps1,3gt;ps1,2,这意味着u1与u3与u2更相似which means u1 is more similar with u3 with u2。显然,其结果是片面的,因为消费历史的局限性。因此,特别是在稀疏矩阵环境下,有必要考虑用户历史轨迹以加强相似度估计。
图1 基于多维相似性度量的O2O服务推荐过程。
图2 网络爬虫代码的摘录
3.3 轨迹相似性计算
考虑到用户消费的O2O服务的数量很少,这似乎是合理的。因此,用户服务矩阵过于稀疏,通常在数据集中有lt;5%的评级。在这种情况下,协同相似度和偏好相似度不能准确反映真实情况。此外,协同相似度只估计数值距离,不考虑O2O服务用户的消费轨迹。同样,偏好相似性只考虑排序距离,这与轨迹记录的统计特性无关。
因此,轨迹相似度是基于O2O服务的历史消费记录进行的估计,对用户的相似度计算具有重要意义。例如,如表3所示,up已使用服务os1、os2、os3和os4;uq使用os2、os3和os5,而ur使用os6和os7。虽然up, uq和ur是现实世界中不熟悉的O2O服务用户,up和uq的相似度比up和ur高,因为他们都使用os2和os3,即使他们的评分与up和uq不同。
为此,我们利用Jaccard的系数来计算轨迹相似度,这是经常采用的量化二元变量信息不对称信息的方法[30],它可以呈现用户的消费轨迹。因此,up和uq的轨迹相似度TSp,q可以计算如下:
其中|OSp|和|OSq|分别为up和uq都使用的O2O服务的数量。|OSp,q|是由up和uq共同消费的O2O服务的数量。TSp,q在[0,1]区间内,较高的值表明两个服务用户具有相似的服务消费历史。
4 O2O服务推荐模型
对于O2O服务用户的相似度估计,协同相似度可以准确反映用户行为的数值计算。不同的用户可以使用不同的评价标准(例如:一些用户喜欢给予更高的评级),O2O服务的不同评级也会产生类似的排名,这表明用户也有类似的偏好。因此,偏好相似性从另一个方面估计了行为的一致性。然而,总的来说,
全文共13114字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[14572],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。