英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
购物猫:在线购物系统对商品的重定位
摘要 如今相较于传统购物,人们越来越喜欢网上购物。网上购物具有诸多便利,如价格低廉,种类繁多,缺乏义务和谨慎购物等诸多优点。然而,从众多商品中选择对客户来说是一项挑战。客户可能会花几天甚至几个月在不同的网站上查看相关商品,甚至偶尔会翻出以前查看过的商品进行比较,直到最终购买为止。随着大量历史浏览商品的出现,人类用户使用传统访问历史列表查看先前访问过的商品页面并不容易。此外,商品的排名可能会发生变化,即使在同一个网上商城使用相同的关键字,也很难甚至不可能重新找到它。为了解决这个问题,我们开发了购物猫系统,以帮助在线购买者通过商品相关功能或先前访问的上下文功能重新查找之前查看过的商品页面。我们评估了购物猫在为期2个月的用户研究中的表现:预测精确度超过70.0%,召回率为84.7%,特别是搜索浏览页面。
关键词 在线购物,商品重新定位,购买兴趣,再访预测
1 介绍
如今,越来越多的人在网上购物。2011年,中国网络购物营业额达到8,090亿元,在线购买者达到2.12亿。每位网上消费者平均花费约4341元,完成18.2笔交易。在输入几个关键字后,客户就会检索到大量的不同颜色,尺寸和品牌的商品。这些商品通常直接来自制造商,因此较便宜。某些广告也可能出现在其他商品上,以扩大消费者的选择范围。此外,其他消费者的反馈可能有助于客户作出更客观的购买决定。足不出户便能买到便宜的商品已经变得无比的简单。在购买实体商品过程中,网购者可能不会立即购买他们正在查看的商品。他们在决定购买之前通常会查看许多类似的商品页面并进行比较。由于网上购物可随时方便地完成,顾客可花费数天甚至数月购物来购买特定商品。在这段时间里,他/她可能会在互联网上随时随地查找尽可能多的类似商品。偶尔,他/她可能想重新找到一些以前浏览的商品进行比较。当面对大量的查看商品时,他们很难用传统的历史列表快速准确地识别以前访问过的商品页面。此外,商品的排名可能会改变,即使使用相同的关键字,也难以再次找到相同的商品。下面我举一个例子来说明这个问题。
莉莉想买一张沙发。在浏览和比较几种类似的沙发几天后,她终于决定购买上一周看到的那个,因为它折扣力度最大。不幸的是,她不能再使用相同的关键词“沙发”重新检索到它。为了帮助在线买家重新检索以前看过的商品,需要解决两个问题。
首先,如何有效地管理客户的访问历史记录,它是否需要包含大量访问的商品网页,用于重新定位?尽管将所有访问的网页存储在数据库中是可行的办法,但这并不是高效的。因为在最终购买之后,顾客可能不再对某种商品感兴趣,而只有相对较少的商品可能被重新访问。因此,可以仅保留具有较高重访潜力的有用商品页面。
其次,如何让客户轻松完成商品重新查找请求? 对于在线商品,除了客户可能记住的颜色,功能,样式,折扣和声誉等商品特性外,以往商品访问的上下文(如访问时间和并发活动)也是客户找回商品的另一个很好线索。
本文提出的购物猫系统解决了以上两个问题。它首先识别并动态管理客户的搜索关键字作为他们的购物倾向。系统从访问的商品网页中提取可能严重影响客户购买决策的商品信息,包括价格折扣,特殊送货费用,卖家的信誉等级,总销量以及与商品相关的人群反馈。商品访问上下文(例如访问时间长度)也记录为客户对特定商品感兴趣的反映。根据这些信息,购物猫可以预测商品页面是否具有未来重新访问同一客户的潜力。对于具有高重定位潜力的页面,其URL,提取的商品属性值以及商品访问上下文(即访问时间和页面访问之前的先前计算程序作为客户访问动机的指示)被存储在存储库中。稍后,客户可以通过商品属性或商品访问上下文从存储库中找到商品。
本文的贡献可以总结如下。
1)我们描述了购物猫系统的设计和实现,以帮助在线购买者进行商品迁移和比较。该系统由六大模块组成,即用户购买兴趣管理;商品特征提取;获取商品访问上下文;商品再访的预测;访问商品的重新定位;和用户系统交互。
2)我们建议使用三个短语来动态构建用户的在线购买兴趣。加上与商品相关的功能,如价格折扣,卖家的声誉等级,总销量和人群反馈,以及用户的商品访问环境(如阅读时间和可能的访问动机),系统会对商品进行预测再访。
3)商品功能和用户访问上下文都可用于制定客户的商品重定位请求。 经过2个月的用户研究表明,购物猫的预测精度达到了70.0%,召回率达到了85%,尤其是在搜索浏览商品页面尤为突出。
本文的其余部分安排如下。我们在第2节中回顾了一些与之密切相关的工作。我们在第3节中展示了购物猫的总体结构,并详细介绍了第4节到第6节中的每个组件。系统性能通过第7节中的用户研究进行评估。我们在第8节中总结该论文。
2 相关工作
2.1 信息重检索工具和系统
谷歌的网络历史记录将用户的网络浏览器历史记录保存在不同的类别中,例如图像和新闻,包括搜索请求和访问页面。除了支持通过页面标题进行基于关键词的搜索之外,它还允许用户在特定日期或特定时间段内浏览其历史列表。SearchBar [1]记录用户的搜索请求,主题,点击页面和备注以供将来重新获取。问答系统CQAds [2]旨在帮助用户找到所需的广告。 它将用户的自然语言查询转换为结构化SQL语言的查询,并返回完全匹配和部分匹配的查询结果。除了传统的基于内容的关键字搜索外,上下文信息也用于增强重新查找信息。 YouPivot系统[3]保存和可视化访问上下文并访问网页,并允许用户搜索他们记得的上下文;通过这种方式,用户可以看到他们最初在该环境中找到的内容。 YouPivot还允许用户记住值得记住的时刻,并提供关于上下文回忆的那个时刻的描述。The Contextual Web History tool [4]利用用户的访问时间和访问网页的可视外观来支持网站重新访问。The Stuff Irsquo;ve Seen系统[5]构建了某人所查看内容的索引,并使用文件类型,访问日期和作者信息进行结果筛选和排序。文件搜索工具Connections [6]根据上下文时间局部信息扩展和重新排序传统的基于内容的搜索结果。 SEMEX系统[7]使用户能够通过数据项以及个人桌面上的对象(即人物,出版物和消息)之间的语义关联(如由谁创作,被引用,附加与和被提及)浏览个人信息。
2.2 用户兴趣预测和管理
Liu et al. [8]对搜索会话中的用户搜索行为进行分析和建模,以预测文档在个性化搜索中的用处。诸如驻留时间,鼠标点击次数以及查询间隔期间的内容页数等数据被合并到用于预测的二进制递归分区算法中。Zhao et al. [9]将商品对的购买间隔分为商品推荐系统,以增加推荐的时间多样性,并提高销售和消费者的满意度。商品对之间的用户购买间隔从他们的购买历史中计算并且被集成到边际效用模型中。 Claypool et al. [10]研究推荐系统的隐含兴趣指标,而不是普通的显式利率评级。他们开发出了一个网页浏览器将用户的行为分为隐式评级(即,鼠标点击,鼠标移动,滚动和经过的时间)以及页面的显式评级。实验结果表明,鼠标点击的时间和次数是很好的隐含兴趣指标。Li et al. [11]研究了个性化搜索中动态用户搜索偏好随时间的变化。基于点击历史数据,利用新颖的排序机制为长期和短期用户偏好建立了独立模型,该机制基于最新用户简档和网页之间的主题树来测量分层语义相似性。Ahmed et al. 12]开发了一种贝叶斯方法来捕捉用户兴趣,这种兴趣随着时间的推移以完全无人监督的方式发生变化。一个时变用户模型是通过建立一个Polya-Urn潜在狄利克雷分配表示来实现的,其中之前表达的兴趣具有在用户级别或跨用户重新表达的强化效果。
2.3 视觉计算方法
在网上购物中,描述性图片和具有启发性的视频构成了客户和商品之间活跃的沟通渠道。在文献中,已经报道了在信息搜索中结合文本关键字和媒体特征的许多视觉系统。 Mani et al. [13]提出了一个用户背景的理论模型,这是通过多感官知识获得的,他们将该模型应用于图像检索。Sketch2Photo系统[14]用手写草图用
图1 在线购物中的搜索页面和商品页面。(a) 搜索页面的样例; (b) 商品页面样例。
文本标签注释,从互联网上创建了一张新照片(照片合成)。使用文本标签和图形特征(如轮廓和突出显示)搜索所需的在线图像以组成和谐的蒙太奇。 Huang et al. [15]提出了一种创建类似阿尔钦博托的拼贴画的新方法,该拼贴画通过用户输入的专题关键词从互联网上获取与主题相关的剪贴画。Goldberg et al. [16]使用从互联网图像获得的相关对象交互操纵照片中的物体。图像检索部分是通过用户输入的关键字和用户选择的对象形状实现的。一种基于概念的视频检索方法,被称为基于图形的多空间语义相关传播[17],利用流形排序算法来探索概念图中的用户查询和概念。我们实现了一个称为M-ReFind [18]的系统,该系统允许用户为感兴趣的媒体文件或网页手动注释当前访问上下文(即访问时间,位置和并发活动)。用户然后可以使用先前的上下文来重新找到目标媒体文件或网页。在本研究中,我们用以下三种方式扩展了以前的工作。
1)我们将信息重新发现问题缩小到一个在线购物应用场景。取代手动注释或有趣商品页面的书签,自动预测被用来智能地识别和缓存用户感兴趣的商品。
2)我们建议使用三个短语来动态模拟用户的购买兴趣。 结合商品功能(如价格折扣,卖家的声誉等级,总销量和人群反馈)以及用户的商品访问环境(如商品阅读时间和可能的访问动机),我们预测商品的重访可能性。
3)客户使用商品功能和以前的访问上下文来制定重新定位请求并重新查找先前访问的商品页面。
3 系统总览
购物猫在网上购物时可以在两种类型的网页上工作,(1)搜索页面:一个接受关键字作为搜索输入的网页,如图1(a)所示;(2)商品页面:描述商品的网页,如价格,运送费用和折扣等,如图1(b)所示。购物猫根据提取的搜索关键词识别和管理客户的购买兴趣 从搜索页面。 它从商品页面中提取商品功能。购物猫仅对商品页面进行商品重定位预测。
图2显示了购物猫系统的体系结构。它由六个主要模块组成:(M1)管理用户的购买兴趣; (M2)提取商品特征; (M3)获取商品访问上下文; (M4)商品重访的预测; (M5)访问商品的搬迁;和(M6)用户系统交互。他们如下协作工作。
图2 购物猫的体系结构
用户购买兴趣的管理者负责识别和动态管理客户的搜索关键字作为他们的购买兴趣。从用户访问的商品页面中提取价格折扣,特殊运送费用,卖家声誉等级,总销售量和人群反馈等商品功能。这些被视为可能影响客户购买决定的关键因素。访问商品页面的访问上下文也被记录为客户对特定商品有多兴趣的指示。根据商品功能和用户访问上下文,购物猫预测那些未来可能由同一客户重新访问的商品页面。对于要重访的商品页面,商品URL,商品特征及其访问的上下文(即用户在页面访问之前的访问时间和计算程序作为客户访问动机的指示)保存在存储库中。商品功能和以前的访问上下文都允许客户制定商品重新定位请求。
4 根据搜索页面管理客户的在线购买兴趣
搜索页面上的客户搜索关键字显示他/她的购买兴趣。 这决定了商品以后被再访的可能性。
4.1 三个购买兴趣状态
在传统的购物模式中,如果人们想购买东西,他们经常会搜索并购买类似商品,并持续数小时或数天;这是购买兴趣的活跃期。然后,这种热情会随着时间而消退,并且变得不如在活动期间更强;这是休眠期,它可能比活动期持续一点点,例如几周或几个月。最后,经过较长时间后,人们可能会忘记或放弃这种购买兴趣;
他们可能已经完成了他们的购买,或者他们只是冷静下来,失去了对商品的热情,所以兴趣变得过时了。
基于在传统购物情况中的上述观察,我们可以将顾客的购买兴趣I表示为搜索关键字集合,I = {k 1,...,kn},输入到搜索页面中,并且动态地管理我基于I的兴趣度计算生命周期,计算如下:
InterestDegree(I)= count(I)/(Now - firstUsageTime(I)),其中提名者计数(I)表示搜索计数I,分母是从原始使用到现在的时间跨度。
根据动态兴趣度,客户的购买兴趣我可能处于以下三种状态之一,如图3所示:
1)兴趣I是活跃的当且仅当InterestDegree(I)? theta;1;
2)兴趣I是休眠当且仅当theta;2? InterestDegree(I)lt;theta;1;
3)兴趣I是过时的当且仅当InterestDegree(I)lt;theta;2。
这里theta;1和theta;2是两个阈值并且theta;1gt;theta;2。 theta;1和theta;2的设置基于我们的用户研究,其中22位经验丰富的在线购买者(11位女性,11位男性,年龄在22-40岁)参加。 所有科目都进行了超过6年的网上购物。 他们几乎每天都在浏览网上购物中心,平均每月至少进行8次交易。 请受试者填写有关他们购物习惯的调查问卷。 问卷中的项目包括以下内容:
1)通常你对某种商品的兴趣能持续多久?
2)通常需要多长时间才能对原本想购买的某种商品失去兴趣?
第一个问题解决theta;1,表示客户的正常活动期; 第二个地址为theta;2,代表休眠期。 我们调查的平均活动时间为2天。 因此,我们设定theta;1 = 1/2,这意味着如果购买兴趣在2天内至少被搜索过一次,那么它是活跃的。 平均休眠期为一周(7天); 因此,theta;2被设定为1/7。 这表示购物猫会在7天内至少搜索一次购买兴趣; 否则会被丢弃。兴趣类型随时间动态变化。 一旦它变得过时,它将从购物猫系统中删除。
4.2 购买兴趣的状态变化
与我们的人类记忆一样,可以在相关的事件或事实之间建立联系,用户的购买兴趣状态可以通过交互进行发展。例如,新的兴趣可以帮助用户记
全文共11387字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[9254],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。