英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
智能在线推荐系统的设计与实现
都柏林大学计算机科学学院智能信息检索小组系
爱尔兰都柏林
摘 要
本文介绍了智能推荐系统的总体设计和体系结构,该系统的主要目的是为用户导航提供大量信息,以帮助用户找到正确的信息。需要使用替代推荐系统技术来快速检索高质量的推荐,即使是从大量数据中也是如此。奇异值分解-协作过滤(SVD-CF)方法是通过减少产品空间的维数来解决一些推荐系统问题的技术,因此可以提供更好的建议。借助这些技术,我们可以捕获用户和项目之间的重要潜在关联。此外,通过考虑购买倾向于一起购买的产品,用户可以从其推荐列表的扩展中受益。
介绍
推荐系统的引入提供了一种解决方案,通过导航大量可用信息来解决其爆炸性速度的增长。电子形式的可用信息(例如新闻,电影,书籍,广告和其他在线信息)使我们不知所措。推荐系统是基于计算机的技术,可用于在许多电子商务领域中有效地提供个性化服务。在客户和供应商互动的领域中,两个团体都可以从中受益。客户将从系统中获得反馈,并获得一些有关其可能购买的商品的建议,从而从中受益。同时,随着销售的增长,企业将从中受益。
最有前途的推荐技术之一是协作过滤(Resnick 1994)(Shardanand and Maes 1995)。该技术通过构建一个具有用户意见的商品数据库。然后,将一个
美国人工智能协会(www.aaai.org)版权所有copy;2005。版权所有。
特定用户与此数据库进行匹配,以找到她的邻居,与她分享相似喜好的邻居。协作过滤已被电子商务站点和信息过滤领域成功使用(Schafer,Konstan和Riedl,1999)(Sarwar等,2000a)。
尽管这项技术取得了成功,但仍然需要克服一些挑战。第一个问题是提高协作过滤算法的可伸缩性。随着搜索过程中数据负载的增加,实时性在搜索过程中会出现可扩展性问题(Sarwar等,2001)。这项技术面临的第二个问题是提高推荐反馈的质量。不正确的建议可能会破坏“零售商”公司与其用户之间的良好关系。
Amazon.com(Linden,Smith和York,2003年)就是协作过滤技术应用的一个很好的例子,该网站用于帮助客户获得针对特定类型产品的良好推荐。准确的推荐将赢得用户的忠诚度,鼓励他们浏览更多和购买更多。Amazon.com也许是电子零售商现象最有代表性的例子。但是,该电子商务公司并未使用其所有可用数据来提出建议。实际上,它只使用其中的不到百分之一(Sarwar et al。2001)。
由于常见的推荐算法无法解决推荐系统的缺点,因此需要寻找其他功能更强大的算法。这促使我们研究降维技术的使用(Berry,Dumais和OBrian,1995年)(Anton和Rorres,2000年),以期改善推荐系统的性能。具体来说,我们研究了一种称为奇异值分解(SVD)的技术,以减少推荐系统数据库的维数(Sarwar等2000b)(Vozalis 2003)。
本文概述了智能推荐系统的设计,总体架构和功能,该系统旨在支持和便利要求苛刻的客户,以寻找合适的商品进行购买
(Herlocker 2000)(Swearingen和Sinha 2002)。它通过捆绑一组产品并创建反馈列表来实现,从而预见了客户的期望。该系统允许用户标识自己的推荐列表,并通过汇总她不知道的新商品来个性化购物体验。所有这些过程都意识到了及时性问题。最后,本文重点介绍了协作过滤和奇异值分解的技术如何相互补充,以及如何结合各自的优势来克服其他推荐系统的某些问题。
SVD-CF组合系统方法
本文提出了一种奇异值分解-协同过滤推荐系统,旨在实现以下目标:
减少检索时间:该系统减少了反馈过程所需的时间,从而避免了搜索过程中的瓶颈,这可能导致用户不满意,甚至可能失去对公司的忠诚度。我们的系统,即智能在线推荐系统(IORS),利用关系数据库来生成及时的反馈。
搜索整形:IORS减少了搜索首选项目的艰巨过程。该系统利用推荐技术和购买数据库来预期用户的愿望。借助降维,我们可以减少大量数据产生的噪声。通过接收有关他们可能购买的商品的建议反馈,可以在选择个性化商品的过程中为用户提供支持。
推出新的首选项:客户可以利用用户和产品之间的新关系,从而允许他们查找以前未知的新首选项。主要由于降维技术,我们可以捕获项目和用户之间的潜在关联。
推荐列表的扩展:通过考虑购买倾向于一起购买的产品,用户可以从他们的推荐列表扩展中受益。此选项使我们可以预期用户需求。
交互式GUI反馈:IORS提供了一个可视化浏览器,该浏览器允许用户以交互方式从最佳到最差的项目筛选建议。此外,可以通过不同方式(例如,按项目类型)过滤此列表。推荐系统应帮助客户发现和发现新的,相关的和有趣的物品。
IORS流程模型
IORS系统当前可与电影推荐域配合使用,但可以轻松地针对其他域进行定制。选择该域的原因主要有两个:第一,在线电影推荐服务的可用性和使用性很高。其次,更重要的是,电影领域一直是公认的研究小组(如Movielens和Everymovie)的设想,这可能有助于我们比较和评估结果的有效性。
IORS系统建模是从用户需求的角度实现的。为了设计成功的电子零售商应用程序,我们需要考虑用户的需求和期望。
目标 |
用户 |
系统 |
揭开未知物品 |
必须注意新项目 |
突出显示可能是首选项目的新项目。 |
值得信赖的推荐 |
期待有用的反馈。不要仅仅为了给用户提供推荐而推销产品 |
反馈必须以一种方式呈现,以便用户可以识别熟悉的项目以及新的相关项目。 |
透明系统 |
必须发现推荐过程符合逻辑。 |
设计清晰,友好的系统,以使购买愉快。 |
精致的建议 |
应该能够完善推荐并排除特定类型。 |
通过使用不同类型的过滤器提供灵活的搜索。 |
项目评估 |
需要表达他们对自己偏好的看法。 |
允许用户通过要求他们评估所需次数来评估项目。 |
扩大偏好 |
必须允许他们探索自己的口味并扩大他们的喜好范围。 |
使用音频和视频以使用户体验并发现新项目。 |
购买教育 |
想更多地了解他们的物品。 |
提供有关项目以及等级,图片的信息。 |
购物经验的吸引力 |
购买体验必须愉快而有趣 |
参与过程的设计。问题和反馈的混合。 |
表1:系统设计要求
我们制定了一个结构化表格(请参见表1),以概述与用户期望有关的问题或目标(Swearingen和Sinha 2002)。换句话说,此表格构成了系统,并将作为应用程序设计的指南。
接下来,我们介绍我们的主要模型以供推荐。图1将基本模型显示为UML类图。此模型中最重要的类是MovieRecomSVD-CF。顾名思义,这表示将向确定用户提供的推荐过程。通过使用SVD-CF技术可以辅助此过程。此类生成个性化列表。
OfferList是生成最终推荐列表的类,该推荐列表将被推荐给确定的客户。
Profile类定义为User类的集合。在个人档案类的情况下,我们可以看到用户将拥有单独的个人档案,这将使他们与其他顾客区分开来,例如,家庭主妇和女学生之间可能存在的不同品味和喜好。
从该模型可以看出,User类和Movie类之间的关联本身具有属性。Selection类表示该关系的属性。因此,Selection类成为Movie和User类的关联类。Selection类与MovieRecomSVD-CF之间的关系在相似性过程中起着重要作用。
图1:推荐主要模型。
现在,我们重点关注整个推荐方案中最重要的方面之一-如何在项目目录中选择产品时如何支持用户,以及此过程如何导致建立和存储个性化列表。图2给出了推荐过程的快照,该过程使用来自以前的奇异值分解技术的精炼数据提供资源。
让我们假设用户想要选择具有某些特定功能的电影。用户首先输入电影的部分描述(类型,喜爱的演员等)。如果用户是注册用户,则系统将自动识别她,因为存储配置文件,并会知道一些关于自己的描
述,例如:年龄,职业,口味等。在第二步中,IORS系统搜索项目目录并检索满足那些条件的项目。该搜索基于协作滤波与使用奇异值分解进行预处理的相似性技术。因此,先前记录的个性化数据用于对这些项目进行排名。与过去类似用户表达意见的电影最相似的电影排名第一。最后,系统记录用户表达其意见的电影(无论是显式的还是隐式的),以供将来参考。
图2:建议主要活动图。
IORS架构
在本节中,将IORS系统的一般体系结构描述为分层体系结构。更具体地说,本节重点介绍使用IORS推荐框架构建的推荐系统。该框架是可以提出建议的结构。它是通过三层过程完成的,请参见图3。
IORS系统体系结构的表示层充当用户和应用程序逻辑层之间的连接。它是用户界面中可见的部分,用户可以通过该部分寻求帮助。
并查看建议。系统从这一层验证并转换用户需求,将此信息传输到应用程序逻辑模块,并格式化返回的反馈列表,以向用户提供有用的建议。我们决定使用JavaServer Pages(JSP)技术,因为它提供了一种简化的有效方式来创建动态Web内容。此外,JSP技术还可以快速开发与服务器和平台无关的基于Web的应用程序。在可接受的时间内返回的此响应可能会对零售商保持用户忠诚度有所不同(Linden,Smith和York 2003)。
我们系统体系结构的应用逻辑层是数据层的推荐内容和用户需求的组合,以便获得由推荐项的排序列表及其相应分数组成的推荐。此建议列表将返回到“表示层”以显示给用户。重要的是要强调,为了集成关系数据库中包含的信息,我们的方法利用了与Java交互的SQL。我们决定使用PL / SQL,因为它通过添加在过程语言中发现的构造来扩展SQL,从而导致结构语言比独立的SQL更强大。
数据层是IORS系统获取所需数据的地方,也就是说,是可用客户偏好的数据库。应用逻辑层响应于来自表示层的输入,在该层中存储和升级数据。
图3:IORS架构图
推荐系统域中的SVD-CF方法
本文的其余部分集中于提供IORS系统使用的相似性过程的进一步说明。所使用的特定技术是奇异值分解和协作过滤。
潜在语义索引(LSI)是一种统计信息检索方法,已广泛用于信息检索(IR)中,以解决同义词和多义性问题(Deerwester et al。1990)。LSI使用奇异值分解作为其基础矩阵分解算法。由奇异值分解产生的减小的正交维比原始数据少噪杂,捕获了术语和文档之间的潜在关联(Berry,Dumais和OBrian 1995)。
给定一个术语-文档-频率矩阵,构造了两个维数减少的矩阵,它们分别表示术语的潜在属性(如它们在文档中的出现所反映的)和文档的潜在属性(如它们在其中出现的术语所反映的)。
奇异值分解是一种众所周知的矩阵分解技术,可将mxn矩阵R分解为三个矩阵,如下所示:
R = U . S . VT
其中U和V分别是大小为mxr和rxn的正交矩阵;r是矩阵R的秩。S是大小为rxr的对角矩阵,具有矩阵R的所有奇异值作为对角线条目。可以考虑将rxr矩阵S减少为仅具有k个最大对角线值,以获得矩阵Sk,其中k lt;r。(Gregorcic 2001) (Sarwar et al. 2000a).
矩阵S的所有条目都是正的,并且按降序排列。这些矩阵非常有用,因为我们可以获得原始矩阵R的较低秩近似(Anton和Rorres 2000)。
根据上述内容,我们考虑了一个相似性模型的场景,该模型包括一组客户C = {c1,hellip;cn},一组产品P = {p1,hellip;hellip;, pm}和一组可能的等级I。让我们假设我们有关于
客户和产品(c,p),其中cC和pP。
因此,我们的方法是基于这种情况来计算最终的最终矩阵:Rk,Uk.Sk,Vk.Sk,然后进行协同过滤过程。
结论
作为最成功的推荐系统技术之一,协作过滤已在电子零售商站点中广泛流行。总的来说,推荐系统已经被海量的用户信息所困扰,并且随着全球Internet域的增长而变得更加捉襟见肘。
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[236066],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。