用于用户交互问答的Web平台外文翻译资料

 2022-04-21 21:29:13

英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料


用于用户交互问答的Web平台

刘文茵 amp; T田永浩 amp; 魏晨amp; 闵丰

收到日期:2007年7月22日/修订日期:2008年6月8日/

接受日期:2008年8月1日/网上发布:2008年8月21日

#Springer Science Business Media,LLC 2008

摘要:一个名为BuyAns的用户交互式问答(QA)平台(在www.buyans.com)被提出。该平台是一种特殊的在线社区,主要特点是所有回答用户问题的奖励方案,提问和回答的用户界面(UI)模式,以及用于积累问答的表示和存储方案模式。该系统实际上提出并推广了用于交换和使普通人知识商业化的C2C商业模式。它也可以被用作知识获取的激励和协作方法。在商业模式的驱动下,回答及时并且质量高的答案很快就会累积。由于使用的模式,可以为重复问题自动提供准确的答案。提高功能和技术,包括用户建模,信誉管理,以及答案聚类和融合,也都进行了简要介绍和描述。初步的用户研究表明系统对用户的潜在吸引力与系统的合理可用性、用户满意度一样高。我们期待在Web 2.0时代有这种系统的热门应用。

关键词: 关键词问答,用户交互式QA系统,C2C商业模式,知识获取,网络社区,Web 2.0

  1. 介绍

由于现在可以在线获得大量的信息,网络正日益成为解决各种与领域无关问题的理想答案来源。搜索引擎(如Google)是人们经常使用的工具,用于在Web上找到他们需要的信息。然而,他们结果反馈的准确性和相关性在许多情况下仍然不能满足。因此,问题回答(QA)系统(如Ask Jeeves2)更受偏爱,它们可以自动理解用户的问题并反馈确切的答案。尽管目标是好的并且很有希望,但通过模仿直接获取答案的自然QA方案的隐喻,当前QA系统的准确性仍然依赖于计算机系统的人工智能(AI),在很多情况下还是不尽如人意。因此,自动QA系统仍然无法胜过搜索引擎。这就是为什么没有像Google一样受欢迎的网络上运行的QA系统。我们认为自动QA只是人工智能的另一个努力,它试图实现自动信息检索,但仍不能解决当前信息检索技术的基本问题:精确度/回忆率。

此外,这些努力只能检索已经在网络(或网络世界)上提供的信息,但不能获取当前在线无法获得的信息或知识。 某些问题只能由专家解答。 因此,为了便于获取或交换这些信息或知识,我们开发了一个基于Web的用户交互式QA系统,称为BuyAns。实际上,该系统可以用作知识获取的协作方法。 随着越来越多的知识积累和充分表达,可能会有更准确的自动问答。它是Web 2.0的一个应用,它利用所有用户的集体智慧,并相信他们是开发人员,逐渐使系统的数据或知识更丰富。

事实上,已经有一些Web社区,比如BBS和各种论坛,可以用来交换意见,意见或者一般信息。知识作为一种特殊的信息,也可以在这些网络社区中交换和共享。用户通常可以免费提问并获得其他用户的答案。但是,人们,特别是专业人员通常很忙。他们有时可以自愿回答一些问题以分享他们的知识,但并非总是如此。这是因为回答这些问题的代价是他们的时间,这也是宝贵的。但是,如果他们能够通过回答问题获得某种回报,例如金钱,他们应该更愿意花费宝贵的时间。在这种情况下,他们的时间和知识将得到回报。这实际上是一个经济原则和我们开发BuyAns的动机和假设。我们相信有很多(专业)人愿意为他们的紧急问题付费,而且有更多的人知道答案,并且希望花一些时间来提供答案,只要他们的回报高于他们的成本。因此,我们相信这样的系统将具有非常有前景的市场。

BuyAns作为一个有价值的用户互动质量保证体系,提出并推广C2C商业模式,用于商业化普通人的知识。该系统为网上知识交易提供了一个便利的市场,普通人可以在一方面通过为潜在答案提供一些资金来请求解答他们的问题,另一方面通过回答其他人的问题赚取一些钱。

如果在全球知识数据库中存档和正式存档,系统中累积的答案可以在以后重复使用。特别是,如果有些用户要求相同或相似的问题,系统可以自动提供正确的答案。然而,自然语言格式的问题和答案不容易被机器理解,尽管人类相对容易理解。如果不能被充分表达,积累的答案就像当前的Web文档一样不易使用。因此,为了使问题和答案对于机器和人类都是可以理解的,我们提出了一个用于询问和回答的UI模式。提问模式是一类问题的基本形式,不仅结构相似,而且与语义概念相关。特定模式中的每个变量部分都被语义标签注释,它不仅用于提醒用户在使用时填写正确的文本,还让机器知道填充文本的语义。因此,我们也称之为语义问题模式。此外,累积的问题和答案以这种基础模式的格式来表示和存储,这种格式能花费最少的努力转换成用于机器有效理解,处理和推理的正式知识表达。在这种情况下,具有其积累的知识的系统可以用作具有完全匹配结果的某种搜索引擎,或者至少作为当前搜索引擎的补充。

BuyAns可以作为涉及众多用户的各种应用的知识获取平台。 特别是可以作为技术支持或员工持续培训的平台。 公司产品的最终用户可以在平台上互相帮助,从而可以大大减少技术支持人员的工作量,从而节省相应的成本。 新员工有关其工作的问题可以由其高级同事回答,并且公司的内部知识可以作为副产品获得并积累。 为了支持或促进这些特征,还开发了其他技术,包括用户建模,声誉管理和答案聚类和融合,并将在本文中进行简要描述。

本文的其余部分安排如下:第2节介绍相关工作。 第3节介绍了BuyAns的系统架构。 第4节介绍了系统的主要功能和用户界面。第5节介绍了包括可能的商业模式和用户研究在内的应用问题。第6节总结本文并讨论了未来的工作和潜在问题。

  1. 相关工作

搜索引擎实际上可以被看作是一种特殊的QA系统,并且在一定程度上可以作为一种方便快捷的手段在网络上获取知识(或者一般信息)。 用户可以在搜索引擎中以关键字的形式提出问题,然后以链接的形式向用户提供答案。 搜索引擎的优势之一是他们对用户查询(问题)的直接反应。 然而,搜索引擎通常会返回很多Web文档的链接,但仍不能保证与用户问题的相关性。 用户仍然需要花一些时间从他/她自己的搜索结果中找到正确的答案。

从这个意义上说,自动QA系统的开发目的是为问题而不是文件列表返回一个简洁的答案。 特别是,文本检索会议(TREC)系列近年来极大地促进了QA研究。 在TREC8,TREC9,TREC10中,要求QA系统返回由MRR评估的5个排名的答案。每个测试问题的度量[8]。 在TREC11中,QA系统需要为每个测试问题仅返回一个确切答案。 TREC12和TREC13中的质量保证体系需要返回一个文件摘录(不超过250个字符),相信这个文件包含对问题的回答或“NIL”,用于表示系统相信在该问题中没有正确的答案 收藏[9]。

由于自动化系统的准确度较低,交互式QA系统尤其有用。潜在地,所有在线论坛系统都可以用于用户交互式QA。还有几个专门设计的用户交互式QA系统,其中包括Google Answers[3]是最有名的一个。它的设计基于以下假设:如果一个普通人只是为了得到问题的答案,最好是请专家而不是自己去寻找。 Google Answers招募了一批研究人员,他们经过测试和培训,成为寻找网上和网页难以查找的信息资源的专家。注册用户可以将他/她的问题发布到Google Answers;并且他/她应该指定他/她愿意为获得答案付多少钱。 Google答案将价格限制在2美元至200美元之间,如果提问者不满意所有答案,此款项可退款。此外,Google Answers还收取每个问题0.5美元的不退还费用。发布的问题将由Google专家解答,如果问题答案满意,Google专家将为该问题赚取所需的资金。最后可以通过电子邮件告知提问者答案。所有问题都可以在Google Answers网站上公开查看,以便其他人可以添加他们的评论。然而,正常的注册用户只能添加他/她的评论,但不能通过提供他/她的答案来赚取这笔钱。 Google Answers在许多领域收集了各种问题的丰富答案。用户可以免费搜索和查看数据库中已解决的问题。这确实是分享和检索知识的好方法。然而,由于其严格的政策,它最终失败了。价格在2美元至200美元之间的价格太严格了。 1美元甚至0美元可能会给更多的人尝试它的机会,并给它更多的成功机会。另一个原因是Google Answers不是真正的Web 2.0网站。只有少数所谓的专家不足以回答所有问题。没有机会给普通用户和其他“专家”。因此,没有真正的竞争。应该有许多其他的普通用户可以提供比那些“专家”更好的答案。因此,相反,雅虎!答案[6]虽然后来推出,但由于其更灵活的策略而非常成功。

新浪iAsk [4]是另一个有前途的用户互动QA系统,主要针对华人社区。与Google Answers不同,新浪iAsk并非直接由金钱驱动。在iAsk上发布问题不需要花费任何实际金钱。每个人都自愿帮助别人得到答案。与Yahoo!类似答案是,用户可以获得的是网络社区的功劳。但是,用户在iAsk中获得的信用与Sina3中的用户社区门户相关联,因此他/她也可以更改他的信用以获得一些奖励。新浪iAsk没有相应的研究员或专家角色。每位注册用户都可以发布自己的问题并自由回答他人的问题。因此,提问者应该承担答案质量可能不高的风险。然而,这个问题可能并不太严重,因为提问者通常只需要知道基本想法以解决他/她的问题。其他用户的回答/评论,即使质量较差,仍然可以为提问者带来一些有价值的提示。此外,新浪iAsk还邀请了来自各个领域的许多专家机构加入该系统。例如,邀请几家律师事务所参与解决与法律问题有关的问题。这些专家机构有动力回答相关问题,因为他们可以在答案中提供免费广告。系统还为回答的问题保留一个摘要,这是所有Web用户非常好的知识库。因此,总的来说,新浪iAsk的用户满意度相当不错。百度智道[5]可能是中国最受欢迎的用户交互式QA服务,尽管它比新浪iAsk更早推出,因为它与百度搜索引擎相关联,并且是一个很好的补充。最近,许多其他公司,包括微软,亚马逊和腾讯也推出了类似的服务。因此,我们相信4年前提出的这个想法几乎成为QA下一个热门互联网应用之一。

与上述交互式QA系统相比,我们的BuyAns系统具有相当多的新业务模式,可以鼓励用户积极参与,并获得高质量的知识。 BuyAns还具有许多新颖的功能和用户界面,包括基于模式的提问和回答以及回答集群和质量评估。 这些功能和用户界面可以进一步促进高质量的知识获取。

为了协同知识积累和管理,知识网格[11]是一个智能,可持续的互联网应用环境,使人或虚拟角色能够有效地捕获,发布,共享和管理显式知识资源[12]。 在知识网格环境下,我们的QA系统可以作为推荐系统,根据用户的模型向用户提供内容。 诸葛的知识空间模型[16]也是构建我们系统中提供答案很好的候选者。

  1. 系统构架

BuyAns的系统架构如图1所示,包含用户界面,供用户交互式发布和浏览问题/答案(Q / A),内容分析器,搜索模块,答案集群和质量评估模块, 用户管理模块,模式数据库,当前Q / A数据库(将所有未解决的问题及其当前答案存储在不同的板块中),累计Q / A数据库(针对具有正确答案的历史问题)以及知识库。

典型的用户场景如下。 用户使用模式(或不使用)通过用户界面发布问题(使用一定数量的金钱作为报价)以获得正确的答案。 内容分析器接受问题并将其分发到当前Q / A数据库中的相应板上。 用户也可以手动选择一个合适的主板来提出问题。 同时,内容分析器也会自动将问题发送到搜索模块,该模块首先尝试通过搜索和推理从知识库中获取答案,如果失败,则尝试在“累计Q / A”中搜索类似的问题 数据库并返回相关的正确答案。 自动获得的答案与问题相关联并显示在相应的板块上。用户管理模块负责计算和管理用户模型,包括他们的兴趣,权限(能力和经验),声誉和金融交易。 它还包括促进提问者和答复者之间争端解决的职能。

Search

  1. 主要功能和用户界面

BuyAns系统具有许多新功能和用户界面。 在本节中,我们只简要介绍其中四个:(1)基于模式的QA过程; (2)自动回答重复或类似问题; (3)用户建模; (4)答案聚类和质量评估。 其他功能,包括基于模式的Q / A对的知识提取,将在未来开发并在单独的论文中提供。

4.1基于模式的质量保证过程

模式或语义问题模式是我们QA系统的独特功能。 (语义问题)模式是一类问题的一般形式,不仅在结构上相似,而且在相似的语义概念上也是如此。 每个可变部分(也称为占位符)以特定模式注释,由语义标签标注,用于不仅提醒用户在使用时填写正确的文本,而且让机器知道填充的语义。 郝等人详细介绍了模式和相关应用定义的先前版本。 一种自动生成方法也被他们提出和实现,它可以使用基于熵的模型基于一组自由文本问题生成高质量的语义模式。 在本文中,我们简要介绍模式的主要思想,并重点介绍其更新版本和新应用程序。

当用户想发布一个问题时,他/她可以使用自由文本来表达它。或者,他/她可以选择一个合适的模式,只填写他/她的问题的具体内容在可变部分。模式可以减少问题的模糊性并提高机器对问题的理解。机器和人类都可以从使用的模式中知道问题所要求的信息类型。例如,如果用户想要问:“如何用英语说”你好“?他/她可以选择在lt;实体\语言gt;中说[实体\词]的方式how are you和你好。模式上我们可以知道“你好”是一个词,“英语”是一种语言。答案模式更简单:“[实体\词]”,这意味着答案应该是一个词(或短语)用相应的语言指定的表达。

图2和图3简要说明了如何使用模式来提问和回答问题。其程序由以下三个步骤组成:

第1步:分类选择

所有问题模式都归入全球本体论。 在当前版本中,问题模式根据预期答案的语义标签进行分类。 例如,How are you 在wor

全文共14183字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[13505],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。