了解在线评论:“有趣的”,“酷的”或“有用的”?外文翻译资料

 2022-07-27 10:33:29

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


了解在线评论:“有趣的”,“酷的”或“有用的”?

摘要:在线评论越来越多地被我们所以依赖来进行购买决策和选择日常使用的服务。另一方面,企业依靠在线评论网站来寻找新客户,了解人们对他们的看法。为了一个在线评论社区是对用户与企业都有效,了解什么导致了人们感知的高质量评论,以及如何将社区评论质量最大化十分重要。在本文中,我们研究了Yelp来回答这些问题。我们分析了23万个评论和其用户互动(“投票”)。我们发现,活跃和日常用户是优质评论最大的贡献者,较长的评论有更高的机会在社区中流行。我们发现,对一项特定业务来说,被投有用票的评论往往是早期的评论。我们的研究结果对高品质用户贡献和社区效益有一定意义。我们讨论了社会系统的设计与不同反馈信号的影响。

关键词:Yelp;在线评论;社会信号;投票;社会反馈;零膨胀负二项回归,有用票

绪论

Yelp等在线评论网站是重要和广泛使用的资源,它们能使用户以评论或尺度评级的方式分享他们对产品、服务和活动的经验,这些经验在接收服务或产品之前可能难以确定。 2014年中期,超过1.39亿独立用户访问了Yelp,发表超过6700万条评论[1]。 研究表明消费者认为在线评论网站与商业网站相比是更加客观的信息来源[11]

在线评论网站与它们用户提供的内容一样好。提供用户激励机制对在线社区来说制关重要,促使用户提供高质量的内容可能更为重要。 不幸的是,用户生成的内容也带来了一些代价:有些评论和意见是有趣或者有用的,而有的内容和意见却是无用的,过分主观的甚至有误导性的。 筛选大量评论以识别高质量和有用的信息是一个乏味且容易出错的过程。 在线评论网站通常使用众包的方法对评论进行排名。 这种社会评估机制的一个例子是Yelp评论投票,用户能够将评论标记为有趣,酷和/或有用。 理解评论的社会评价可以帮助在线评论网站设计机制来提高内容质量。

Yelp是一个在线社区,人们对商家进行评论和评级。 Yelp的用户可以使用关键字搜索商家。 Yelp允许用户通过给他人的评论投票或是关注行为与朋友交流互动。 在这项研究中,我们提出三个研究问题:(i)参与评论背后的影响因素是什么?(ii)“有趣”、“酷”和“有用”的评论有什么样的性质?(iii)这些投票与用户发表高质量评论有什么关系?

我们使用来自美国菲尼克斯都市圈Yelp的大型数据集。 我们研究了437373位评论者,以及他们对2005年至2013年的11,537个商家的229,907份评论。虽然我们的数据和分析是针对Yelp的,但我们解决的研究启示和研究问题是具有一般性的,可能普遍适用于其他在线评论社区。

我们发现,长时间活跃的用往往是高质量评论的重要贡献者。 我们发现,用户认为有趣的评论往往是消极的。我们也发现,社会评估与个人评价之间存在着直接的关系:有趣的评论往往具有较低的评论者评分,而被投票“酷”的评论往往具有较高的评分。我们的结果还表明,读者往往喜欢长篇和客观的评论。

我们的研究突出了对在线评论社区的洞察,并为推荐社区的设计带来了启示,以促进用户提供的高质量内容。我们展示了可以鼓励发表长篇评论的机制,这个机制还可以鼓励新成员贡献和评论新商家,并显著提高内容质量。此外,我们在Yelp社会反馈系统上的发现激发了其他社交平台中不同信号的设计。

相关工作

在线用户参与的一般方面已经在以前的工作中详细讨论过[19,27]。研究用户参与度的一个常见方法是通过同行评估。对于用户来说,来自关注着的反馈能促进未来的参与行为。互惠理论[9,14],增强理论[22]和需要归属理论[5]表明,就用户而言,其他人的反馈预示着长期的参与。例如,那些第一批评论收到积极数字评分的在线新闻社区Slashdot的用户,他们返回网站发布第二条评论的速度明显更快,当他们的第一条评论得到回应时,他们也倾向于更快地回复[18]。对照实验还表明,消息传递形式的社会批准增加了用户的贡献数量[8]。

为鼓励内容创作者和读者与网站互动,许多在线社区为用户提供了反馈系统。 Facebook的喜欢,Twitter的收藏或转载,亚马逊的“有帮助”和Yelp对评论进行“有用”、“酷”、“有趣”的投票都是这类系统的例子。先前的研究表明,评论文本,评论者和社会背景的感知属性都可能形成消费者对评论的反应[2,20]。已有研究表明,即使外部因素,如天气和用户的人口统计也可能影响评级和评论[3]

关于分析论坛上产品评论及其发布的研究已有大致框架。Lu 等人使用潜在主题方法从Ebay [20]的评论中提取有关评级质量的几个方面。另一项研究考察了产品评级的时间发展以及其在评论数量或所需努力(撰写评论与仅给出评级)等因素上的有用性和依赖性[26]。 2008年的一项研究着眼于雅虎回答网站的答案的有用性以及所需答案类型和问题的主题领域等变量的影响[15]。关于亚马逊评论的一项研究考察了有用性分数,发现有用性分数不仅取决于评论的内容,而且还取决于产品的其他评论[10]。最近,我们对Yelp进行了一项研究,以确定评论的社会信号能否表明评论的评级和情绪[4]。虽然已经有了理解和预测有用的投票的研究,但是我们不太了解是什么因素塑造了其他社交信号,例如Yelp上的“酷”和“有趣的”投票。

数据

我们使用Yelp公开发布的数据集来回答我们的研究问题。 Yelp是一个大型在线评论社区,也是用户为基础的商家和服务指南。Yelp数据集由来自亚利桑那州菲利克斯都市区的Yelp数据样本组成。 它包括11,537个商家,437373评论者和229,907评论。 数据跨越2005年至2013年。

Yelp上的商家有三个可以被用户看到的突出的评论属性:平均星级(1星到5星),评论数量和评论本身(以及评级)。 我们对商家的评论时间戳进行处理以测量活跃期(商家第一条评论与最后一条评论的时间区间)我们用活跃期来计算商家不营业的时间(例如,该时间段为我们开始收集数据集到结束收集期间)。

和其他在线评论社区一样,Yelp用户对企业进行点评。评论由星级评分和评论文本组成。 为了理解评论文本的影响,我们处理每个评论的文本,以使用模式工具包[23]量化文本的主观性(0和1之间)和极端性(在-1和1之间)。我们用评论字数来衡量评论的长度。Yelp用户可以对一条评论投票,选择可以是一个或多个“酷”,“有趣”和“有用的”。 我们使用这些投票数以及总票数作为评估社会反馈的度量标准。

我们通过查看评论者撰写的评论数量以及这些评论从其他Yelp用户获得的投票(酷,有趣和有用)来量化评论者在网站上的活动。我们也研究了评论者在评论中使用的平均星级。 我们利用用户个人资料以计算两个指标:(i)活跃时间:定义为以Yelp编写的第一次和最后一次评论之间的时间间隔;(ii)活跃率:定义为撰写的评论数除以活动持续时间。例如,0.2的活动率意味着该评论者在活动期间平均每五天写一次评论。

我们预测商家所在地的人口统计可能会影响商家的评价和评级[3]。我们数据中的所有商家都来自同一个都市区域; 然而,它们位于不同的社区(由纬度经度确定),每个社区都有自己的人口统计。 我们通过商家附近的人口特征等因素来分析用户多样性的影响。对于每个商家,我们在商家位置(纬度或社区)收集人口统计的两个维度。首先,我们收集该地区居民收入的中位数。第二,我们收集该地区的教育水平,用具有本科以上学历的居民人数来度量。这些数据来源于美国国家宽带地图。

社会反馈的形成因素

我们通过多种方式来研究Yelp的社会反馈系统。这些反馈信号为用户提供了三种不同的功能:有趣,有用和酷。我们利用统计学方法来了解评论,用户和商家属性之间的关系;这使我们能够了解用户投票与评论本身之间的关系。如果这些投票是由网站用户随机投的,那么评论与其投票间不会有一致的关系。如果我们找到系统的关系,这就表明投票情况可以用来评估评论。

我们使用以总票数的数量作为因变量,并将商家、评论和评论者特征作为自变量。投票数是一个非均匀分布的分布式计数变量(见表1),其含有零膨胀负二项回归模型的概率函数[7]。我们研究了两种类型的自变量:描述评论特征的变量和评论者特征的变量。我们还考虑与被评论商家相关的变量,并控制了商家活跃时期和商家所在地人口统计等因素。表2显示了计数模型的零膨胀负二项回归模型的系数。我们考虑计票模式和对零票评论对实验的影响。回归系数让我们能够理解自变量对总投票数的影响(注意,为了能够比较系数,我们在回归前对所有数值变量进行标准化处理)。

我们通过计算空值模型的偏差减少量,使用卡方检验来找出我们的回归模型的统计学意义。对于关于总票数的模型,我们发现,27自由度下(447:1times;103 - 390:9times;103)的偏差chi;2减少了13%。该测试拒绝了空值模型的零假设(p lt;10-15);因此,回归模型非常适合表示自变量的影响。我们测试零值系数(双侧)零假设中的所有独立变量的系数,并发现结果在所有情况下都拒绝零假设(p lt;10-3)。

活跃用户更有可能写出高质量评论

回归模型显示,Yelp用户的活跃水平与评价质量有显著关系(表2)。活跃度可以通过评论者撰写的评论数(系数beta;= 0:41,p lt;10-15)或用户在Yelp上评论的持续时间(beta;= 0:22,p lt;10-15 )来衡量。我们可以通过Yelp社区的活跃用户所获得的知识和经验来解释这种关系:活跃用户可以从社区获得更多知识和相关利益,并形成优势。这些知识可能反映了有经验用户所写评论的质量。先前的研究表明,人们加入在线社区的原因之一是获取信息并获得知识[17,25]。

我们看到,评论人员在评论中倾向于给出的平均星级数量对于投票数有一个微小的正相关系数(beta;= 0:05,p lt;10-15)。换句话说,与评级较低的评论者相比,给商家进行更高评分的用户可能会得到更多投票。此外,用户的活跃度也与评论获得的投票数有关。社会认同理论可以对这种关系做出解释[12,16,24],这一理论认为,人们通过社会群体中感知成员关系的价值、态度和行为意图来形成社会认同。另一方面,人们可以认为反馈系统可能是鼓励更多用户参与的因素。我们从以前的研究中知道,互惠理论[9,14],增强理论[22]和归属需求理论[5]表明,其他用户的反馈促使了用户的长期参与。

较长的篇幅和客观性是高质量评论的主要识别特征

评论内容及其提供的信息量是评论获得更多投票数的原因之一。实际上,我们的模型显示,评论的长度(单词数)在评论的投票数中起着重要的作用(beta;= 0:3,p lt;10-15)。这可能是由于更长的评论可能包含有关商家的更多信息,并且这些评论可能是由更专业的评论者所撰写的。在下一节中,我们发现更长的评论会获得更多的“有用”,“酷”和“有趣的”投票。我们对较长评论的研究结果也显示,Yelp用户倾向于阅读更长的评论。

有趣的是,评论文本的某些功能对评论数量有负面影响。我们的情感分析显示,评论文本的情感极端性与投票数(beta;= -0.12,p lt;10-15)有很强的负相关关系。我们还发现,评论内容的主观性与投票数(beta;= -0.01,p lt;10-4)有一个微小的但负相关的关系。这些观察结果表明,用户认为客观中立的评论质量高于主观和极端的评价。用户评分的系数为正,但与其他评价特征相比较小(beta;= 0:02,p lt;10-5)。

“酷”、“有趣”、“有用”投票

在上一节中,我们建立了评论总票数的模型,并研究了影响评论质量的因素。在本节中,我们尝试了解用户如何看待(投票)评论。具体来说,有趣的,酷的和有用的评论有什么区别?

我们构建零膨胀负二项回归模型,以评论的有趣,酷和有用的投票数作为评论者,评论和商家相关属性的函数。我们模型中的自变量与上一节中用于建模总票数的变量相似。对于所有模型,我们使用卡方检验来测量统计学显著性,以减少偏差。我们发现所有测试都拒绝空值模型的零假设(p lt;10-15)。因此,这些模型非常适合表征自变量的影响。我们测试零值系数(双侧)的零假设的独立变量系数,并发现测试拒绝所有变量的零假设(p lt;10-3)

“酷”、“有趣”、“有用”投票与评论者活跃度和平均星级相关

我们发现用户撰写的评论数量与用户评论获得的所有三种投票数有一个很强的相关关系(beta;cool= 0:53,beta;funny= 0:54,beta;useful= 0:33)。此外,我们看到,通常Yelp评论者有更大的可能写有趣或酷的评论;然而,获得有用投票的机会较低。这表明,评论者的经验对撰写有用的评论影响比写作有趣或酷的评论的影响较小。另一个解释的原因可能是,有用的评论会呈现给更广泛的Yelp阅读者,但酷和有趣的投票更以社区为导向,因此更有可能呈现给具有更多评论数量的精英用户。

与评论数量类似,评论者活跃周期与不同类型的票数(beta;cool= 0:25,beta;funny= 0:23,beta;useful= 0:18)有强相关关系。这可以通过以下假设来解释:社区中较老的用户相比于新用户对社区以及相应的酷、有趣、有用的理解更好。。

我们还发现,评论者在评分中给出的平均星级与她的评论获得的酷,有趣和有用的投票数量呈正相关(beta;cool= 0:16,beta;funny= 0:04,beta;useful= 0:04)。此外,我们发现,与有趣和有用的投票相比,酷的投票这种相关性更强。这表明对商家做出更高评价的评论者有更大的机会得到酷的投票。原因可能在于“酷”代表着更积极的期望,而“有趣”带有消极的语气。

较早发表的评论通常是最有用的评论

我们看到

全文共8281字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144443],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。