英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料
谁发的推文?评估微博内容的价值
作者:Paul Andre, Michael S .Bernstein, Kurt Luther
摘要
虽然微博的读者们对他们看到的微博内容有各种各样的反应,但是研究更倾向于关注用户的一些极端的反应,比如转发和取消关注。为理解那些通常不对外公开的,微博用户之间的广泛的连续的反应,我们设计了一个网站,收集到了第一手的,关于推特更新的粉丝评级的大型语料库(文集)。通过我们的超过43000个自愿评级的数据集,我们研究发现,参加微博评级的用户认为,语料库中有接近36%的推文是值得阅读的,有25%是不值得阅读的,剩下的39%适中。这个结果表明,用户忍受了大量的对他们来说价值很低的推文。我们发现用户评估信息共享和那些杂感的价值是建立在以自我为导向或者存在更新上的。我们还提议洞察不断发展的社会规范,如缺乏上下文语境的滥用@提到和各种标签。我们的讨论可能对新兴的做法和工具设计产生重要的意义。
介绍
社会已经认识到微博作为一个新闻传播媒介具有广泛的价值,但是公众又对它细粒度的内容价值知之甚少。现有的研究主要集中在积极或者消极的反应信号,比如转发和取消关注,但是这些信号捕获的只是极端反应。用户们对他们所关注的东西的反应是多变的:事物可能是让人厌烦的,可以是让人变现出极大兴趣的,可能是很有趣的。然而,现在没有已经存在的大规模的研究用户更微妙的反应的公共信号。如果我们能更好的理解用户们认为什么是有价值的,什么是没价值的,以及原因,我们就可以:
- 设计出更好的工具或者自动过滤器。
- 具有洞察力的开发新兴的标准和做法,来帮助用户创造和消费有价值的内容。
这项工作是从读者的角度来做的,更有利于分析微博的内容,采用一种新颖的设计,收集到大量的自愿评级。我们开发了一个网站用来鼓励推特用户给出匿名的反馈信息给那些他们关注的账号,作为交换,我们会把他们自己粉丝的还有其他陌生账号对他的反馈信息给到他们。使用我们的语料库的大约43000个评级,我们要问:
- 什么内容是推特用户认为的有价值的内容?比如,用户会认为那些他们不喜欢的意见有价值吗?
- 怎样评价推文的价值孰高孰低?
传统观念的存在围绕着这些问题,但据我们所知,这是严格检查普遍持有的事实真相是否真实准确的第一项工作。进一步讲,如果我们收集到足够多的评级,评价,我们就有能力量化这种影响的大小。更好的理解微博内容的价值能够帮助我们改善微博的整体体验。
背景
微博的内容分析已经鉴定了许多不同类型的用户和消息,我们按类别感知价值进行评估,把这些数据应用在了我们的分析中。先前的在特殊场景下的调查报告已经被鉴定为跟转发微博和搜索评价有关的积极评价,尤其是对那些事实和有价值的链接。取消关注消极结果一直在探索的背景下,已经被联系到网络结构和微博的爆发。读者也可能单纯的认为用于社会交往和提高认知度(相当于在走廊里打招呼一样)的微博内容是比有实质性的微博内容更有价值的。
《视觉注意力》这篇文章里的一个研究分析表明通过标注不常见的作者姓名,以及好的用户交互界面可以引导用户提高微博内容的质量。由于原来的大多数微博在外表上没有例如像回复,转发等一样的可见的让用户觉得有意思的标记,因此此前的工作都是通过对微博内容的兴趣判断得出的结论。本文通过收集到大量的不仅具有参考价值而且拥有内容和原因的褒贬判断的数据,拓展了以前的工作内容。
设计
为了了解微博内容的感知价值,我们需要一个微博评级的语料库。我们利用了微博用户希望知道别人如何看待他们的微博内容的好奇心构建了这个语料库。我们设计了一个叫做“谁发了微博”的网站,给微博用户自己的粉丝和陌生人的匿名反馈,作为交换,用户们对微博进行评级,评价。
登陆网站之后,用户会看到一个有十条微博的列表,在用户拿到他们自己的反馈之前,用户必须要对这十条微博内容进行评价。这个机制利用了预期的互惠:用户进行一些操作(这些操作为网站提供了一些数据信息)来换取他们希望得到的有价值的东西(评级)。网站从登陆系统的用户关注的微博账户中挑选微博内容给用户评级,更欢迎那些已经跟网站签署协议的微博账户,微博内容中已经过滤掉了@符号。用户可以把每条微博内容的等级评定为值得阅读,一般或者不值得阅读。用户也可以跳过不评论任何微博。微博可以显示出来对应的作者姓名和头像来模仿真实世界的阅读(和评价)微博内容的体验。用户可以任意解释为什么他们选择了这个评级。我们通过复选框和自由文本的响应收集到了这些细节。复选框的选项有:有趣的,令人兴奋的,有用的,有教育性的,信息量大的,或者傲慢的,无聊的,沉闷的,一般的。这些形容词都是改编自之前的工作和试点研究的迭代。
方法
当有人发出来一条微博之后,流行的新闻网站比如Mashable, TechCrunch, OneForty 和CNN,写了关于这个网站的文章,这个网站链接像病毒一样蔓延开来,获得了广泛的传播。随后的流量激增,从微博网络的不同角落给我们提供了大量的用户和评级。从2010年12月30到2011年1月17日,我们的研究一直建立在这些数据之上、这些数据集包括来自1443个用户的43738条微博评级。这些用户对他们关注的微博账号进行了评估,甚至包括更广泛的21014个微博用户。所有的分析都是来自粉丝们的评级。
分类标签
我们从那些至少评价了十条微博的用户那里收集到了4220个评级采样。对于每条微博,我们用了Naaman的微博分类方法的一个改编版本来确定内容的类别,包括的类别如:当下(现在的心情或心理活动),维护存在感,自我推销(比如:分享了一篇作者刚出版的博客)和信息共享。我们修改了部分类别,因为奇闻轶事类在两个数据集里都比较罕见,我们把这个类别移除了。我们也添加了一个在标准分类里没有完全对应的选项的谈话类别来对应那些讨论形式的微博。
为了保证微博内容对应分类类别的准确性,我们使用了付费的众包服务提供商Crowdflower的服务。通过使用一些已经有标准答案的问题,抛弃那些不同意现实真实存在的真实数据的人的意见,Crowdflower提供了一个高质量的调查结果。论文的作者根据Naaman的手工分类方法创建了一个标定过的真实数据集,然后把这个标签数据集和所有微博给了Crowdflower做标签分类。Crowdflower公司做的标签分类与论文作者自己做的标签分类之间的卡伯值为0.62:基本上一致。实验结果表明,如果标定过的真实数据集跟Naaman的分类一样有多个分类标签的话,实验结果的吻合度可能高达0.81。
样本偏差和局限性
考虑到网站用户的自然增长和科技媒体的关注,我们开始调查我们的数据集中潜在的可能存在的偏差,个人偏见的数据。我们通过比较我们的微博类别分布跟Naaman的随机类别分布,发现两个主要的不同点:我们的数据集包含更多的信息共享类别的微博,占我们数据集的49%对比Naaman的22%,还有比较少的我现在类别的微博,占比10%对比Naaman的40%。这种差异可能是由于TechCrunch和Mashable的调查人群存在差异,也可能因为我们的数据集中包括市场营销人员和各种组织发的微博,这些在Naaman中都是已经移除的。因此,我们的调查结果概括总结一下应该是关于热衷于信息共享的微博用户群体的分析,但是可能不均匀的适用于微博上所有的亚群用户。比如,信息共享可能被认为比其他的微博内容拥有更高的价值。然而,我们的样本跟先前的研究很相似,但是因为网站影响的扩散我们收集到的数据来源更广,数量级更大。我们认为这些采集到的样本已经足够广阔,丰富,足够我们得出具有价值的结论。
回归分析
为了检验微博分类对评级的影响,我们使用了一个有序逻辑回归。标准线性回归假设的结果是比或区间。然而,我们并不相信用户的不值得阅读和保持中立的心里差距跟保持中立和值得阅读的心里差距是相等的。比如,可能微博不值得阅读的那一段所占的比例要比微博值得阅读的那一段所占的比例短一些。有序逻辑回归是非参数化的,而且不做这个假设,所以我们用它来代替。我们使用内容分类来进行预测,坚持让那些维护类别存在(最不喜欢的),作为那些分类假变量的基准,控制评定等级。
结论
究竟有多少微博的内容是有价值的?
粉丝们认为那些用来评级的微博里有36%是值得阅读的,但是也有25%是不值得阅读的,对另外的39%保持中立态度。鉴于用户是主动选择关注这些帐号的,令人吃惊的是,他们只喜欢这些账号的很少部分的微博内容。对单独的用户而言,我们发现普通用户认为那些用来评级的微博中有41%是值得阅读的。对大量因素的分析表明,遵循分析可以对改善微博的用户体验有很大影响。
什么类别的微博是有价值的?
考虑到微博强调的是实时的消息,我们可以合理的假设信息共享类别的微博是最有价值的。或者,也有可能是粉丝们喜欢更新个人状态。也有可能是因为他们可以从其他的数据源传播微博比如RSS订阅,粉丝们喜欢更新个人状态了。
图1
如图所示是我们语料库里的4220条样本所对应的分布情况,从左到右颜色依次表示值得阅读,一般,不值得阅读。
图2
以复选框里17557条参与评级的微博为基础的结果显示,有益的,信息量大的微博是最让人喜欢的,而无聊的微博是最让人不喜欢的。
我们分析了使用Crowdflower的分类标签对微博评级的影响。图1总结了类别的评级。我们的有序逻辑回归分析的结果如表1。表中的比值可以被解释为:相比于存在的用于维护存在感的微博,留给粉丝问题的那些微博,用户选择值得阅读的概率是选择保持中立的2.83倍。图1显示了这些差距。比如:相比于微博粉丝用户的问题中有18%是不值得阅读的,那些存在的用于维护存在感的微博有45%可能是不值得阅读的。
三个最不受欢迎的分类标签是:维护存在感,对话和现在的我(微博用户现在的状态)。比如:处于现在的我这一类别的微博只有25%的可能被认为是值得阅读的。值得别阅读的概率(相比于保持中立)仅仅是维护存在感的微博被阅读的概率的1.89倍;z=1.94, pasymp;.05。微博用户希望自己的粉丝对自己的个人信息感兴趣可能是一个合理的期望。然而,这看起来并不像是真正的原因。我们分析了文本回复试图找到其中的原因,我们发现很多情况下粉丝们对他们关注的微博账号的主人的生活细节并不感兴趣。比如:“抱歉,我并不关心人们正在吃什么”,“太多个人的信息了”,“他真的抱怨太长时间了”。 有一个特殊的正方形的为定位检查预留的位置:四角形更新不需要被分享到微博上,除非有相关的更新需要更新。为了维护存在感的微博(比如:“喂,微博”)是最让人讨厌的了。相比于其他类别,这种类别的微博被认为是没有价值的概率是其他类别的1.5-2.5倍。自由文本调查显示这样的微博通常被认为是没有内容的:“我可以用一个单词来形容只有一个单词的微博:无聊的或者无用的”。
最受欢迎的类别是留给粉丝问题,信息共享和自我提升(经常分享一些自己做的东西的链接)。在某种程度上,这些调查结果可能反映出我们的微博样本调查存在偏差。然而,他们也认为,从微博生态价值观学习到了新的内容。比如:比如,“标题引起了我的好奇心”,“哇,我都不知道发生了这样的事,谢谢你告诉我”。 给粉丝留问题也是一个经常被喜欢的类别,因为粉丝们认为“这是对微博的很好的利用”或者是对主体本身的兴趣“让人想停下来一刻来思考这个问题”。
图3
图一是根据有序逻辑回归评定的优势比。以维护存在感为基准。和维护存在感作比较,给粉丝留问题这个标签的微博被评为值得阅读的概率是被评为一般的概率的2.83倍。N=4220. *plt;.01, trend pasymp;.05
为什么是粉丝们决定微博有没有价值?
前边的章节介绍覆盖了什么微博是有用的,这个章节将详细的讲解为什么这些微博被认为是有用的。这个分析使用了我们的数据集里边的所有的被粉丝评级过的总共43738条微博。当我们网站的用户评定一条微博为有用或者无用的时候,他们还可以选择为什么他们这样认为或者在文本框里输入原因。对于被评定为值得阅读的微博中,有67%的至少拥有一个原因;不值得阅读的微博中,有38%是有原因的。
不值得阅读的原因:太无聊,重复过时的信息,含义模糊的或者使用了太多的@和#标签。无聊是比预期的更为普遍的一个问题。无聊是微博被评为不值得阅读的重要原因,不值得阅读的原因中有82%是因为无聊(如图2)。因为微博强调的是信息共享的及时性,所以如果发布过时的信息会让人觉得无聊,比如:“我在早上就看到了这条消息”或者“这条消息我已经看到很多遍了”。一些用户提出建议:因为你的粉丝们也阅读《纽约时报》,如果你转发纽约时报的链接的时候不加点自己的东西的话是让人感觉很无趣的。陈腐的,单调的微博也会让人干到厌倦,得到的评价可能是:“那又怎样,然后呢?”或者“你说的很对,但这是显而易见的”。
用户们往往抱怨微博没有足够的空间把一件事情表述清楚或者让它变得有用。许多更新的照片和微博没有任何解释文字:“只有链接没有解释是这个世界上最糟糕的事情”。带有地方性的局部更新是一个争论点:“我又不住在这里,我不关心这里”。消极的情绪和投诉是不值得阅读的:“有点消极”,“发牢骚”。
微博独特的语法限制常常是产生抱怨的源头,特别是各种话题标签和@提到符号的使用:太多的标签让人找不到真正的内
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[30053],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。