英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
Community-Based Question Answering via Asymmetric Multi-Faceted Ranking Network Learning
通过不对称的多方位排序网络学习基于社区的问题答案
1.摘要
如今,基于社区的问答(CQA)网站成为流行的基于互联网的网络服务,随着时间的推移,已经积累了数百万个问题和答案。因此,问题答案成为CQA网站中的一个基本问题,即对于给定的问题排列高质量的答案。目前,大部分已有的工作都是在深层语义匹配模型的基础上研究“问题答案”的问题,根据语义的相关性对答案进行排列,而忽视了回答者对于给定问题的权威性。本文从非对称多方位排序网络嵌入的角度考虑社区问题的回答问题。我们提出了一种基于社区的“问题答案”的新颖的非对称多方位排名网络学习框架框架,同时利用问题-答案对的深层语义关联和答复者对给定问题的权威。然后,我们开发了一种具有深度递归神经网络的非对称排序网络学习方法,将CQA站点中对于给定问题的答案的相对质量等级和回答者的关注关系相结合。对来自现实世界CQA站点的一个大规模数据集进行广泛的实验表明,我们的方法比其他最先进的解决方案获得了更好的性能。
2. 介绍
如今,基于社区的问答网站(CQA)成为流行的基于互联网的网络服务,随着时间的推移,已经积累了数以百万计的问题和答案。(Zhao et al. 2016b) CQA的好处今天已被广泛认可。我们见证了雅虎和Quora等流行的CQA网站。基于社区的问题答案成为CQA网站中的一个基本问题,即对给定的问题排列高质量的答案。
目前,以社区为基础的“问题答案”问题引起了相当的关注(Ji et al. 2012; Qiu and Huang 2015; Shen et al. 2015; Wang and Nyberg 2015; Dong et al. 2015; Fang et al. 2016). 现有的大部分工作都把这个问题看作是文本匹配任务,学习深度语义匹配模型(Hu et al. 2014; Qiu and Huang 2015),然后根据语义相关性对给定问题的答案进行排序。虽然现有的问题答案方法已经取得了很好的效果,但是他们主要关注的是如何发展问题的深层语义匹配模型,而忽视了回答者的权威对给定问题的重要性。
与以往的研究不同,我们将基于社区的“问题答案“问题作为高质量回答排序任务,基于答案的深层语义关联性和回答者对给定问题的权威性。让我们把Quora中的这个问题“what are some recent and upcoming breakthrough in deep learning?”作为例子。
我们注意到,Yann-LeCun提供的答案由于其语义相关性以及Yann-LeCun在深度学习方面的专业权威而获得了CQA社区投票的最多赞誉。也有人指出CQA网站的专家通常会提供高质量的答案(Zhao et al. 2015; Bouguessa, Dumoulin, and Wang 2008).
另一方面,随着CQA网站在线社交网络的流行(Zhao et al. 2015),我们引入基于社区的问题答案的多面排序网络,同时利用CQA网站中问答对与回答者权威之间的深层语义关联。目前,大多数现有的网络学习工作(Perozzi, Al-Rfou, and Skiena 2014; Tang et al. 2015; Wu et al. 2016a) 都遵循对称假设,即用户模型学习对于网络中的任何两个连接用户是对称的。然而,对称假设并不总是有利于在在定向CQA网络中学习用户的专业权威模型。一个用户在CQA网络中关注另一个用户并不意味着他们的专业知识权威是相似的。因此,为这个问题开发非对称多方位排名网络学习是很自然的。
本文从非对称多方位排序网络学习的角度出发,提出基于社区的“问题答案”问题。 具体而言,我们根据问答对的深层语义相关性和用户的专业知识权威,设计了多方位“问题答案”排序函数。然后我们将CQA站点的多方位排序函数和用户的非对称关注关系,整合为一个统一的非对称多方位排名网络学习框架,AMRNL。然后,我们针对该模型开发了一种具有递归神经网络的非对称网络学习方法。当某个问题被查询时,AMRNL基于训练过的非对称多方位排序网络嵌入对其进行排序。本文的主要贡献如下:
- 与以往的研究不同,我们从非对称多方位排名网络学习的角度出发,提出了基于社区的“问题答案”问题。也就是说,我们根据CQA站点中的问答对的深层语义相关性和用户的专业知识权威,学习了多方位排序函数。
- 我们针对该模型提出了一种具有深度递归神经网络的非对称排序网络学习方法,该方法利用反向传播方法进行了优化。
- 我们评估我们的方法在著名问答网站Quora上的表现。广泛的实验表明,我们的方法可以胜过几个最先进的解决方案。
3. 通过不对称的CQA网络学习问题答案
在本节中,我们首先从多方位排序函数学习的角度提出基于社区的“问题答案”问题,然后介绍非对称多方位排序网络学习框架。最后,针对这个问题,我们提出了一个具有深度递归神经网络的非对称排序网络学习方法。
3.1 问题
在提出问题之前,我们先介绍一些基本的概念和术语。由于CQA站点中的问题和答案总是具有不同长度的连续数据,因此我们使用递归神经网络将其内容编码成固定长度的特征向量以进行语义表示。给定输入问题的集合和答案,我们把神经网络的最后一个隐藏层,通过作为问题的语意嵌入集合,通过作为答案的语义嵌入集合。然后,我们用作为用户的专业权威嵌入集合,其中是第个用户的潜在专业的嵌入向量。
给定问题的答案的质量是通过赞成/反对的方式进行投票的,这表明了社区的长期审查(Zhao et al. 2015). 我们根据问答对的深层语义相关性和用户的专业知识权威,提出了多方位“问题答案”排序函数,其中 是语义匹配函数,是回答者对给定问题的专业权威函数。然后我们通过定义语义匹配函数,其中是计算第个问题和第个答案之间的语义相关性的排序度量矩阵。参数是CQA站点中问题和答案的嵌入维度的大小。 我们接下来通过来定义专业权威函数,计算第个用户对第个问题的专业权威。
对于给定的问题,给定所收集到的答案的社区投票,我们引入相对质量排名来对多方位排序函数进行建模,排序函数采用有序元组的形式,意味着“对于第i个问题,由第个用户提供的第个答案比第个用户提供的第个答案获得更多的赞同”。 令表示从社区投票中得出的排名对约束的集合。更正式地说,我们的目标是学习多方位排序度量函数,对任何的,不等式成立:
然后利用用户在CQA站点的非对称的关注关系进一步提高多方位排序函数学习的性能。
我们用表示用户之间的非对称跟随关系。如果CQA站点中的第个用户跟随第个用户,则条目 ,否则 。然后,我们通过整合用户的非对称的关注关系和社区问答的“问题答案”对的相对质量排名,提出异构的非对称多方位排名网络。我们接下来用表示异构的非对称多方位排名网络,其中“节点”集合由问题,回答和用户组成,“边”集合由CQA网站中的成对排序和用户的不对称的关注关系组成。我们举例说明一个异构的非对称多方位排名网络的简单例子,见图一。
“问题答案”对的相对质量排名作如下表示。对于问题,用户提供的答案(i.e.,在回答关系上用 标记)比用户提供的答案(i.e.,在回答关系上用-标记)收到更多的赞同(thumb-ups)。
我们还说明了图1中用户和(i.e., )之间的非对称的关注关系。
使用上面的符号,我们从非对称的多方位排名网络学习的角度定义了基于社区的“问题答案”问题。给定输入问题,回答,从社区投票中得到的成对排序约束以及异构排名网络,我们的目标是基于排名度量矩阵和所有嵌入用户来学习多方面排序函数,并对给定问题的答案进行排序。根据选择问题的最佳答案。
3.2 具有递归神经网络的异构非对称的排序网络学习
在本节中,我们首先提出基于社区的“问题答案”的异构非对称的多方位排名网络学习框架,然后介绍图2(a)和2(b)中的学习过程。
图2:基于社区的“问题答案”的异构非对称的多方位排名网络学习的概述。
(a)在CQA网站中,将问题答案对与用户不对称的关注关系进行整合,以构建异构非对称的CQA网络。
(b)问题、答案和用户被编码成基于非对称的多方位网络排名损失的固定嵌入向量。
我们首先介绍,在CQA网站上,问题和答案的适当的语义表示方法。给定问题的一个单词序列,我们通过预先训练词嵌入(Mikolov et al. 2013) 来表示第个词,然后使用序列作为相应的递归神经网络的输入。在这项工作中,我们选择被称为长期短期记忆(LSTM)(Hochreiter and Schmid- huber 1997)的变异递归神经网络来学习问题的表示:
其中表示形激励函数; ,和是权重矩阵,是偏差向量。 我们训练LSTM网络,然后把LSTM最后一个单元的输出作为问题的语义表示,用表示。同样,我们使用LSTM网络学习答案的语义表示,用表示。考虑到在CQA网站中,答案可能是含有几个句子的段落,我们将其拆分成语句来学习语义表示,然后通过一个额外的最大共享层来合并这些表示。
然后,我们提出了对于基于社区的“问题答案”的高质量答案排序的多方位排序函数学习方法。给定CQA站点中“问题答案”的表示和它们的相对质量排名,我们设计来相应的多方位排序的损失函数,如下所示:
其中上标 表示问题的高质量答案(具有较高的赞同数),而表示低质量答案(较低的赞同数)。我们用超参数控制损失函数的边际,是成对相对质量排序的集合。
我们将多方位排序函数学习和CQA网站中的用户不对称的关注关系进行整合,提出基于社区的“问题答案”的异构非对称的多方位排序网络的学习方法。对于矩阵中的每个用户,我们首先进行他们非对称的关注关系的行归一化。也就是说,如果在矩阵中存在项,则该项通过被归一化,其中是中第个用户的关注用户的数量。如果两个用户之间没有关注关系,则它们之间的归一化项被设置为0。我们用表示对角矩阵,则归一化关系矩阵为。根据最简单的社会影响假设(Ellison and others 2007; Zhao et al. 2016a ),我们认为用户的专业权威模型参数可以用关注用户的专业知识模型参数的线性组合来表示。也就是说,对于所有的,专业可以通近似重构,其中是表示的专业基础的正权重,是归一化非对称关系矩阵。通过最小化重构错误和提出的多方位的排序函数损失, 我们可以根据CQA站点中问答对的相对质量排名和用户的非对称的关注关系,实现不对称的多方位排序网络学习。 因此,不对称的多方位网络学习问题能够用数学公式表示如下:
其中是多方位排序函数损失,是Frobenius范数。 参数是平衡多方位排序函数损失与非对称网络学习损失两者权重的权衡参数。
我们现在详细介绍我们提出的非对称多方位排名网络学习。我们给出了所有的模型系数,包括神经网络参数,结果表示和排名度量矩阵。因此,我们学习过程中的目标函数是
其中是训练损失和正则化的权衡参数。为了优化目标,我们采用(Qiu and Huang 2015)中的AdaGrad对角线变化的随机梯度下降(SGD)。在第步,参数更新为:
其中是初始学习率,是时间的次梯度。
4. 实验
4.1 数据准备
我们使用Quora数据集(Zhao et al. 2015),来评估我们方法的性能,这个数据集是从一个流行的问答网站Quora获得的。该数据集包含444,138个问题,95,915个用户和887,771个来自Quora的回答,以及用户在Twitter社交网络中的关注关系。用户回答问题的质量是通过社区的投票以赞成/反对表示的。 在(Yang et al. 2013; Zhao et al. 2015)的实验设置之后,我们根据他们发布的时间戳对问题进行排序。 我们使用前60%,70%和80%的问题作为训练集,另外10%用于验证,剩下的10%用于测试。所以训练和测试数据没有重叠。对于基本事实,我们考虑所有对应的答案作为候选答案集,并将他们收到的赞同作为排名分数。更好的答案倾向于获得更高的分数。请注意,我们的任务是预测给定问题的答案的相对质量排名,而不是确切的赞同/不赞同值。给定测试问题集合,我们用表示测试问题的所有答案的预测排名,用表示第个位置的排名答案。
4.2 性能比较
我们基于三个广泛使用的排名评估标准来评估我们提出的方法的性能,这个评估标准针对CQA网站中基于社区的“问题答案”问题,分别是标准化折扣累计收益(nDCG) (Shen et al. 2015), 精确度Precision@1 (Qiu and Huang 2015) and 准确性Accuracy (Zhao et al. 2015). nDCG中的相关性分数是根据收到的答案的赞同/不赞同数来决定的。
Precision@1计算在某个算法上最佳答案排在最前面的平均次数。Accuracy是访问最佳答案的排名质量的标准化标准,其中准确度= 1(best)意味着由某个算法返回的最佳答案总是排在最前,而准确度= 0则相反。我们将我们的方法与其他七种最先进的方法相比较,结果如下所示:
- BOW方法是一种计算相关分数的基于问题和答案的袋装词表示的答案排序算法。
- QATM方法 (Ji et al. 2012) 是一个“问题答案”主题模型,它可以学习问题答案对中的潜在主题。
- GRMC方法 (Zhao et al. 2015)是图的正则化矩阵完成模型,它根据回答者的专业知识权威提供答案排序。
-
Doc2Vec方
全文共10132字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[12315],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。