英语原文共 13 页，剩余内容已隐藏，支付完成后下载完整资料

一种基于Q-学习的用于数据分类的多代理系统

FarhadPourpanaha Choo JunTanb Chee PengLimc JunitaMohamad-Saleha

https://doi.org/10.1016/j.asoc.2016.10.016 Get rights and content

集锦

提出了一种基于Q学习的多分类器数据分类系统。

利用Agent协商的信任协商通信推理机制。

提出了一种结合Q学习和贝叶斯形式主义的信任度量方法。

使用有噪声和无噪声的基准问题来评估所提出的模型。

结果表明，该模型可用于数据分类问题。

摘要

针对数据分类问题，提出了一种基于Q学习的多智能体分类器系统，制定了使用Q学习和贝叶斯形式主义相结合的信任度量。具体地说，设计了一组包括Q学习的混合神经网络的学习代理，我们已经在前面的工作中制定了该模型，以形成所提出的Q学习多智能体分类器系统（QMACS）。采用大O-符号法分析QMACS的时间复杂度。此外，一些基准问题被用来评估QMACS的有效性，包括有噪声和无噪声的小数据集和大数据集。为了对QMACS性能进行统计分析，采用了95%置信区间的引导程序(bootstrap)方法。将QMACS的结果与文献报道的成分和其他模型进行比较。结果表明QMACS在结合其学习代理的预测后提高了整体分类性能的有效性。

关键词：模糊ARTMAP；多智能体系统；增强学习；信任度量数据分类

1 引言

人工神经网络（ANN）是一种有用的机器学习模型，已被广泛应用于各种领域的问题求解。[1]. 然而，单独的人工神经网络模型具有有限的能力[2],例如，一些人工神经网络在噪声数据集的学习中是无效的，而其他ANN需要大量的数据样本，以便更好地学习。为了解决这些问题，神经网络集成（NNE）的概念提供了一个很好的解决方案。事实上，集合模型能够提高个体分类器的精度和稳定性，如[3,4]. 中所报道的。NNE的基本原理是结合多个个体（每个个体可能较弱）ANN来设计一个健壮的集成模型。已经提出了许多基于人工神经网络的集成模型[5]并用于处理各种领域中的问题，例如人脸识别[6],医学诊断[7],和优化[8]。

在用NNE处理数据分类问题时，构造了一个分类器池。NNE通过对所有集合成员进行综合预测来提供对新样本的目标输出的估计。一些有用的NNE技术，包括装袋[9]和提升[10],通过在不同的方法中改变训练样本来创建它们的成员。另一方面，多Agent系统（MAS）需要一个推理模型来制定代理（例如，一个分类器池）和环境之间的关系。[11]例如信念、愿望和意图（BDI）模型[12]。

在这项研究中，我们专注于多Agent系统（MAS）作为一个框架，结合来自多个基于ANN的分类器（学习代理）的预测。MAS模型已被用于解决许多不同的问题，例如医学诊断[13]，故障诊断[14]控制[15]，电力系统[16]，和机器人[17]。类似于NNES，我们使用MAS模型来改善单个ANN的性能。在发展一个健壮的基于MAS的集合时，存在两个主要挑战：（i）制定作为具有不同能力的有效集合成员的个体ANN，和（ii）设计一个稳健的决策组合算法，以组合来自集合成员的预测用于制造。最后的决定。在这方面，我们开发了一种新的基于Agent的技术推理方法，称为信任协商通信（TNC）[18,19]在前人工作的基础上，结合Q-学习和遗传算法（QFAM）、剪枝QFAM和QFAM-GA的优势[20]，将三种混合模糊ARTMAP（FAM）神经网络作为基于TNC的MAS框架的学习代理。本研究的一个重要贡献是，使用Q-学习和贝叶斯形式主义导出了TNC方案的新的信任度量。所得到的模型被称为Q学习多Agent分类器系统（QMACS）。我们的研究工作的主要目标有两个方面，如下：

①开发基于FAM的网络[20]作为MAS的有效学习代理；

②基于Q-学习和贝叶斯形式主义的TNC方案的信任度量；

为了评估QMACS的性能，研究了一些基准问题（各种数据集有无噪声）。使用引导程序(bootstrap)方法[21]，对结果进行统计，并与文献中报道的其他模型进行比较。引导程序(bootstrap)方法已经被选择，因为它在统计参数估计中的许多好处。特别是，引导程序(bootstrap)方法适用于样本量小的问题，需要较弱的假设，并且在计算中更简单。[22]它能够利用小样本大小作为虚拟群体来生成更多的数据实例。与经典分布不同，引导程序(bootstrap)方法不需要对种群和样本都有强的假设。此外，引导程序(bootstrap)方法是简单的，并且用户不需要具有复杂的数学背景[22]。

2 文献综述

2.1 基于神经网络的集成模型

为了制定有效的集合模型，每个集合成员应该产生与同一输入有关的不同预测[23]。许多方法可用于从基于数据的学习代理创建不同的预测 全文共23376字，剩余内容已隐藏，支付完成后下载完整资料

资料编号：[14315]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

以上是毕业论文外文翻译，课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

一种基于Q-学习的用于数据分类的多代理系统外文翻译资料

一种基于Q-学习的用于数据分类的多代理系统

集锦

提出了一种基于Q学习的多分类器数据分类系统。

利用Agent协商的信任协商通信推理机制。

提出了一种结合Q学习和贝叶斯形式主义的信任度量方法。

使用有噪声和无噪声的基准问题来评估所提出的模型。

结果表明，该模型可用于数据分类问题。

摘要

1 引言

2 文献综述

2.1 基于神经网络的集成模型

您可能感兴趣的文章

登录

一种基于Q-学习的用于数据分类的多代理系统

集锦

提出了一种基于Q学习的多分类器数据分类系统。

利用Agent协商的信任协商通信推理机制。

提出了一种结合Q学习和贝叶斯形式主义的信任度量方法。

使用有噪声和无噪声的基准问题来评估所提出的模型。

结果表明，该模型可用于数据分类问题。

摘要

1 引言

2 文献综述

2.1 基于神经网络的集成模型

您可能感兴趣的文章