英语原文共 29 页,剩余内容已隐藏,支付完成后下载完整资料
探索深度神经网络和强化学习以处理大数据中的大规模任务
摘要
近年来,基于云计算的大规模任务处理已成为大数据分析和处置的关键。通常,大多数以前的工作都将常规方法和体系结构用于一般规模的任务,以实现大量任务的处理,这受计算能力,数据传输等问题的限制。基于此论点,基于胖树结构的这项工作中提出了一种称为LTDR(使用深度网络模型和强化学习的大规模任务处理)的方法。为了探索最优的任务分配方案,本文提出了一种基于深度卷积神经网络和Q学习的虚拟网络映射算法。经过特征提取后,我们设计并实现了一个策略网络来制定节点映射决策。链接映射方案可以通过设计的基于分布式价值函数的强化学习模型来实现。最终,任务被分配到适当的物理节点上并得到有效处理。实验结果表明,LTDR在满足大数据任务要求的同时,可以显着提高物理资源的利用率和长期收益。
关键词:大数据、云计算、深度网络模型、大规模任务处理、强化学习
- 简介
近年来,大数据的任务分析和处理问题[2,4,23]已经成为一个热门问题。为了简化任务处理和基础架构资源共享,基于云计算的任务并行处理已引入大数据处理中,并占有重要地位。任务分配策略[12,21]是任务分析和处理中的关键部分之一,它有助于在云计算环境中进行合理的资源分配和任务并行执行。有效、合理的任务分配方法对于任务并行处理至关重要。近些年来,已经有许多任务分配方法[13,14,16]被提出,它们实现了合理的任务分配并满足了用户的任务要求,同时实现了性能收益的最大化。
但是,随着数据量的快速增长,大数据的大规模任务处理问题变得尤为重要。 面对要处理的大量任务,上述传统任务分配方法可能会在性能上受到某些限制,因为它们的体系结构和方法仅适用于一般规模的任务处理。而快速、高效的大规模任务处理方法可以实现合理的任务分配和资源的有效利用,这有助于云数据中心中每个任务处理节点的协同工作。因此,我们有必要探索出一种有效的大规模任务处理方法,在分配任务的过程中更合理、有效地选择最佳物理节点。
随着网络中任务规模的扩大和类型的多样化,目前在大数据的大规模应用中,依靠通用架构很难满足大规模任务处理的需求。大规模并行处理体系结构中的任务并行执行[6,10]已成为处理大规模任务的有效方法。在这项工作中,胖树结构[5]已被引入以用于有效的任务并行处理,它可以减轻并行处理大数据任务中节点间交互的工作量,利用全连接网络的模式,并且区域中的某个节点故障不会导致许多服务器瘫痪,还可以在一定程度上提高系统的整体吞吐量,这有助于提高效率和可靠性。云数据中心中的任务执行,众所周知,大量的物理节点和链接可以为任务请求提供胖树结构的服务。此外,期望的任务分配策略能够在数据中心中实现合理的负载分配,并提高执行效率和外部服务能力。因此,在大规模任务处理过程中,迫切需要解决探索最优的大规模任务分配策略的问题。
基于这一论点,本文提出了一种大数据的大规模任务处理方法,该方法将任务分配到云数据中心的适当物理节点上。从长期利益的角度来看,大量的任务分配是通过虚拟网络映射的权利来完成的。对于当前的物理节点和任务请求,执行特征提取以描述节点和任务的状态及其内部关联,目的是构造模型输入并减少原始数据的维数。我们设计和训练基于历史数据和卷积神经网络的深度模型,以获得最佳的节点映射决策。通过与环境和测试的不断交互,Q学习通过评估来自环境的反馈权来实现对未来链接映射决策的优化,多主体强化学习用于实施此过程,整个网络被视为多代理系统。因此,每个节点都被视为具有独立学习能力以探究其下一跳节点的代理。可以使用马尔可夫决策过程来描述整个数学模型,并引入分布值函数来探索最佳链路映射决策。最终,最佳虚拟网络映射已完成。任务被分配到最佳物理节点上进行大数据处理,避免了节点和链接的过载,提高了系统的资源利用率。
本文的其他部分如下。在第二节中介绍了实现大规模任务处理的当前方法的相关工作,并且在第三节描述并形式化这项工作中提出的问题。在第四节详细描述了主要算法的设计和实现。此外,还阐述了理论分析和讨论。在第五节,获得实验结果并给出性能分析。最后,第六节总结了全文并指出了未来的工作。
- 相关工作
近年来,基于云计算[1,15,22]的大规模任务处理一直是研究的热点,其目标是确保能够有效、快速地处理大量的大数据任务。许多研究人员提出了一系列方法来实现大数据中快速高效的任务处理。通常,这些方法侧重于不同的研究领域。
先前工作中的一些方法,例如参考文献7和24中,专注于研究大数据的大型任务调度。在参考文献中7中提出了一个名为Arana的跨域工作流调度系统。 所提出的系统使用户能够通过跨域数据实现计算而无需通过靠近数据移动程序并集成流行的大数据处理平台来进行传输。在参考文献24中,提出了一种全面的大数据集群任务调度算法。在此,将计算不确定性建模作为对处理速度的扰动,并设计了所提出的任务调度方法来应对潜在的计算不确定性。
在其他一些工作[8,26]中,研究人员专注于分布式数据中心中大数据的任务处理。在参考文献中8中,通过对地理分布数据中心中的大数据服务使用三要素的联合优化,来集中精力研究成本最小化问题。为了在考虑数据传输和计算的同时描述任务完成时间,提出了二维马尔可夫链,并得出了封闭形式的平均任务完成时间。此外,将该问题建模为混合整数非线性规划(MINLP),并提出了一种有效的解决方案以对其进行线性化。在参考文献26中,提出了一个有效的数据移动、资源供应和减少器选择的方法框架,以实现成本最小化,并且这两种成本是MapReduce两个阶段之间的平衡带宽成本、存储成本、计算成本、迁移成本和等待时间成本跨数据中心。通过同时最小化五个成本因子,可以将提出的复杂成本优化问题表达为联合随机整数非线性优化问题。利用Lyapunov技术,他们将原始问题转换为三个独立的子问题,可以通过设计有效的在线算法MiniBDP来解决,以最大程度地降低长期平均时间运行成本。
关于大数据的图像处理,见于参考文献11。已经在互联网领域将具有聚类和负载平衡的任务分配技术引入了替代大数据的图像处理任务分配领域,设计并实现了替代大数据的负载均衡集群架构,并实现了适用于大规模图像处理的改进负载均衡算法。在参考文献27中,研究了将现代大数据平台用于多任务科学应用的想法。Kira是在此处构建的,它是使用在Amazon EC2 Cloud上运行的Apache Spark的灵活,可扩展且高性能的天文学图像处理工具包,还介绍了现实世界中的Kira Source Extractor应用程序,该应用程序用于研究编程的灵活性,具有数据流量丰富性,调度能力和周围生态系统的优秀性能。
关于无线大数据处理的任务分配,请参见参考文献19。强调了为无线混合网络中有效的数据处理设计适当的任务分配方案的意义。此外,提出了一种简单而有效的任务分配方案,该方案是基于上下文信息而设计的。所提出的任务分配方案能够基于预期的传输延迟确定要分配给每个机架中服务器的任务数量,从而缩短大数据处理的完成时间。在参考文献28中,提出了一种近距离计算增强型C-RAN(NFC-RAN)架构,可以更好地处理大数据及其相应的应用程序。提出的NFC-RAN由近边缘计算(NEC)和远边缘计算(FEC)单元组成。这项工作介绍了NEC和FEC之间的任务分配。此外,还以WiFi室内定位为例,说明了所提出的架构。
上面的所有信息都是针对不同研究领域中的大数据的大规模任务处理而制作的。不幸的是,这些提出的方法的有效性仍然受到任务处理节点故障和算法相对较高的复杂性的影响。自我学习和自我进化能力的提高在基于常规体系结构和方法的方法中仍起着重要作用。
图1.将任务分配到云数据中心的物理节点上
- 提出的问题及其表述
3.1建议的问题
随着近来大数据中任务数量的激增,许多常规架构和任务分配方法已难以满足大规模任务处理的需求。云数据中心中可能会出现诸如负载不平衡和节点故障之类的现象,这将导致服务效率下降。基于此论点,本文介绍了胖树体系结构,以实现任务的并行处理并减轻系统中物理节点的工作量。众所周知,在该结构中,可以为任务请求提供服务的大量物理节点和链接。不同的任务分配策略可能导致整个系统的不同负载分配,并且可能导致不同的执行效率和外部服务能力。上述图1给出了云数据中心任务分配的示例。
毫无疑问,最优的大规模任务分配方法应该具有为每个处理节点实现合理的任务分配,且避免节点和链接过载以及提高系统资源利用率的能力。同时,应减少节点计算和通过链接进行数据传输的开销,同时应尽可能增加整个系统的收入,从而使整个云计算系统具有更好的任务处理效率。因此,为了有效地处理大规模任务,有必要在云数据中心设计并实施合理、高效的任务分配方法。
3.2问题表述
为了有效地实现大规模任务处理,提出了一种基于虚拟网络映射的新型任务分配方法。在本节中,将对网络模型和提出的问题进行详细形式化。
网络虚拟化体系结构包括两层:基础架构网络层和虚拟网络层。我们可以考虑由多个连接的计算节点(物理节点)组成的共享分布式基础结构,该结构通过网络(由物理链接组成)。基板网络拓扑可以表示为加权无向图,,其中为底物网络中的节点集,而是底物中的链接集网络。物理节点(和物理链路都与属性和关联。通常,的属性是可用的CPU功能CPU和物理位置Loc。的属性是可用带宽资源BW。衬底网络中的无环路径为表示为。在此,并行作业由某些任务组成,每个任务都在一个虚拟机。用于表示虚拟机。因此,每个平行作业提交可以根据以下内容传输到虚拟网络请求中:工作资源需求。与基础网络似,虚拟网络拓扑可以表示为加权无向图(),其中是虚拟网络中的节点集,而是虚拟网络中的链接集虚拟网络。是的资源约束的集合,包括计算能力要求CPU和位置要求Loc。表示虚拟机的带宽资源要求BW链接。虚拟网络请求可以用四元组表示VNRi=(,其中表示可以达到的最大距离映射到位置要求Loc。是虚拟设备的到达时间网络请求,是基础网络中虚拟网络的持续时间。
虚拟网络映射的过程可以表示为:M:,其中和。该过程可以分解为以下两个步骤:(a)将虚拟节点映射到满足以下条件的物理节点上,即资源限制;(b)将虚拟链路映射到满足带宽资源约束的自由环路上。
我们方法的主要目标是在最大程度地减少系统资源消耗的同时,实现最大系统收益的最大映射成功率。在时间t成功接受虚拟网络请求的收入可以定义为计算和带宽资源需求的总和
可以将在时间t接受虚拟网络请求的成本定义为分配给虚拟网络请求的资源之和
其中{0,1},并且在带宽资源的前提下将分配给虚拟链路,否则。BW()是分配给的带宽资源的值。
根据等式(1)和(2),我们可以如下定义虚拟网络映射过程的度量
- 基板网络的长期平均收入:
- 基板网络的长期平均成本收益比(R = C比)
T内映射过程的效果由上述指标衡量。我们的主要目标是达到M:;找出每个虚拟网络请求以及最大化基板网络的长期平均收入和R / C比率。
4.拟议的有效的大型任务处理方法LTDR
4.1系统架构设计
下述图2说明了在大数据的大规模任务处理中所提出的LTDR方法的体系结构。它描述了LTDR与其他实体之间的交互。所提出的方法是基于人工神经网络的,可以分为训练和应用两部分。在模型训练过程中,监控器获取大量任务所请求的资源信息,以及基板网络中可用物理节点和链路的剩余资源量状态信息。利用从模拟器获得的包括特征矩阵的信息,LTDR生成虚拟网络映射决策,该决策将传输到虚拟网络映射控制器中以执行相应的映射方案。分配控制器在成功完成节点和链接映射的前提下接收并执行任务分配策略。如图2所示,在应用阶段,首先,监视器获取任务请求和物理节点的信息;
随后,与培训阶段不同,虚拟网络映射控制器直接用于正确的映射决策;最终,利用分配控制器,将t内累积的任务请求分配给相应的物理节点以进行有效处理。
图2. LTDR架构视图
与以前的任务处理体系结构不同,本文介绍了胖树拓扑结构,以减轻并行处理大数据的大任务时节点之间交互的工作量。在这里采用完全连接网络的模式时,区域中某个节点的故障将不会带来大量服务器的混乱,这有助于数据中心的正常运行。另外,可以在一定程度上提高系统的整体吞吐量。
利用这种架构,提出了LTDR作为一种新颖的大规模任务处理方法,该方法能够将大数据任务分配到云计算环境中的最佳物理节点中。本文将深度学习方法与强化学习相结合。从大数据的大规模任务处理中的长期利益来看,它借助虚拟网络映射实现了无数的任务分配。首先,将网络请求数据分为训练集和测试集,用于训练和应用我们的深度网络模型和强化学习代理。其次,针对构造模型输入并减少原始数据的维数,进行特征提取以描述物理节点和任务请求的当前状态及其内部关联。我们设计基于卷积神经网络的深度学习模型,以实现最佳的节点映射。使用历史网络请求数据可以实现模型训练。该模型以从任务请求和物理节点提取的特征矩阵为输入,并输出将虚拟节点映射到物理节点的概率。随后,我们采用Q学习方法来做出链接映射决策。利用与环境和测试的持续交互,Q学习将通过评估来自环境的反馈来优化链接映射的未来决策。多主体强化学习用于实施此过程。我们将整个网络视为多代理系统。因此,可以将每个节点视为
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[238943],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。