通过监控温度和工作负载动态优化FPGA应用程序∗外文翻译资料

 2022-02-15 23:04:02

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


通过监控温度和工作负载动态优化

FPGA应用程序lowast;

Jones, Phillip HCho, Young HLockwood, John W

摘 要

在过去,现场可编程门阵列电路(FPGA)只包含有限的逻辑量,并且操作频率较低。在FPGA上运行的应用程序很少消耗过大的功率。今天,由于逻辑密度和速度的增加,FPGA的温度是一个主要问题,具有高度管道化数据路径的大型应用程序最终产生的热量可能会超过包所能释放的热量。对于在受控环境中工作的FPGA,可以使用散热器和风扇来有效地散热。然而,在室外环境或冷却系统出现故障的系统中,在较恶劣的热条件下运行的FPGA设备需要一个额外的管理控制系统。

为了解决这个问题,我们以前设计了一个可重构的温度监测系统,利用测量的器件结温反馈给FPGA电路。利用这种反馈,我们设计了一种新型的双频开关系统,使FPGA电路在给定的最高结温下保持最高的吞吐量性能。本文通过进一步提高这种主动频率机制的工作负载意识,评估这种方法在突发性工作负载条件下的功率和延迟性能,对以前的工作进行了展望。我们的工作系统已经在我们的现场可编程网络研究平台上实现和部署。与无热反馈或工作负载反馈的系统相比,具有可缩放图像相关电路的实验结果显示可节省30%的功率,并可提高2倍的延迟性能。我们的电路提供了节能的高性能处理突发工作负载,同时确保设备始终在安全温度范围内运行。

lowast;WILLING TO BUY 2 EXTRA PAGES

介 绍

许多应用在其使用寿命期间都会受到多种热条件的影响,如移动系统、军事和空间应用,需要在不同环境中快速移动的嵌入式系统中进行高性能计算。固定系统,如室外监控系统,必须适应可变环境温度。即使是在严格控制的环境下工作的系统,如机房内的机架式FPGA计算叶片,也必须适应可变的热环境,使得它们不会因风扇故障或气流受阻而完全失效。一般来说,所有可重新配置的设备都会发现它们所处的环境与它们的典型操作条件大不相同,在这些情况下,最好让电路适应环境。

大多数现有的FPGA电路以固定的工作频率工作。在这个频率下,散热机制被用来处理最坏的操作条件。当最坏操作条件和典型操作条件之间存在显著差异时,系统必须过度设计,并且系统实际性能在典型操作条件下可能明显低于最佳性能。

这项工作扩展到我们先前开发的主动频率控制机制,利用热反馈来调整可重构系统的运行速度。为了减少应用程序空闲期间的功耗,我们增加了工作负载反馈,并避免在繁重的工作负载下使用与电源和延迟相关的固定频率。

  1. 原 因

在我们的可重构开发平台上测试高性能电路时,我们遇到了一个导致FPGA过热的事件。由于不利的环境条件,我们的一个平台被损坏,因为bitfile产生的热量超过包所能散发的热量。

考虑到开放式机箱中可用的气流量。为了防止将来发生这样的事件,我们设计了一个温度监控电路,该电路在可重构平台内的另一个FPGA上运行,就像一个热断路器。该平台现在提供了一种通过网络监控可重构设备温度的机制,并提供了一种动态调节可重构逻辑设备运行的机制。

在我们对FPGA热性能的描述过程中,我们发现有机会利用相对较快的结温变化测量值,而由于封装和散热片的热质量,系统温度变化率相对较慢。与平台对数据包进行计算的时间相比,在包缓慢升温的情况下,高频下操作电路的时间相对较长。鉴于这是一个改善我们可重构硬件平台在瞬态条件下性能的机会,我们设计了一种新方案,利用温度阈值在两个时钟频率之间动态调整可重构逻辑设备的操作。该机制生成一个热适应频率,使指定的最大应用温度下的计算吞吐量最大化,本文将其称为应用程序的热预算。我们当前的工作将工作负载反馈添加到这个机制中,并对Bursty工作负载进行性能评估。

  1. 贡 献

在下面的章节中,我们将讨论与热管理和电力管理相关的学术工作和工业解决方案。第3节总结了我们在本文中所做的前期工作。先前工作的主要贡献是:(1)为在fpgas上实现的应用程序实施热关机电路;(2)热轮廓可重新配置硬件的系统方法;(3)开发和评估温度驱动的自适应频率机制,以优化应用程序吞吐量和适应热环境的变化。第4节和第5节详细介绍了本文的贡献。第4节将我们以前的温度驱动自适应频率机制扩展到工作负载感知,并研究为什么我们的机制为繁重的工作负载提供节能和低延迟处理。第5节实施并评估了方法的有效性。此评估将我们的自适应频率机制应用于高功耗图像相关应用程序,并量化与我们相比在不同工作负载利用、突发长度和热条件下使用热安全固定频率的功耗和延迟方面的改进。

相关工作

微处理器的设计使得它们的电压和频率可以按比例缩放,以延长移动计算机的电池寿命。包括英特尔(Intel)和AMD(AMD)在内的公司都曾将这一概念用于管理服务器上的散热[1]。通过引入电源管理功能,在CPU上运行的软件可以在设备过热之前调整电压和频率以降低功耗。这种技术对于位于容纳成百上千个计算节点的大型数据中心的服务器至关重要。像XScale[2]这样的低功耗嵌入式处理器具有挂钩,允许电压和频率缩放来管理电源。[3]提出的工作利用这些特性来呈现动态热管理(DTM)系统,该系统根据外部热电偶的温度读数来缩放处理器频率。

Hewlett-Packard、Intel、Microsoft、Phoenix和Toshiba共同开发的高级配置和电源接口(ACPI)标准定义了软件在系统内设备上执行电源管理的接口[4]。ACPI目标系统具有操作系统或重要的管理固件,而不是使用很少或没有软件运行的可重新配置应用程序。

在可重构逻辑器件的电源管理领域也有一些工作。尚在XilinxVirtex II FPGA上进行了功率测量实验,以确定动态功率的分布[5]。在分析的应用中,发现时钟资源消耗了高达22%的动态功率。因此,管理时钟树的使用可能导致显著的节能。virtex II具有名为bufg-muxs[6]的实体,可用于关闭部分时钟树或在空闲时间切换到低频[7]。通过对映射到virtex II的无线信道估计器应用程序进行低级别模拟,通过对未使用的部分应用程序禁用时钟,Meng显示了25%的节能效果[8]。本文的一个方面是充分考虑到在工作负荷较重的空闲期间切换到低频可以节省电能。

  1. 在FPGA平台上使用热反馈

我们从本节开始,概述了用于此工作的开发平台。然后,我们总结了我们以前的工作,在此基础上构建了这项工作。这包括一个安全热关机电路和一个热自适应频率机制。

  1. 开发平台

本文描述的电路在我们的现场可编程网络研究平台上实现,如图1所示。该平台包含两个FPGA:(1)一个称为网络接口设备(NID)的小型Xlinx virtex FPGA配置了一个静态位文件;(2)一个称为可重构应用程序设备(RAD)的大型Xlinx virtex FPGA配置了通过网络动态加载的位文件。实现模块化数据处理功能的新的位文件通过网络发送到NID,位文件用于重新配置RAD。平台使用车载最大温度测量设备(MAX1618)对辐射温度进行数字采样。

热关机电路

图2显示了我们的一个平台的侧视图,该平台被运行在RAD上的一个位文件损坏,该位文件消耗的功率超过了平台在没有足够气流冷却系统的机箱中所消耗的功率。电路板弯曲,在电源平面之间造成短路。通过电源插脚的多余电流烧坏了连接器,如图所示。

出于防止这种高功率应用程序损坏另一个平台的需要,实现了一个热监控和关闭电路。电路降低NID以监测RAD的结温。如果应用程序导致RAD的结温超过可编程的最大阈值,那么NID就充当断路器,从设备中卸载高功率位文件。

图3说明了温度监视器和关闭电路如何映射到可重新配置的平台上。在NID上使用逻辑实现热关机电路,以防止在RAD上部署的应用程序超过安全工作温度。NID面对一个MAX1618,一个最高温度监控芯片。

这是使用一个嵌入在RAD硅中的感应二极管来测量结温的。NID对MAX1618进行采样,并将从该设备接收的温度与用户可编程的最高温度阈值进行比较。如果超过预设阈值,NID将通过RAD的selectmap接口发送命令以清除配置内存,从而关闭部署在RAD上的应用程序。

RAD的温度也可以通过网络向NID发送查询消息进行外部监控。NID以一条状态消息响应,该消息将重新报告RAD的温度。我们编写软件来记录RAD的温度,同时运行定制设计的热基准电路。第3.3节讨论了如何扩展温度监控和关机电路,以实现在RAD上部署的应用程序的自适应频率控制。

  1. 温度驱动频率控制

本节首先讨论从热适应频率管理电路中获益的应用类型。接下来,我们将概述我们的热适应频率机制。本节最后总结了将该机制应用于各种热条件下的图像处理应用所获得的先前结果。

  1. 目标应用

通过采用热反馈自适应频率控制,可重构系统具有一定的特性。首先,在温度变化的环境中部署的系统允许电路调整其性能。第二,具有多种操作模式的系统会影响其热输出,这得益于自适应热控制。第三,对于那些需要低延迟的快速计算系统来说,允许设备以比稳定状态下更快的频率临时运行会带来好处。

  1. 建筑

我们的热反馈频率机制由两部分组成:1)一个双频多路复用电路,2)一个温度驱动频率控制器。

如今,Xilinx和Altera等供应商提供的FPGA具有延迟锁定环路(DLL),可以对时钟输入信号进行乘法和除法。我们使用DLL和2:1的多路复用器来实现双频多路复用电路,该电路可以在基频输入时钟和基频为4倍的时钟之间切换。多丛选择行确定基频还是4X时钟将驱动时钟树。图4显示了频率复用电路的结构。该电路的4x时钟生成部分使用由Xilinx Xapp174提供的时钟倍增器设计[9]。可以并且应该使用更精细的技术来避免时钟故障。例如,2:1 mux组件的无故障版本可以通过virtex II[6]和后期的xilinx fpgas提供的bufgmux组件实现。

2:1多路复用器的选择线由温度驱动的频率控制器控制,该频率控制器监控应用程序的温度并实施高/低温度阈值控制策略。可重构设备上的应用程序逻辑使用4x时钟工作,而温度保持在上限以下。一旦达到阈值上限,应用电路就被给予基本时钟,并允许冷却,直到达到阈值下限。此时,循环将重复。

这种方法的主要思想是用更快的(4x)时钟调整应用程序运行的工作周期。随着外部热环境的变化,工作循环将自动调整,使应用温度保持在上下限之间。通过适当选择阈值并在模式之间快速切换,应用程序可以在严格的范围内保持目标平均温度。

最高温度阈值是应用程序的实际预算。其目的是通过根据热运行环境的变化来调整占空比,从而达到给定热预算的最大计算性能。图5显示了热控自适应频率机制在可重构平台上的映射。频率复用器在RAD中重新配置。频率控制电路位于NID上。该电路是第3.2节所述热关机电路的扩展。开发了一种状态机来实现温度阈值控制器。通过网络发送给NID的配置命令设置了温度阈值的上限和下限。应用程序的实际预算是上限所包含的值。

通过将这一机制应用于5.1中描述的图像处理应用,我们在吞吐量上提高了2.4倍,从而获得了热安全的固定频率。我们之前的评估使用了连续的流式工作负载来充分利用电路,以适应多种热条件。

  1. 突发工作负荷的自适应处理

本节首先介绍对其他自适应频率机制的扩展,以使其了解工作负载。接下来,我们讨论了期望我们的方法比使用固定频率更节能、对突发工作负载具有更低延迟的原因。

  1. 工作负荷感知频率控制扩展

最初的温度驱动频率控制机制是根据应用FPGA的结温在高频和低频之间选择的。强调的假设是,应用程序正在从一个始终充分利用可用计算资源的源流式传输数据。在许多情况下,这种假设不成立,工作负载很重的应用程序就是这样一个例子。当没有要处理的工作负载时,要遵循的自然策略是以较低的频率运行应用程序。此策略通过执行从温度驱动的频率控制器接收到的频率控制信号和应用程序生成的负载指示信号来实现我们的频率控制机制。图5显示了这一点,以及门对频率复用电路的选择进行馈送。

  1. 节能处理 全文共10077字,剩余内容已隐藏,支付完成后下载完整资料


    资料编号:[452189],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。