Versal ACAP: Power Design Manager通用ACAP:电源设计管理器

跟着Xilinx学FPGA——Versal ACAP: Power Design Manager通用ACAP:电源设计管理器

目标:1、使用电源设计管理器进行功率估计客观;2、使用电源设计管理器进行电源设计。



前言

SoC和FPGA设计的电源和冷却规格必须在产品设计周期的早期确定,通常甚至在SoC或FPGA内的逻辑设计之前。早期准确的最坏情况功率分析可以帮助用户避免产品电源或冷却系统设计过度或设计不足的陷阱。Xilinx Power Estimator工具是一个基于电子表格的工具,可以帮助您实现这一目标。
XPE在设计周期的任何阶段估计设计的功耗。I通过简单的设计向导接受设计信息,对其进行分析,并提供详细的功率和热信息。该工具与Vivado®设计套件紧密集成。
XPE工具的优点包括:XPE工具为许多用户所熟知。它是为Virtex®-4系列推出的,并不断发展以支持后续架构。XPE工具可用于任何设计阶段。这允许在没有任何设计数据的情况下从零开始,将其用于设计的部分,或在完整设计上运行最终功率估计。此外,XPE工具有助于获得设计热特性的基本信息。最后,XPE工具是前几代芯片的标准功率估计器。
然而,我们现在拥有的Versal®ACAP器件比以前的硅代具有更高的复杂性和每瓦性能。XPE工具的其他挑战包括:许多用户使用的不是Windows操作系统。Windows支持多种语言和区域设置。美国和欧洲的十进制点或逗号符号有潜在的问题。XPE工具使用Microsoft Excel和宏来计算功率。用户报告的问题不是XPE文件,而是Excel处理宏的方式。Microsoft安全更新还可能导致表单控件、宏或ActiveX控件在Excel中停止工作。在过去几年中,设备的复杂性显著增加。这导致了更复杂的与权力相关的决策和计算。这大大降低了Excel宏的运行速度。即使您仍然可以在通用设备上使用XPE,使用该工具也不再是用户友好的。我们现在有了一个工具,推荐用于通用设备的功率估计。我是电源设计经理。

XPE


一、概述

这是PDM工具的图形用户界面。在左侧窗格中,有摘要、估计和电源设计选项卡。当Summary选项卡处于活动状态时,右侧面板显示:部件设置的详细信息。本节总结了功率估计的设备选择和过程设置。您可以实时更改它们以查看对总功率的影响。环境设置。这允许您将结温强制为固定值或指定热溶液的最大环境和有效ThetaJA。功率和热总结。这个只读表显示了基于环境表的总功率估计、结温(Tj)和裕度。此外,在片上功耗一节中提供了设计的块动态和静态功耗。单击“估计”或“电源设计”选项卡将显示它们的特定面板。

Windows 10和Linux 64位操作系统支持Power Design Manager工具。

二、设计条目选项

设计创建代表功率估计的完整手工输入。首先是适当的设备选择,其次是热条件规范,更重要的是配置平台管理控制器。在配置好设计之后,IP向导可以用来创建设计,然后在单个块表上进行细化。
设计分析特定于在Vivado IDE中创建并导入PDM以进行进一步分析或后期处理的Versal ACAP设计。

三、设计步骤

1.PDM支持两个主要的设计流程

手动估计流程用于根据估计的设备资源计数和切换率评估所选设备的总功率。在启动新的PDM项目时,“新建项目向导”将指导您完成项目设置。对于导入流程,在创建新项目时将从XPE或Vivado Report Power生成的文件导入到PDM中。通过导入流,体系结构和设备详细信息将从XPE文件自动填充。

2.在导入数据时,您有三个选项。

  1. 第一个选项是直接从XPE工具导入。XPE工具有一个导出XPE文件的选项。该文件可以在PDM项目创建期间使用。请注意,仅支持Versal
    XPE工具版本2022.2或更高版本。此外,您还需要确保XPE工具中使用的实例名是唯一的。

  2. 第二个选项是在Vivado IDE中导入Report Power生成的XPE文件。这可以在GUI模式下完成(打开的合成或实现设计中的Report Power),也可以通过等效的Tcl命令(report_power)完成。这种分析可以是设计节点的无矢量预测切换活动,其中设计约束没有指定活动,或者没有从仿真结果中提供活动。或者,您可以运行vectorbp。获得准确的功率估计的一个重要因素是设计活动必须是现实的。它应该表示进入模拟块的数据的典型或最坏情况。交换活动由SAIF文件描述。这可以通过逻辑模拟生成。更多信息请咨询UG900。您可以在PDM项目创建或设备设置期间导入Vivado ide生成的XPE文件。

  3. 第三种选择是从Vitis TM AI环境导入数据。Vitis软件平台生成可以导入的XPE文件,为ai引擎功率估计提供准确的起点。导入后,将生成所有配置,与手动输入模式相比,可以更准确地估计功率。由Vitis软件平台生成的XPE文件在导入时,会对特定内核类型的矢量负载和内存读/写速率取平均值。例如,内核类型INT8的所有内核的矢量加载和读/写速率是平均的,并填充在PDM中的单行中。的伊尔塔迪斯纳法12%伊蒂尔夫。相反,它是由工具根据每个Al Engine tile的流使用情况计算出来的。请注意,仿真流程可以用于获得更准确的人工智能引擎功率分析。为此,可以在ai引擎编译器流之后运行ai引擎模拟器。您可以使用PDM工具的“Al Engine Power Interface”中的“import”选项,将XPE文件导入到“Al Engine”页签中。
    date importing options

四、配置设备

设备选择(基于资源、性能、功率和封装要求)是应用程序的关键步骤。建议选择符合您要求的最小设备。当针对通用设备时,许多传统上使用逻辑资源实现的功能可以被吸收到强化的通用IP块中,如NoC、ddrmc、mrmac和ai引擎,以降低功耗。记住减去硬IP中吸收的任何逻辑资源。PDM主要支持针对通用设备。通用设备选择包括系列,设备,设备等级,封装,速度,温度等级和静态筛选选项。VCCINT电压和过程也可以在器件选择期间初始化。每个设备都有一组独特的功能块,而封装选择决定可用的I/O和收发器。具体请参考目标系列的产品选型指南。通用设备支持以下温度等级,每个温度等级对功率都有影响。
工业工作温度范围-40°C至100°C。扩展工作温度范围为0°℃至100°℃。Q-grade工作温度范围- 40°℃至125°℃。军用工作温度范围-55°C至125°C。
part_configuration
与扩展级设备相比,我们独特的功率分组策略使工业级设备的静态功率更低。通用器件提供增强的电压缩放选项,这是这些器件上最高性能/瓦特的关键。通用设备支持以下工作模式:高性能核心工作电压0.88V (VHP)中/平衡功率/性能核心工作电压为0.80V (VMP)低功率铁芯工作电压0.70V (VLP)工艺选择代表了器件的制造工艺变化,对泄漏功率有显著影响。在低温环境下,可设置为“典型”。对于所有其他用例,将最坏情况功率估计设置为Maximum,这对于高功耗应用的电源,电路板和热设计非常重要。

Thermal Settings & Summary

泄漏功率随结温呈指数增长,因此准确地确定PDM中的环境条件是非常重要的。环境设置允许以下流程:当用户设置结温时,输入目标结温或设备与环境温度的最高结温。PDM计算最大有效OJA以满足需求(effective ΘJA字段为只读)。对于PDM估计的结温,输入PDM计算结温的环境温度和有效OJA。通过热模拟可以推导出有效的ΘJA。PDM不进行热分析来计算有效的OJA。它根据给定的结温和环境温度值报告要求。PDM只使用热设置来计算结温,根据这里所示的公式。建议将pdm填充的最大有效OJA替换为系统热分析(最好是热模拟或实际系统测量)确定的有效OJA。如果指定或计算的结温超过器件温度等级余量,PDM会发出警报。

通用ACAP电源和热仪表板非常类似于XPE。“表征”标签表示所选设备的表征状态。下图显示了VSVA2197封装中VC1902器件的功率和热报告摘要,仅用于静态电源。根据之前的环境设置,该功能的热功率余量约为50w。热和功率余量是根据该器件等级的最大可接受范围进行测量的。当估计结温超过器件规定的最大值时,热余量为负值。
Power and thermal reporting

五、PL端元件功率估算

可编程逻辑由以下几个部分组成:逻辑、块RAM、UltraRAM、DSP、I/O和收发器。您应该首先定义时钟,以便它们可以与其他工作表上的资源条目相关联。数据条目的组织对于准确的功率估计非常重要。这样可以避免由于设计的某些部分被忽略而造成的低估,也可以避免由于重复而造成的高估。
使用以下常用策略来评估大型设计的能力:输入与每个主要分层设计块对应的资源行,使用块名称或实例名称作为行的基本名称为每个分层块中的每个时钟至少输入一行资源对于时钟域交叉上的逻辑,将逻辑与其关联的时钟分组在每个时钟域中,对具有不同切换速率的资源使用多行

1、Clock Estimation

在估计流程中,首先定义设计中使用的时钟网络。PDM工具提供了创建时钟的向导。时钟配置示例如下图所示。在分析流程中,您可以使用“编辑时钟”页签修改导入的时钟网。你也可以从这里删除时钟。完成时钟配置后,您可以观察到所涉及的电压轨的利用率(可用和使用的时钟元件的数量也给出了)和功耗。
Clock Estimation

2、功率评估Power Estimation

  1. 逻辑估计:Logic选项卡涵盖了CLB逻辑:lut和寄存器的功率估计。每一行表示一组逻辑,这些逻辑与:一种特殊的时钟,其频率用于计算表示所有逻辑输入和输出的平均值的切换率。lut分为以下三类,而寄存器主要是CLB寄存器。作为组合逻辑的LUT:对于简化的输入,PDM假设平均大小的LUT大约有五个输入,并且还假设一小部分LUT使用两个输出。作为移位寄存器的lut: SRL原语lut作为分布式ram: LUTRAM原语要消除估计基于分布式ram的内存所使用的总lut的困难,请单击Add distributed Memory按钮以启动PDM Memory Configuration Wizard。逻辑选项卡中的路由复杂性列是互连功率的抽象模型。该数字表示每个逻辑网络的路由资源的平均数量。路由复杂性通常只在导入Vivado功率分析结果时修改。对于早期的评估,我们建议您将路由复杂性保持在默认设置。完成逻辑配置后,您可以观察到所涉及的电压轨的利用率(也给出了可用和使用的逻辑元件的数量)和功耗。
    logic-Estimation

  2. 块RAM/UltraRAM 评估:块RAM选项卡涵盖了专用36 kb块RAM的功率估计,这些块RAM用于实现比lutram可行的内存大得多的内存阵列。块ram通常由特定深度、宽度和级联高度的数组组成。建议使用Add Block Memory按钮提供的Memory Configuration Wizard来输入大型数组,因为它与合成结果非常匹配。合成通常选择某些架构折衷来平衡性能、面积和功率,这可能与预期略有不同。为了使ram的功耗最小化,应该设计使能逻辑,使端口仅在必要时才启用。一旦完成块RAM配置,您就可以观察到利用率(也给出了可用和使用的RAMB18和RAMB36元件的数量)和所涉及的电压轨的功耗。配置UltraRAMs与此类似,但不支持特定的向导。
    memory configuration

  3. DSP评估:DSP选项卡涵盖了对DSP58块资源的估计。与前几代类似,Versal ACAP DSP块可以实现各种各样的算术和逻辑功能,包括加法,减法,乘法和常见的DSP功能,如乘法累加。与前几代一样,DSP模块也可以实现广泛的逻辑功能,如异或,并可以级联形成数字滤波器。Versal ACAP DSP块具有更宽的27x24复乘法器,也可以配置为三个9x8乘法器,并具有更宽的58位累加器。通用ACAP DSP还支持浮点加法和乘法。一旦DSP模块配置完成,您就可以观察到利用率(可用和使用的DSP58元件的数量也给出了)和所涉及的电压轨的功耗。
    DSP configuration

  4. I/O口评估:在更高的开关速度和容性负载下,开关I/O口功率可能是通用设备总功耗的重要组成部分。因此,准确定义所有与I/O口相关的参数非常重要。在I/O口选项卡中,PDM可以帮助您计算I/O接口的功率。指定I/O接口类似于XPE工具。有I/O接口设置、活动和外部终止参数来描述I/O接口。你应该考虑以下建议:为了尽量减少输出信号的功率,始终使用最弱的驱动程序设置,以满足您的性能目标(降低驱动强度和转换率)。由于输入和输出的切换活动通常非常不同,因此建议将每个方向放在单独的行上。为每个差分输入/输出对输入一个引脚。例如,如果您的内存有四个差分DQS对,则输入4作为输入引脚列。将输出使能设置为100%是一个常见的错误,这会降低PDM的精度。注意,一些功能块包括I/O端口。在这些情况下,特定的PDM向导将在此选项卡中添加块的I/O。因此,在指定其他I/O之前,请先运行向导。完成l/O配置后,您可以观察到所涉及的电压轨的利用率(I/O接口和可用和已使用的内存控制器的数量也给出了)和功耗。表格还列出了有多少家银行使用哪种VCCO。

  5. 串行收发送器评估:GTY、GTYP和GTM是通用ACAP中用于串行数据传输的串行收发器。根据您正在使用的设备,estimate选项卡可能会列出GTY、GTYP和/或GTM选项卡。您可以使用向导指定收发器,也可以手动指定收发器。图中显示了一个示例。请注意,其他向导(如硬IP向导)可能会在这里添加行。一旦完成了收发器配置,您就可以观察到所涉及的电压轨的利用率(也给出了可用和使用的收发器通道的数量)和功耗。
    GTY configuration

  6. 片上存储器评估:片上网络是通用架构中的连接硬块,它用更窄的高速网络取代了结构和结构逻辑的某些方面。它提供PMC、DDRMC、CPM、PL、Al Engine和PS之间的连接,并为其接口的模块提供配置功能。NoC_DDRMC选项卡可以通过:手动NoC配置:使用NoC configuration选项卡指定具有读写带宽和事务大小的数据路径。DDRMC向导:使用DDRMC向导指定外部内存接口。图中显示了一个示例配置。结果在DDRMC Configuration部分中列出。本节为只读。注意,一旦指定了内存接口,I/O选项卡将自动更新。导入NoC编译器功率信息文件。DDRMC和NOC面板列出了指定模块及其功耗。一旦完成了NoC和/或DDRMC配置,您就可以观察到所涉及电压轨的利用率(也给出了可用的NoC和/或DDRMC的数量)和功耗。同时给出了NoC缓冲器的数量及其功耗。
    ddrmc-wizard

  7. AI-Engine评估:“人工智能引擎”选项卡涵盖了人工智能引擎。在通用架构中引入的ai引擎阵列迎合了高计算或复杂的dsp密集型应用的解决方案。对于早期的功率估计,您应该提供Al Engine阵列的配置细节,例如时钟频率、内核数量、内核类型和内核的矢量负载平均百分比。支持的内核类型有int8、int16、int32和浮点型。内存库和互连负载字段根据使用的人工智能引擎的数量自动填充,并可以根据应用程序需求覆盖。下图显示了一个示例。黄色的单元格标记了推荐值的边界。黄色的单元格表示超出建议值。详情请咨询UG1556。导入流程使用import功能。Vitis软件平台生成可以导入的XPE文件,为ai引擎功率估计提供准确的起点。导入后,将生成所有配置,与手动输入模式相比,可以更准确地估计功率。ai Engine-ML (AIE-ML)可在通用ai Edge和一些ai Core系列设备中使用。计算块类似于Al Engine块,附加了对BFloat数据类型的支持。AIE-ML具有额外的共享内存块,用于改进性能和数据移动。一旦完成了Al Engine配置,您就可以观察到所涉及的电压轨的利用率(也给出了可用资源和已使用资源的数量)和功耗。还提供了PL和NoC接口的数量及其功耗。
    AI-Engine

  8. Hard Block评估:在通用ACAP中,可以使用各种加固IP或硬IP。其中大多数都需要与gt连接以实现1/O连接。可以在“Hard_Blocks”页签中配置硬ip。通过所有硬IP的向导可以方便地生成硬IP。PDM向导生成的gt (GTY、GTYP和GTM)具有硬块中使用的所需链路速度。在每个向导中都可以选择GT的类型和链路速度。PDM会根据gt的链路速率和硬IP实例使用的总带宽,自动计算出所需的gt个数。编辑和删除ip也是基于向导的,也就是说,不能在单个单元格上手动覆盖配置。选择Manage IP部分,在Summary选项卡中编辑IP配置。您需要选择要修改的IP类型和模块名称,并进行相应的更改。硬IP可能还需要额外的资源;因此,向导将它们填充到相应的选项卡中。如图所示为“创建硬IP向导”对话框。接口配置完成后,单击“确定”。您可以在“配置”页签中验证配置,“电源”页签列出了电源轨及其电压和瓦数。
    create HardIP

  9. 处理系统评估:处理系统的功率估计分为三个领域:低功率域、满功率域和平台管理控制器
    (1)低功率域
    低功耗领域包括实时处理器(R5)、紧耦合存储器(TCM)、片上存储器(OCM)和LPD互连。使用LPD Configuration窗格定义所使用的资源及其时钟频率和负载。定义后,最后一列列出了功率贡献。“低功耗域片上功耗”界面汇总了低功耗域的功耗信息。注意,您还应该定义MIO引脚。I/O接口是银行可配置的。每个bank的最大I/O接口引脚数为26。这里有一个MIO引脚定义表的示例。每个GPIO bank表的底部一行显示每个bank的可用GPIO数量。在GPIO配置之后,O表示该特定银行的所有I/O接口都已被使用。如果I/O接口超过Bank可用的I/O接口,则会发出DRC,您应该使用其他银行的gpio。
    (2)满功率域
    全功率域包括64位双核Arm®Cortex®-A72 APU内核、FPD互连和缓存相干互连。注意,使用a72时必须启用二级缓存。PDM自动完成这些工作,并为FPD添加电源。“全功率域片上功耗”界面汇总了全功率域的功耗信息。
    (3)平台管理控制器(PMC)
    PMC时钟频率是固定的,取决于设备速度等级。负载可在0-100%范围内配置。PS配置完成后,您可以查看Power选项卡,其中列出了电源导轨及其耗散。
    PowerStatus&Summary

最后,一旦配置了处理系统,Power选项卡将列出所有PS电压及其电压值和功耗。Summary页签提供了三个功率估计域的功率。

六、片上功率

我们现在已经研究了所有可用的资源和它们的功率特性。PDM工具总结了所有计算出的功率值。对于本模块中使用的示例,如果我们回到Summary选项卡并检查Summary表,我们可以看到我们消耗的电量超出了允许的范围。热功率余量为负。那么,我们能做什么呢?第一个选项是更改环境设置。我们定义了一个有效的θ结环境为1.25 C/W。如果我们能降低这个值,热功率余量就会提高。另一种选择是分析资源的功耗。检查摘要部分中的片上功率表。分析各资源,检查如何降低功耗。从功耗最高的资源开始。这是一个具有挑战性的过程,需要进行大量的讨论。
在这里插入图片描述

七、Versal ACAP的PDM中的电源设计选项卡

Versal ACAP的PDM中的电源设计选项卡允许您使用正确的顺序和公差设计完整,经过验证的电源交付解决方案。这个选项卡有四个主要部分:1. 设备概述2. 权力的总结3.电力轨道整合4. 电源设计;
当PDM完成功率估计后,可以将功率约束导出到PDM中。这些XDC约束用于指导具有指定功能和当前预算的Vivado或Vitis工具,并允许报告任何违规行为。导出的XDC文件包含以下信息:设备的过程结温环境温度设计功率预算供电电压和电流预算规定的电力轨道整合。

总结

1、Power Design manager:下一代功率估计工具,更稳定,更快,更准确,甚至可以处理最大的通用设备;
2、从XPE无缝迁移到PDM的通用ACAP设计;
3、现在可用于Windows和Linux。

猜你喜欢

转载自blog.csdn.net/qq_41403946/article/details/131588767