基于Xilinx的Kintex-7系列XC7K325T的硬件加速卡

基于Xilinx <wbr>Kintex-7的高性能计算(HPC)硬件加速卡
 


产品型号: B-PCIE-K7F5XILINX的Kintex-7系列FPGA处理器

  B-PCIE-K7F5是一款基于PCI Express总线架构的高性能FPGA算法加速卡,该板卡采用Xilinx的高性能28nm 7系列FPGA作为运算节点。Xilinx的28nm 7系列FPGA通过对资源、接口以及时钟的优化,在高性能计算(High Performance Computing)上表现出卓越的性能。Kintex-7系列FPGA具有优化的GTX高速收发器,最高支持12.5Gbps线速率,具有百万门级的逻辑资源,尤其适合于大规模逻辑运算。 
  B-PCIE-K7F5算法加速卡具有5片高性能FPGA处理节点,其中1片Kintex-7系列高容量高性能FPGA(具体型号为:XC7K420T-2FFG901I)作为主FPGA,其余4片Kintex-7系列低容量FPGA(具体型号为:XC7K325T-2FFG676I)作为从FPGA,主从处理节点之间全部采用高速串行通信进行数据交互。 
  主FPGA主要完成与各个处理节点之间的数据交换、对各个处理节点进行任务分配、资源调度、数据分发等。此外主FPGA还将完成高速串行接口GTX(SFP+万兆光纤接口)扩展、高性能PCIE DMA控制器等功能。 
  从FPGA主要完成主FPGA分解的算法模块,4个高容量运算节点进行并行运算,各个节点之间通过高速GTX串行接口进行数据交互。 
  板卡具有高带宽大容量动态缓存,其中各个处理节点均载有两组大容量DDR3 SDRAM缓存单元,用于完成处理复杂逻辑与算法时的数据缓存,适合于乒乓操作。其中每片FPGA的高性能BANK(HP)外挂4片4Gb 16位DDR3 SDRAM颗粒,通过Fly-by拓扑结构构成一组64位的DDR3缓存单元,最高可工作在800MHz时钟频率,其中数据速率可以达到1600M*64bps,DDR3 SDRAM效率可以达到90%以上。每片FPGA的宽范围BANK(HR)外挂2片4Gb 16位DDR3 SDRAM,可独立工作在高达400MHz的时钟频率下,其中数据速率可以达到800M*32bps。

硬件指标

  • 标准PCI Express全高全长卡,适合于普通服务器、工作站;
  • 符合PCI Express Gen2.0规范,x8模式,理论带宽高达4GByte/s;
  • 板载5片Kintex-7系列FPGA处理器: 主FPGA:1片Kintex-7系列 FPGA(XC7K420T-2FFG901I),可与XC7K355T-2FFG901I兼容。 从FPGA:4片Kintex-7系列FPGA(XC7K325T-2FFG676I),可与XC7K410T-2FFG676I、XC7K160T-2FFG676I兼容。
  • 每两个从处理节点之间都通过x4的高速串行总线进行互联(支持各种高速串行协议,如RapidIO、Aurora等)。
  • 主处理节点与从处理节点之间通过x4的高速串行总线进行互联(支持各种高速串行协议,如RapidIO、Aurora等);
  • 板载4路SFP+光纤通道,用于高速串行接口的扩展,最大支持10Gbps/lane线速率,理论传输带宽可达4Gbyte/s。光纤通道串行接口支持各种通信协议,例如RapidIO、Aurora64b/66b以及万兆网络等;
  • 每片FPGA均挂载2组DDR3 SDRAM内存,其中HR BANK挂2片4Gb DDR3颗粒,组成32位内存总线,可工作在400MHz时钟频率;HP BANK挂4片4Gb DDR3颗粒,组成64位内存总线,可工作在800MHz时钟频率;两组DDR3可进行乒乓操作。
  • 板载高精度有源晶振,温度稳定性高达±0.28ppm,老化率±1ppm;
  • 板卡具有1路外时钟输入;
  • 板卡具有2个独立的低偏斜、高精度全局时钟网络: 全局时钟网络1: 100MHz LVDS差分时钟网络,用于PCIE接口; 全局时钟网络2: 156.25MHz LVDS差分时钟网络,用于SRIO通信参考时钟;
  • 板载8位拨码开关,可通过拨码开关选择板卡的工作模式;
  • 具有调试指示灯;
  • 板载1片FRAM,用于存储少量参数信息;
  • 板载1片32MByte BPI Nor Flash,用于主FPGA的加载;
  • 板载4片SPI Flash用于从FPGA的加载。
  • 支持Chipscope在线调试加载;
  • 支持菊花链式JTAG调试接口;

功能特性

  • 从FPGA(XC7K325T)处理性能:
    1. FPGA采用Xilinx的Kintex-7系列(XC7K325T);
    2. 逻辑资源:50,950个Slices、326,080个逻辑单元;
    3. 存储器资源:最大4000Kb分布式RAM,445kb块RAM;
    4. 时钟资源:具有10个CMTs;
    5. IO资源:最大支持400个单端IO,最大支持192个差分IO;
    6. 具有1个PCIE Endpoint,支持gen2;
    7. 具有16个Gbits收发器,最大支持12.5Gbps。
  • 主FPGA(XC7K420T)处理性能:
    1. FPGA采用Xilinx的Kintex-7系列(XC7K420T);
    2. 逻辑资源:65,150个Slices、416,960个逻辑单元;
    3. 存储器资源:最大5938Kb分布式RAM,835kb块RAM;
    4. 时钟资源:具有8个CMTs;
    5. IO资源:最大支持300个单端IO,最大支持144个差分IO;
    6. 具有1个PCIE Endpoint,支持gen2;
    7. 具有32个低功耗GTX Transceivers,最大支持12.5Gbps。
  • 互联性能:
    1. 4个从FPGA: 两两之间通过x4 SRIO互联,支持SRIO gen2@5Gbps/lane,理论带宽可以到达20Gbps。 两两之间通过x16的IO相连,用于传输低速的控制与配置信号。
    2. 主FPGA与4个从FPGA: 通过x4 SRIO互联,支持SRIO gen2@5Gbps/lane,理论带宽可以到达20Gbps。 主FPGA与各个从FPGA之间有x4的IO相连,用于传输低速的控制信号。
  • 存储性能:
  1. FPGA的HP BANK: 每一个FPGA的HP BANK支持4Gb 64位 DDR3 SDRAM,可独立工作在800M的时钟频率下,数据速率为1600x64bit,运行效率高达90%;
  2. FPGA的HR BANK: 每一个FPGA的HR BANK支持4Gb 32位DDR3 SDRAM,可独立工作在400MHz时钟频率下,数据速率为800Mx32bit,运行效率高达90%;

接口特性

  • 标准PCIE全高全长卡;
  • 板卡具有4路SFP+光纤通道,LC接口,支持10G光模块;
  • PCIe金手指:x8 金手指,适用于x8、x16机箱;
  • 板卡具有1路外时钟输入,通过SMA连接器输入。

软件支持

  • FPGA软件支持:
    1. PCIE DMA链路控制;
    2. FPGA之间的SRIO通信;
    3. 板卡与板卡之间的10G光纤接口通信。
  • 其他软件支持:
  1. 定制算法与逻辑;
  2. 定制PC机驱动与演示程序。
  3. 支持win7 64位/32位操作系统,支持Linux操作系统。

应用场景

  • 高性能计算;
  • 服务器硬件加速;
  • 算法验证平台。

物理特征

物理与电气特征

扫描二维码关注公众号,回复: 2539693 查看本文章

板卡尺寸

106.65*352.19mm

板卡供电

2A max@12VDC(±5%)

散热方式

风冷散热

工作环境

工作温度

-40°~+85°C(工业级)

存储温度

-55°~+125°C

工作湿度

5%~95%,非凝结

可靠性指标

使用寿命

>10年

MTTR

<20分钟

MTBF

10,000,000小时

质量标准

 

优势(对比DINIGROUP公司的DNK7_F5PCIE

对比项目

DNK7_F5PCIE

B-PCIE-K7F5

结论

处理性能

5片K7系列FPGA,1片Virtex-6系列FPGA

5片Kintex-7系列FPGA
主FPGA:XC7K420T
从FPGA:XC7K325T
处理性能强大,更多的逻辑资源、更优化的LUT结构、更多的乘法资源、更多的GTX高速串行收发器

更优化的结构

逻辑资源

410K + 325K*4

420K + 325K*4

优于

高速串行收发器

主 FPGA:16个GTX 
从FPGA:8个GTX

主FPGA:32个GTX 
从FPGA:16个GTX

优于

互联方式

互联方式:46位并行总线
互联带宽:19.2Gbps
互联特点:占用大量IO,时序收敛困难

互联方式:串行SRIO x4 
互联带宽:20Gbps 
互联特点:串行总线,占用IO少,速度高

优于

接口类型

4个千兆以太网口

2个千兆网口+2个万兆光口

 

GTX扩展

4路高速万兆光纤,更易于与系统内其它板卡互联

优于

PCIE接口

支持PCIE gen1 x4,最高支持2.5Gbps线速率

支持PCIe gen2 x8,最高支持5Gbps线速率,总数据带宽:4GByte

等同

  B-PCIE-K7F5与DINI公司的DNK7_F5PCIE比较最大特色在于:
  (1)采用高容量高性能的420T FPGA,简化了PCIE设计,增加了GTX数量,使得系统互联更方便。省去了Virtex-6 FPGA作为PCIE桥片。
  (2)互联方式均采用RapidIO高速串行互联,简化了设计,提高了性能。

全文转自:

http://blog.sina.com.cn/s/blog_14ecc0afb0102wfx8.html

猜你喜欢

转载自blog.csdn.net/weixin_42229404/article/details/81367767