Versal家族到底都有哪些兄弟姐妹

作者: Luke Liu,来源: Comtech FPGA微信公众号

Xilinx 自 1984年发明 FPGA以来,其可编程器件一共经历了三种形态:

  • FPGA最传统的可编程逻辑产品形态 (也就是大家熟悉的Virtex、Kintex、Artix、Spartan等系列产品), 可以通过RTL、C等语言进行设计,基于Vivado/ISE为主要设计工具的产品矩阵;
  • SoC (实际上赛灵思在FPGA架构中加入处理器的尝试可以上溯至带有PowerPC 硬核的 Virtex-4 系列产品), 大家比较常见的就是带有Cortex-A9系列的Zynq-7000系列和带有Cortex-A53系列的MPSoC系列;
  • ACAP: ACAP是 “自适应计算加速平台”(Adaptive ComputeAcceleration Platform) 的简称,实际上就是顺应异构芯片的时代大潮,新一代的基于FPGA的异构混合芯片啦;
  • 在之前SoC产品“处理器+可编程逻辑”的基础之上,ACAP就是处理器+可编程逻辑+ 智能引擎(DSP阵列/AI引擎(AI Engine)) 的三种模块组合:

    而Versal, 就是第一代ACAP的产品系列名(也就是说未来还会有更下一代的ACAP啦)。

    面向不同应用,Versal家族有AI Core, AI Edge , AI RF,Prime, Premium,HBM,六个系列、名字看起来是不是十分复杂?今天让我们来和您好好唠唠Versal系列这兄弟姐妹六系列!

    1. Versal 六兄妹都是谁?

    如下图所示,Versal系列产品主要面向两大类应用:左边三个系列主要面向端(Edge)侧的加速应用和AI相关应用等,右侧三个系列主要面向高带宽需求的应用、云端加速和数据中心等。

    这六个系列的关系,我们不多说,先上图:

    下面我们就以这两条主线来介绍这兄弟姐妹六系列。

    2. 先来说说面向端和AI应用的三姐妹

    大姐:AI CORE系列:

    AI CORE系列之所以是大姐,除了她是Versal系列第一代产品之外,基本上也是Versal系列最具代表性的产品, P/N 为 VCxxxx, 如 VC1902,VC2802等:
    A. 处理器部分(ScalarEngine)的双核A72+双核R5的配置;
    B. 基于7nm的高性能FPGA 可编程部分(Versal Adaptable Engines);
    C. 高性能的硬核AI Engine和DSP Engine;
    D. 用于连接片上各模组的新一代NoC(片上网络);
    E. 带有DMA的PCIe控制器(并且支持CCIX , CXL), VC2xxx系列还支持PCIe Gen5;
    F. 支持100G Eth,VC2xxx高配还包括视频解码器(VDE) 等其他高级功能;

    可以看到AI CORE系列基本包括了Versal 系列高度异构、NoC、高速接口等几乎全部新特性,如果您之前没有接触过Versal系列,即使使用其他系列产品,也可以通过AI CORE系列熟悉Versal系列旗舰,熟悉Vitis和其他一整套设计工具,来开始您基于Versal的设计哦!

    特别要说明的是,AICORE系列的AI Engine(AIE)在数字信号处理(DSP)和机器学习(ML)两种中进行了均衡设计,AIE对信号处理做了很强的优化,AI CORE 系列对5G通信的波束赋形(Beamforming), 毫米波雷达等的雷达信号处理,高性能计算等领域上都能大展身手!

    二姐:AI EDGE系列:

    面向机器学习的相关应用,将AI CORE系列中的AIE升级成为机器学习特别优化,每个AIE配备存储器翻倍至升级至64KB, 加强了INT8性能并增加了INT4和BFLOAT16,并增加了其他面向机器学习的性能,就是二姐AI EDGE系列产品啦。P/N 为 VExxxx, 如 VE1752,VE2602等:

    由于主要面向机器学习优化,端口部分配置为40G Eth, 其他端口特性和AI CORE系列基本类似。

    三妹:AI RF 系列:

    兄弟姐妹六人中最神秘的系列,至今可以估计的是Versal 系列和高速/高精度 ADC/DAC和 4G/5G无线通信加速模块的组合,值得期待 :)

    3. 再来说说面向高带宽、云端和数据中心应用的三兄弟!

    大哥:PRIME 系列

    针对连接性应用的需求,最先出世的是Versal PRIME系列,为了满足客户对高速应用的需求,相对AI CORE/EDGE系列,增加了58Gb/s的GTM(这样构建100G及以上设计需要布线的设计就更精简啦),而在智能引擎部分,只保留了在高速互联应用中重要的DSP Engine,这样一来,PRIME大哥虽然规模中等,但是互联能力十分强大,非常实用! P/N 为 VMxxxx, 如 VM1802, VM2202等:

    既然说到了高速互联,我们介绍下Versal系列中的NoC的实际效能:

    我们用一个5个AXI 到5个BRAM的设计做个例子:

    可以看到,基于Versal系列的片上网络(NoC)。相对于原16nmUS+系列需要用大量逻辑来完成这个功能(粉色), 基于NoC的Versal系列几乎不需要使用任何逻辑资源就可以使用NoC实现同等功能,值得推荐!

    二哥:PREMIUM系列

    对于更高需求的高速应用,这里要介绍的就是二哥,PREMIUM系列啦。

    我们直接和大姐AI CORE对比一下!

    可见PRIMIUM系列除了精简了AIE之外,新加入了全系PCIe Gen5, 112Gb的GTM高速收发器,600G Eth, 600GInterlaken, 还有400G加速引擎,十分强大! VPxxxx,如 VP1702, VP1802等:

    顺便悄悄说一句…想在高速互联中也使用高速信号处理和机器学习功能的AIE?除了现在就可以用大姐AI CORE系列进行设计之外,AMD赛灵思原厂也有“Versal® PremiumSeries with AI Engines”的产品企划哦!尤其面向无线和有线测量市场有特别优化,不久就可以看到它了呦!

    三弟:HBM 系列

    16nm产品中的HBM系列给大家留下了很深的印象,在超大带宽的低延迟数据读取,以及对PCB面积敏感的数据中心应用中都大显身手,Versal系列中当然也不例外啦!
    三弟HBM就是在二哥PREMIUM系列的所有特性上,提供了最大820GB/s带宽,32GB容量的HBM!P/N 为VHxxxx, 如 VH1742, VH1782等(xxxx42 代表16GB HBM,xxxx82代表32GHBM ):

    基于本来就非常强悍的高速互联硬件,和HBM的加持,当然是值得期待!

    4. 想了解和评估Versal,从哪里入手咧?

    总体说来,Versal大姐AI CORE系列产品基本包括了Versal系列的绝大部分新特性,是您了解和验证新一代7nm可编程逻辑器件的好入门。

    如果有任何技术问题,欢迎您联系科通各地的AMD赛灵思支持团队,或发邮件至:
    simonyang@comtech.com.cn
    charlesxu@comtech.com.cn

    最新文章

    最新文章