作者:张海军,来源:傅里叶的猫
Versal ACAP诞生的背景
随着数据量的爆炸性增长和计算需求的多样化,传统的“一刀切”式CPU已经难以满足所有应用的需求。虽然DSP和GPU解决了某些计算密集型任务,但它们在扩展性方面遇到了瓶颈,特别是在内存带宽的有效使用方面存在不足。尽管FPGA提供了一种可编程的内存层级,但传统的硬件开发流程限制了其在数据中心等大规模应用领域的广泛应用。
为了应对上述挑战,Xilinx推出了Versal ACAP,这是一个完全软件可编程的异构计算平台,它结合了标量引擎、可适应引擎和智能引擎。这些引擎能够协同工作,提供比当今最快的FPGA实施高出20倍,比最快的CPU实施高出100倍以上的性能改进。
Versal ACAP异构平台介绍
Versal ACAP的组成:
Versal ACAP集成了标量引擎(Scalar Engines)、可适应引擎(Adaptable Engines)和智能引擎(Intelligent Engines),并通过一个高带宽的网络on芯片(NoC)连接。
硬件优化:
标量引擎:基于Arm Dual-Core Cortex-A72,提供比前代产品更高的单线程性能和能效。 可适应引擎:由下一代可编程逻辑组成,支持为特定计算任务定制内存层次结构,以优化延迟和功耗。 智能引擎:包含VLIW和SIMD处理引擎,以及与数百Tb/s互连和内存带宽相连的内存,为机器学习和数字信号处理(DSP)应用提供显著的性能提升
在没有深入了解Versal ACAP系列之前,我一直以为Versal系列都是带有AI Core的,又总感觉这样适用场景会小很多,毕竟传统的FPGA应用场景中都不需要AI Core,后来看了Versal ACAPs白皮书后才知道并不是这样。
Versal有下面的几个系列:
在上面的几个系列中,Versal AI Edge主要用于边缘计算,Versal AI RF主要是无线通信,从这两个系列的名字也能很明显的体现出来。
其他的4个系列,Primary Markets中都有Data Center,Xilinx为数据中心场景精心设计了AI Engine、高速Serdes和HBM,虽然其他场景中也可能会用到这三个feature,但目前的AI 数据中心都离不开他们。
在白皮书中,Xilinx的Benchmark中,数据中心的测试也是最多的:
在上个月的Xilinx开发者大会上,他们也是在大力推广Versal ACAP,但据我目前的了解,市场接受度并不是很高。
一方面英伟达这几年凭借着AI数据中心的业务一度成为全球市值最高的上市公司,Xilinx在几年前也看到这块业务的巨大的价值,因此在这个方向投入了很大的精力;另一方面,Intel在收购Altera后,虽然Altera的市场份额越来越少,但在数据中心方向,Intel却是更早就布局了,现在国内外很多大厂的数据中心都有Altera的FPGA。
目前随着国产FPGA的崛起,以及我们政府鼓励用国产器件的助推,在国内的中低端市场,Xilinx可谓是四面楚歌,即便现在依旧是FPGA市场的老大。