高速 AI 时代,FPGA 正在悄悄接管更多关键工作负载

作者:电子创新网编辑部

随着人工智能、高速无线通信、医疗与生命科学技术的发展,以及复杂芯片架构对数据流优化的需求不断攀升,FPGA 正在迎来新的应用场景。

FPGA(现场可编程门阵列)最大的特点,是芯片部署后仍能重新编程和配置数字逻辑。在 AI 世界中,算法更新速度远超芯片架构更新速度,这种灵活性成为关键优势。

此外,FPGA 的前期成本较低,常被用于 ASIC 等固定功能芯片的原型验证,或作为某项工作负载稳定之前的过渡方案。但受限于制造成本,相对更常见于低出货量、高性能的专业市场,如战斗机或实验室高精度测量设备。

然而,FPGA 市场正在扩大,新兴应用包括:

  • 云端服务器加速复杂算法,尤其适用于涉及 3D 数学运算的医学与科研场景;

  • 低成本虚拟硬件验证,用于混合原型系统;

  • 缓解 SoC 和 NoC 的内存与I/O 瓶颈

  • AI 数据管道管理与预处理

  • 5G/6G 基站与核心网设备

  • 横向产品差异化,自定义硬件功能

  • 应对安全协议变化,作为可重编程保险机制

高端 FPGA 的主要高量级用户包括通信(无线与有线)、数据中心、网络设备以及军工航天与政府部门。
Altera 业务管理负责人 Venkat Yadavalli 表示:“这些应用的年出货量从数千到数十万不等。随着 FPGA 集成特性的增强,如嵌入式 Arm 内核与 AI Tensor Block,FPGA 的适用范围在不断扩展至嵌入式与边缘 AI。”

1. 机器人、医学影像成为快速增长领域

机器人需要确定性时延与端侧实时决策,且大量融合来自摄像头与传感器的异构数据。Yadavalli 说:“语音、视频、传感融合……这些都非常适合 FPGA。”

医学影像的应用更为广泛,从眼科视网膜扫描到 MRI。AMD 自适应与嵌入式产品营销高级经理 Rob Bauer 表示:

“你首先采集大量模拟数据,必须进行滤波、处理、矩阵数学计算来重构图像。FPGA 做这些非常擅长。”

FPGA 内部的 AI 引擎也非常适合体积成像(volumetric imaging)。

2. FPGA vs ASIC:不是二选一,而是混合策略

在高速互联与 AI 加速成为常态的今天,选择 FPGA、ASIC 或其他 IC 并非简单二选一。

Arteris 产品管理副总裁 Andy Nightingale 说:

“设计者最终采用的是混合方案。互连架构允许 FPGA 和 SoC 混合使用,例如用于网络安全或缓解 I/O 瓶颈。有些模块即使 SoC 需要定制硬件,仍会保留 FPGA,因为协议和标准会变化。”

例如,若网络安全标准变动,可以直接重编 FPGA,而无需耗费数月重新设计 ASIC。这在快速演变行业中尤为重要。

但从逻辑单元成本看,FPGA 永远无法做到像 ASIC 那样极致优化。Yadavalli 指出:

“ASIC 或 ASSP 是为某单一固定功能做到极致优化,而 FPGA 需要保留通用可编程结构,因此必然牺牲面积与功耗。”

最终还是市场规模、算法稳定度与 ROI 的权衡。

3. 应用复杂度提升使 FPGA 更有价值

Bauer 表示:

“在物理世界的 AI 中,边缘侧传感数据吞吐提高、时延要求更低、安全需求更高,都是 FPGA 的典型强项。它就是一个持续优化的问题。”

4. AI 模型不断演变,FPGA 的价值随之波动

AI/ML 模型不断变化,FPGA 的可重编程性带来优势,但也使得“FPGA 还是 ASIC”成为动态问题。

Movellus CEO Mo Faisal 解释:

“当工作负载频繁变化时,你会倾向通用计算。当算法趋于稳定,你会定制化。这个循环会不断重复。”

例如大型科学实验(如 CERN 或 Fermilab)会部署上万颗 FPGA,但扩展至更多系统时可能成本和效率不足,必须重新评估架构。

ChipAgents 研究负责人张克勋认为:

“生命科学等领域模型结构仍未收敛,需要既足够快速又可定制的硬件。FPGA 在这些场景中会大放异彩。”

对于消费类市场,则更多依赖成本与效率。Baya Systems CCO Nandan Nayampally 指出:

“高频交易等场景算法变化快,FPGA 更适合。但如果缺乏足够体量支持 ASIC,那就会坚持 FPGA。”

FPGA 的优势在于可定制并行处理结构,可根据算法构建专用硬连逻辑,而不是像 GPU 那样使用通用核心。

5. 云端虚拟 FPGA:复杂算法与验证的新工具

基于云的 FPGA(如 AWS EC2 F1/F2 实例)可用于卸载数据中心的计算密集型工作负载。

Siemens EDA 的 Russell Klein 介绍:

“AWS 的 F2 实例包含一块带有八颗 Xilinx FPGA 的 PCIe 卡,客户可通过 PCIe 编程 FPGA。我们已经能让高层综合工具直接生成可部署到 F1/F2 实例上的加速模块。”

生命科学领域已大量使用 FPGA 加速 DNA 或化学反应分析等复杂 3D 数学运算。

同时,云端 FPGA 也成为低成本硬件验证的方式。
例如,SiFive 创业早期使用 AWS 租用 FPGA,每小时仅 6 美元,即可在虚拟 FPGA 上跑多核 RISC-V SoC 的操作系统。

Klein 称:

“这是低预算的‘自建模拟器’,且可以快速启停,非常适合复杂系统验证。”

AMD 的 Bauer 也指出,在 2nm 节点成本飞涨的时代,FPGA 让软件团队能在芯片流片之前就开展大规模验证,是推动 shift-left 的关键助力。

6. 减少 SoC/Chiplet 的数据瓶颈,提升 AI 系统效率

FPGA 也可被直接放入数据路径,用于减少内存或 I/O 瓶颈,提高数据移动效率。

Arteris 与 Altera 最新合作就是为此目的。
Nightingale 表示:

“FPGA 通过流式数据管理减少缓冲、提升吞吐,同时能在数据到达 CPU/GPU 前完成预处理,从而缓解 AI 系统的关键性能瓶颈。”

 * 本文为原创文章,转载需注明作者、出处及原文链接,否则,本网站将保留追究其法律责任的权利