作者:Manuel Uhm,AMD 自适应与嵌入式计算事业部 Versal 产品营销总监
随着嵌入式 AI、视频和控制应用取得爆发式增长,在严格的占板面积和功耗限制下,对于借助异构处理能力加速端到端计算的需求与日俱增。多芯片处理解决方案在功耗、占板面积和复杂性等方面会带来巨大开销;而实际上,设计人员需要在单个器件上支持灵活、实时的预处理、高效 AI 推理以及高性能后处理。
我们高兴地宣布,AMD 正在扩展其 Versal 产品组合,以满足不断演进的需求。AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列自适应 SoC 为 AI 驱动和经典的嵌入式系统提供了单芯片智能性实现性能、功耗、占板面积、功能安全及信息安全性能的平衡。
为 AI 驱动型嵌入式系统实现端到端加速
第二代 Versal AI Edge 系列器件独特的异构处理器整合实现了端到端加速,以支持嵌入式计算的全部三个阶段:
1. 预处理:传感器处理、融合和数据调节
2. AI 推理:执行深度学习算法
3. 后处理:决策和后续举措
在预处理过程中,可编程逻辑所具备的出色性能和灵活性可支持建立自定义的传感器组合和低延迟处理流水线,从而有助于改进系统响应时间。
在下一阶段,第二代 Versal AI Edge 系列中采用的 AIE-ML v2 计算模块架构可助力 AI 引擎实现高效率的 AI 推理。与第一代 Versal AI Edge 器件的 AIE-ML 相比,AIE-ML v2 使用的 MX6 数据类型预计可使 TOPS(每秒万亿次运算)性能功耗比最高提升 3 倍①。
在后处理阶段,第二代 AI Edge 系列借助增强的集成 CPU 系统可轻松胜任复杂的决策和控制算法。与第一代产品相比,预计第二代 Versal AI Edge 系列和第二代 Versal Prime 系列的标量算力最高可提升 10 倍②。
借助第二代 AI Edge 系列中的多种器件,工程师能在自动驾驶、包含传感器融合的智能相机和医疗成像等应用中轻松实现性能和安全目标。
为经典嵌入式系统赋予更高水平的性能
第二代 Versal Prime 系列器件以更小的占用面积造就非凡性能,同时具备灵活、实时的传感器处理能力——借此轻松处理复杂的嵌入式计算工作负载。此类自适应 SoC 具有先进的可编程逻辑,其标量算力在第一代 Versal Prime 器件的基础上最高提升 10 倍②,为经典嵌入式系统(即不需要 AI 的系统)树立了全新的标杆。
凭借其自带支持高吞吐率视频处理的全新硬核 IP(它支持多通道 8K 全链路视频流的能力), 第二代 Versal Prime 系列器件可胜任超高清视频流直播和录制, 机器人技术及飞行计算机等应用。
40 年来坚持为市场提供出色的自适应解决方案和工具
选择 AMD Versal 自适应 SoC,意味着您能使用丰富多样的器件,并且选择了一个在面向高安全性、高可靠性、长生命周期和安全关键型应用的嵌入式系统领域深耕 40 年的合作伙伴,这无疑能为您带来极大的信心。
在此类嵌入式系统的设计过程中,生产力发挥着至关重要的作用,而我们的自适应 SoC 设计工具、库和嵌入式软件生态系统可有效提升生产力,简化设计周期。通过将这些资源与最新的 Versal 器件结合使用,设计师和系统架构师完全有信心设计、开发和扩展面向当前和未来的嵌入式系统。
第二代 AMD Versal 自适应 SoC 助力实现先进的 AI、控制和视频应用
随着 AI 驱动和经典的嵌入式系统对算力的要求不断提升,基于单个器件实现端到端加速已经势在必行。为满足并超越不断变化的需求,自适应解决方案必须在性能、功耗、占板面积、功能性保障和安全功能之间实现平衡。AMD 非常荣幸推出面向汽车、工业、视觉、医疗、广播以及专业音视频等众多市场的新一代解决方案。
请点击详细了解第二代 Versal AI Edge 系列和第二代 Versal Prime 系列器件。
① 基于使用 MX6 数据类型的第二代 Versal AI Edge 系列中 AIE-ML v2 计算块架构的 AMD 内部性能和功率预测,对比使用 INT 8 数据类型的第一代 Versal AI Edge 系列中 AIE-ML 计算块架构的性能规格和 AMD Power Design Manager 功率结果。假设:2 行、8 列子阵列。运行条件:1 GHz Fmax、0.7V AIE 工作电压、100C 结温、典型工艺、60% 矢量负载、% 激活 = 0 < 10%。实际性能在最终产品上市时将有所不同。截至 2024 年 3 月的性能预测。( VER-023 )。
② 基于对第二代 Versal™ AI Edge 系列和第二代 Versal Prime 系列处理系统的 DMIPs 合计总值的硅前估算,配置为 8 个 Arm® Cortex®-A78AE 应用核心 @2.2 GHz 和 10 个 Arm Cortex-R52 实时核心 @1.05 GHz,对比第一代 Versal AI Edge 系列和 Versal Prime 系列的 DMIPs 合计总值。第二代 Versal AI Edge 系列和第二代 Versal Prime 系列运行条件:最高可用速度等级、0.88V PS 工作电压、分离模式运行、最大支持运行频率。第一代 Versal AI Edge 系列和 Versal Prime 系列运行条件:最高可用速度等级、0.88V PS 工作电压、最大支持运行频率。实际 DMIPs 性能在最终产品上市时将有所不同。(VER-027)