YunSDR通信小课堂-Versal AI Core专题(第40讲)

概述

一.Versal Al核心系列

    通过集成的AI引擎实现突破性的AI推理和无线加速,提供出色的计算性能。

VersalAl.png

VersalAl图.png

产品组合的最高计算能力,可最大限度加速AI和工作负载。

二.主要特点

1. 处理系统

在通用自适应SoC中有三种标量处理机类型,以支持不同的应用需求。应用处理单元是操作系统支持的复杂应用的理想选择,实时处理单元是需要低延迟、确定性和实时控制的应用的理想选择。单独的平台管理控制器负责管理系统的启动、安全和调试。

2. 可编程逻辑

可编程逻辑使开发人员能够针对不断变化的算法开发自定义计算块。Versal自适应SoC中的重新架构逻辑在每个CLB中提供4倍的密度,减少了昂贵的全局路由的需求。可编程逻辑包含各种内存元件,并与可编程//0紧密耦合,允许用户为任何应用创建强大的加速器。

3. 人工智能引擎和DSP引擎

AI引擎为基于向量的算法提供高达5倍的计算密度。针对实时DSP和AI/ML计算进行了优化,AI引擎提供确定性的性能。

   增强型DSP引擎支持新的操作和数据类型,包括单精度和半精度浮点数以及复杂的18x18操作。

4. 下一代I/O

Versal Prime系列结合了PCle®Gen5/Gen4合规性、高性能GPI0、400G高速加密引擎*和多速率以太网MAC,支持各种以太网配置,以最大化连接性和灵活性。此外,VersalPrime系列设备具有重新设计的低延迟32.75Gb/s收发器,某些设备支持58 Gb/s和112 Gb/s*的PAM4收发器。

*只有VM2152设备支持400G HSC引擎和112 Gb/s PAM4收发器

5. 视频解码器单元

功率优化的强化视频解码器单元 (VDU) 包含多个视频解码器引擎 (VDE),支持H.264和H.265,每个引擎从单个4Kp60到最多32个 720p15。VDU非常适合许多图像处理应用,在这些应用中,多个视频输入为中央集线器提供解码和执行高级ML算法的功能。

6. 可编程片上网络

可编程片上网络在VersalACLOW架构中的不同计算引擎和集成IP块之间提供优化的多TB互连,从而简化时序收敛并节省逻辑资源。NOC编译器提供了精简的编程体验,同时允许用户管理延迟和QoS,确保关键数据路径的优先级。

三.应用与产业

5G 无线电和波束成形

波束成形需要实时处理大量信号处理需求。自适应引擎负责处理状态控制和数据格式化,而AI引擎和DSP引擎负责处理固定浮点信号处理工作负载,以实现高性能并行处理。

数据计算中心

随着卷积神经网络的不断发展,只有通过Versal AI Core系列设备才能应对不断增长的计算密度要求的挑战,这些设备具有经过优化的AI引擎,可以高效地提供计算密度,既经济又节能。

智慧城市的视频处理

Versal AI Core 系列设备支持在智慧城市边缘部署大量新型视频处理应用,其中AI引擎可驱动实时车牌、面部识别或对象分类,视频解码器单元可用于视频转码,而自适应引擎可用于视频缩放、压缩和定制。

医学图像处理

Versal AI Core系列加速并行波束成形和实时图像处理,以创建更高质量的图像和基于机器的图像分析,使医生和放射科医生能够更快,更准确地做出诊断。

雷达处理

将强大的基于矢量的DSP引擎与AI引擎融合在一起,实现先进的雷达,例如有源电子扫描阵列。AI Core系列器件在单个封装中提供每秒TB级的天线带宽。

无线测试设备

实时DSP广泛应用于无线通信测试设备。Versal AI Engine架构非常适合处理所有类型的协议实现,包括从数字前端到波束成形和基带的5G。

Versal自适应SoCs将标量引擎、自适应引擎和智能引擎与前沿内存和接口技术相结合,为任何应用程序提供强大的异构加速。其核心组件AI Engine采用高度并行的架构,能够高效处理大规模的AI推理任务,提供低延迟和高吞吐量的性能。AI Engine的可编程性使其适应各种AI应用需求,而集成的异构计算架构(包括FPGA、CPU和AI Engine)确保了在不同任务下的最佳计算性能。

 Versal AI Core平台中的AI Engine不仅是硬件加速的核心,它还为各种AI应用提供了灵活的解决方案。通过集成的高性能计算架构和智能调度,AI Engine使得现代AI任务变得更加高效、实时和智能。
 我们即将上线的专题将进一步深入介绍AI Engine架构、功能以及其优化策略。

文章来源:威视锐科技

最新文章

最新文章