概述
一.Versal Al核心系列
通过集成的AI引擎实现突破性的AI推理和无线加速,提供出色的计算性能。
产品组合的最高计算能力,可最大限度加速AI和工作负载。
二.主要特点
1. 处理系统
在通用自适应SoC中有三种标量处理机类型,以支持不同的应用需求。应用处理单元是操作系统支持的复杂应用的理想选择,实时处理单元是需要低延迟、确定性和实时控制的应用的理想选择。单独的平台管理控制器负责管理系统的启动、安全和调试。
2. 可编程逻辑
可编程逻辑使开发人员能够针对不断变化的算法开发自定义计算块。Versal自适应SoC中的重新架构逻辑在每个CLB中提供4倍的密度,减少了昂贵的全局路由的需求。可编程逻辑包含各种内存元件,并与可编程//0紧密耦合,允许用户为任何应用创建强大的加速器。
3. 人工智能引擎和DSP引擎
AI引擎为基于向量的算法提供高达5倍的计算密度。针对实时DSP和AI/ML计算进行了优化,AI引擎提供确定性的性能。
增强型DSP引擎支持新的操作和数据类型,包括单精度和半精度浮点数以及复杂的18x18操作。
4. 下一代I/O
Versal Prime系列结合了PCle®Gen5/Gen4合规性、高性能GPI0、400G高速加密引擎*和多速率以太网MAC,支持各种以太网配置,以最大化连接性和灵活性。此外,VersalPrime系列设备具有重新设计的低延迟32.75Gb/s收发器,某些设备支持58 Gb/s和112 Gb/s*的PAM4收发器。
*只有VM2152设备支持400G HSC引擎和112 Gb/s PAM4收发器
5. 视频解码器单元
功率优化的强化视频解码器单元 (VDU) 包含多个视频解码器引擎 (VDE),支持H.264和H.265,每个引擎从单个4Kp60到最多32个 720p15。VDU非常适合许多图像处理应用,在这些应用中,多个视频输入为中央集线器提供解码和执行高级ML算法的功能。
6. 可编程片上网络
可编程片上网络在VersalACLOW架构中的不同计算引擎和集成IP块之间提供优化的多TB互连,从而简化时序收敛并节省逻辑资源。NOC编译器提供了精简的编程体验,同时允许用户管理延迟和QoS,确保关键数据路径的优先级。
三.应用与产业
5G 无线电和波束成形
波束成形需要实时处理大量信号处理需求。自适应引擎负责处理状态控制和数据格式化,而AI引擎和DSP引擎负责处理固定浮点信号处理工作负载,以实现高性能并行处理。
数据计算中心
随着卷积神经网络的不断发展,只有通过Versal AI Core系列设备才能应对不断增长的计算密度要求的挑战,这些设备具有经过优化的AI引擎,可以高效地提供计算密度,既经济又节能。
智慧城市的视频处理
Versal AI Core 系列设备支持在智慧城市边缘部署大量新型视频处理应用,其中AI引擎可驱动实时车牌、面部识别或对象分类,视频解码器单元可用于视频转码,而自适应引擎可用于视频缩放、压缩和定制。
医学图像处理
Versal AI Core系列加速并行波束成形和实时图像处理,以创建更高质量的图像和基于机器的图像分析,使医生和放射科医生能够更快,更准确地做出诊断。
雷达处理
将强大的基于矢量的DSP引擎与AI引擎融合在一起,实现先进的雷达,例如有源电子扫描阵列。AI Core系列器件在单个封装中提供每秒TB级的天线带宽。
无线测试设备
实时DSP广泛应用于无线通信测试设备。Versal AI Engine架构非常适合处理所有类型的协议实现,包括从数字前端到波束成形和基带的5G。
文章来源:威视锐科技