在下周的2023年NAB Show活动之前,AMD发布了基于两个5纳米ASIC VPU(video processing units)的Alveo MA35D媒体加速卡。NAB Show将于4月15日至19日在内华达州拉斯维加斯举行。
AMD表示,Alveo MA35D支持AV1压缩标准,旨在满足大规模直播互动流媒体新时代的需求。
本文概述了基于ASIC的新型加速器旨在解决的问题,介绍了该设备的主要功能,并分享了AMD产品管理和营销总监Girish Malipeddi和AMD视频战略和开发主管Sean Gardner的想法。
向交互式直播视频流的转变
视频直播的性质正在发生变化,加速计算资源需要跟上这种变化。曾经的直播视频被广播流媒体所主导,即一种一对百万的模式。
一个传统的直播流媒体的例子是足球比赛,延迟为5秒。Gardner表示:“这种延迟可以利用现有的基于TCP的CDN网络分发。5秒听起来可能不多,但实时视频需要把延迟控制在16毫秒以内。”
当今和下一代直播视频流基础设施的问题是直播视频正在转向交互式模式。随着应用程序的多样化,如云游戏、观看派对、远程医疗和社交流媒体,一对百万的模式正在转向数百万到数百万的直播视频流媒体互动模式。
在这个新的交互模型中,Malipeddi表示延迟变得越来越重要。
“在这种新模式下,每个人都成为直播者,因为这些是交互式双向流媒体应用程序。”
这就要求从根本上改变处理视频流的方式。Malipeddi解释道:“为了解决这个问题,基础设施也需要调整。流量总体上急剧增加,因为每个人在某种意义上都变成了广播者。现在有更多的入口和出口流,在某些地方,网络和处理很快就会受限。”
基于ASIC的VPU媒体加速器
考虑到这些,AMD工程师开发了新的Alveo MA35D媒体加速卡。该加速卡基于两个5纳米ASIC的VPU,提供了高通道密度,每个卡支持高达32路1080p60转码密度。这是AMD Alveo U30媒体加速器通道密度的4倍。
Alveo MA35D上的ASIC基于5纳米工艺,是专用VPU。虽然该产品来自AMD业务的Xilinx FPGA,但还是在这里采用了ASIC方法。
交互式直播加速的一个重要方面是能够处理大规模视频流。Malipeddi说:“我们希望处理成百上千个通道的视频。”要实现这一目标,就意味着要最大限度地提高每台服务器的通道数量,同时将每个通道的功率和带宽最小化。
Alveo MA35D通过在每流 1 瓦功率的基础上保证每卡提供多达 32 路 1080p60 转码密度,Malipeddi表示,一个配备 8 张卡的 1U 机架式服务器可提供 256 个视频通道。
“我们不想把任何东西移到主机CPU上来降低速度。所以一切都需要在VPU ASIC上完成。”
AI VPU处理器和视频质量引擎
由于所有视频处理功能都在VPU上,可以最小化CPU和加速器之间的数据移动。Malipeddi表示,这减少了整体延迟,并将通道密度最大化至32路1080p60, 8路4Kp60或4路8Kp30。
该卡对主流H.264和H.265编解码器支持低延迟。其AV1转码器引擎提供高达52%的比特率,可以节省带宽与等效的软件实现。
该芯片上使用了专用的AI处理器,AI处理器与片上视频质量引擎VQ (QoE引擎)一起工作。正如Gardner解释的那样,AI处理器逐帧评估内容,并动态调整编码器设置,以提高视觉质量,同时最大限度降低比特率。
据该公司介绍,ASIC使用的优化技术包括用于文本和面部分辨率的感兴趣区域(ROI)编码,用于校正具有高水平运动和复杂性场景的伪影检测,以及用于预测比特率优化的内容感知编码。
AMD将在2023年NAB展N2158展位上演示Alevo MA35D。
原文链接: https://www.allaboutcircuits.com/news/amd-rolls-out-5-nm-asic-based-acce...
文章转载自: SSDFans