在移动处理器市场,AMD锐龙系列处理器凭借更高的性能功耗比、更出色的性能和更好的性价比,深受不少玩家的喜爱。特别是AMD今年推出的锐龙7040系列移动处理器,它集高能效、高性能和4nm先进工艺于一身,受到用户广泛青睐。实际上,锐龙7040系列移动处理器还有一个“大杀器”—Ryzen AI引擎。那么,AMD Ryzen AI引擎究竟是什么?它有什么独特之处呢?今天我们就来解读一下。
来自赛灵思的AI引擎:AMD为什么要集成AI引擎?
AMD在AI产业布局已久,在云端,无论是EPYC系列处理器,还是GPU系列产品,这些面向企业级用户的产品都得到了AI产业的广泛认可。而在消费级市场,虽然多年以来AI已经在手机等移动终端设备上应用的红红火火,但是在x86领域,AI应用方面的进展似乎并不太多。事情的转变发生在2020年,AMD在这一年宣布以大约500亿美元的价格收购当时FPGA行业的巨头赛灵思,也正是这次收购,为AMD在x86领域带来AI创新的能力和机会。
AMD收购赛灵思后,不但拥有了FPGA产业,还快速切入了AI赛道。
在完成收购赛灵思不久之后,AMD就成功地将赛灵思的AI模块集成到锐龙处理器中,也就是我们今天看到的锐龙7040系列移动处理器中的Ryzen AI引擎。这样的改变,其实和AMD对AI行业发展的思考有关。AMD董事会主席兼CEO苏姿丰博士就表示,AI是未来十年最重要的事情,可以提高生产力并带来更多的优势。AMD公司副总裁David McAfee也提到,AI将成为其未来处理器发展的重要组成部分。由于AI将极大地提高人们的工作效率和生产力,AMD希望其产品能涵盖从边缘AI到中间市场,再到云端AI的一切,这就意味着AMD要为所有市场的AI应用和AI客户提供对应的产品。David McAfee认为,未来无论你是游戏玩家、创作者还是两者兼而有之,AI都将在未来几年不断深入各种不同的负载,重塑或者改变这些行业现有的生态。
AMD将赛灵思的AI模块集成到锐龙处理器中。
David McAfee还带来了一些案例,比如游戏中用于更智能NPC的生成式AI,创作者利用AI来自动化工作流程并降低复杂的开发包的使用门槛,包括但不限于建模、Adobe套件和编程操作等,生成式AI的加入都将极大地改变整个工作流程。近日,微软宣布将全面拥抱AI,更为紧密地结合AI和操作系统,比如微软的Copilot(副驾驶)系统将带来操作系统使用上的变革。微软甚至还将AI视为和鼠标被发明一样等级的重要技术发明或技术进展。这虽然令人惊讶,但并不意外。
微软通过Copilot大幅度加强了AI在操作系统中的地位
看起来微软非常激进,不过这也说明随着时间的推移,人们才能持续看到AI如何影响所有人的工作流程。AI无疑具有极为惊人的潜能,将改变我们和数字空间交互的方式,并为每个人创造一种单独、定制化的个人数字助手,从而大大改变我们的使用体验。
正是因为AI如此的重要,AMD才下决心为自己的处理器加入AI相关的加速引擎,使得人们在执行相关任务时拥有更好的体验。笔记本平台拥有专用的AI引擎之后,将带来三个方面的优势。一是推理计算不再需要在云端完成后才给出结果,延迟更低,体验效果会更好。二是数据安全方面,数据不用上传至云端,而是在本地完成操作,因此数据泄露的风险更低。三是未来云资源将越来越昂贵,AMD认为本地资源将更为便宜好用,性价比更高。
AMD Ryzen AI引擎拥有三个独特的优势
AMD在锐龙7040系列处理器中集成Ryzen AI引擎后带来了诸多应用方面的优势
在集成Ryzen AI引擎之后,AMD锐龙系列移动处理器因此拥有诸多优势。首先是它是现有市场上唯一一个拥有专用AI引擎的x86处理器系列产品,这将很大程度上保证AMD处理器的竞争力。其次微软在即将到来的操作系统中将加入更多AI方面的应用,AMD锐龙系列移动处理器将获得先机。另外,AI引擎的使用将带来用户体验的持续提升,不断加入的各类AI应用将带给用户更多全新、独特的体验。
Ryzen AI如何运作?AMD统一AI栈 支持XDNA和CPU
由于AI已经成为AMD在处理器上的战略级功能,因此AMD也在不遗余力地推广AI相关的内容,并给出了Ryzen AI引擎的一些技术细节,我们一起来看看。
首先是AI相关的性能。AMD在代号为Phoenix的锐龙7040系列处理器中集成了Ryzen AI引擎。AMD宣称Ryzen AI引擎可以执行最多4个实时的AI工作流,由于采用专用的硬件模块,所以还能带来更好的效率。
AMD解释AI计算在专用单元上运行和传统CPU上运行的差异。
AMD进一步解释,Ryzen AI引擎处理AI相关任务是采用神经网络进行计算的,和传统计算在架构和模式上都存在巨大的差异。我们知道人工智能最初是由传统的硬编码算法创造,并由人类编程完成,而现代的人工智能大多基于神经网络,数据以不同的权重从一个神经元“流转”至另一个神经元,并通过机器学习进行训练,所以采用神经网络进行计算是更现代、更高效的选择。
目前AMD在Ryzen AI引擎中使用的硬件部分是赛灵思XDNA架构的AI加速模块,这个加速模块的特点在于,其整体采用Mesh架构完成,所有的结构单元都互联且采用非阻塞分布式架构,存储单元和计算单元紧密结合,因此拥有更大的带宽并且所需容量更低。从AMD给出的示意图来看,XDNA架构最大的特点是AI引擎的计算部分和存储部分是绑定在一起的,然后挂接到Mesh网络上。这种去中心化的设计避开了传统计算架构的存储瓶颈,使得神经网络计算能够以更高的效率运行。
AMD介绍了XDNA架构在计算模式上的优化
相比之下,AMD对比了传统的基于缓存的计算架构。数据通过DRAM、L2缓存、L1缓存后再进入不同计算模块的不同核心中,从宏观上来说,这是一个固定的、共享的互联架构,内存带宽和速率将成为整个计算的瓶颈,数据带宽和延迟将影响整个计算的效率。
AMD还介绍了XDNA架构在计算模式上的优化。由于神经网络需要一层一层的计算,整体路径和方向在计算中可能都是无序的,这就意味着计算架构也必须有相应的优化。XDNA架构在互联模型上采用了Mesh的全向互联架构,因此可以进行自适应配置,实现自适应互联,比如案例中L1、L2、L3、L4等针对的是神经网络的每一层计算,在自适应互联中就可以实现计算根据硬件情况的自适应化,从而实现更高的效率。
AMD介绍Ryzen AI引擎的基本架构和技术特性
在相关计算能力方面,AMD给出的数据显示,XDNA核心目前可以支持CNN、RNN和LSTM相关的模型,支持INT8、16、32和BF16格式的数据,支持细粒度时钟门控技术以实现更出色的能效控制,并支持4个并发流同时进行。AMD宣称Ryzen AI引擎的算力高达10TOPS。
在基本架构方面,AMD给出的示意图显示XDNA支持最多4个DDR内存控制器,并通过数据总线连接至DMA和NOC。XDNA的内部会被分成一个个区块,包括20个AIE区块和5个内存区块,所有的区块都挂接在Mesh总线上形成内部的共享、互联、非阻塞架构。
通过AMD Ryzen AI实时处理,视频人物背景被虚化。
AMD给出了在Windows 11中使用Ryzen AI引擎的相关案例。比如在Windows相机中,目前操作系统可以调用Ryzen AI引擎来识别前景、人物和背景,并进行背景虚化、自动取景和眼神交流。AMD只是给出了一个非常简单的案例,未来微软和更多其他应用还将会进一步调用AMD Ryzen AI引擎,尤其是微软在引入了Copilot之后。
AMD Ryzen AI引擎的软件堆栈情况
AMD还提到了有关AI平台软件方面的内容。刚发布时,AMD尚未完成有关XDNA架构在软件方面的全部支持工作,接口只支持CPU和有限的XDNA。不过AMD已经构建完成了从应用到硬件的全部层:从应用开始,分别是微软或者早期开发人员的一些应用服务,采用ONNX格式和TensorFlow模型,构建在AMD统一AI栈上,支持CPU和XDNA进行计算。2023年夏天,AMD通过临时版本增加了对运行在IPU上的新操作符的支持,并提供了对ONNX、PyTorch和TensorFlow模型的量化支持。AMD还承诺,作为在各个层面简化人工智能战略的一部分,2023年晚些时候,将发布更多的工具链、库和指南,以简化人工智能开发,从训练模型到在由Ryzen AI驱动的系统上对其进行本地部署。另外,AMD还计划增加对Generative AI模型的支持。
硬件支持:大部分AMD锐龙7040系列移动处理器具备Ryzen AI引擎
最后我们再来看看AMD Ryzen AI引擎的硬件支持情况。根据AMD的官方数据,目前大部分锐龙7040系列处理器都已经配备Ryzen AI引擎。具体说锐龙9 7940HS/H、锐龙7 7840HS/H、锐龙5 7640HS/H等6款处理器都支持Ryzen AI,而锐龙7040U系列只有锐龙7 7840U和锐龙5 7640U两款处理器支持Ryzen AI。另外,联想和AMD合作定制了一款锐龙7 7840S处理器,这款处理器的整体规格和锐龙7 7840HS/H相当,它也支持Ryzen AI。其他的锐龙5 7540U、锐龙5 7545U、锐龙3 7440U等处理器则不支持Ryzen AI引擎。
本文转载自:微型计算机杂志