自 2017 年 AMD 发布第一代 EPYC(霄龙) 7000 系列数据中心处理器以来,得到广大用户青睐和业界好评。现在全新一代 Zen2 架构,代号 “ROME” 的 7nm 服务器处理器也即将发布。6 月 20 日,上海-龙之梦万丽酒店,AMD 联手赛灵思,西部数据共同举办了 “服务器技术研讨会”,向广大用户详细介绍了AMD EPYC处理器和解决方案。
作为AMD 服务器加速生态系统的重要合作伙伴之一,赛灵思展示了其灵活应变、万物智能的自适应解决方案为AMD服务器处理器带来的重大价值。
赛灵思技术报告:NVMe FPGA加速时间及转型存储解决方案
演讲人:唐杰,赛灵思数据中心架构师
报告摘要:
该主题报告针对数据中心领域数据存储从传统 SCSI 系统向新的架构进行转移的过程中所出现的挑战,以及面向这些挑战赛灵思所提供的加速解决方案进行了详细的介绍。
随着计算机从基于硬盘的传统SCSI系统转移到基于NVMe的闪存系统,系统设计面临的一个重要挑战就是如何能够提供低延时的数据传输。赛灵思提供了从NVMe HA,NVMe TC以及Embebded RDMA等一系列面向存储系统的IP,可以帮助客户构建低延时的高效数据通路,从而实现高效的FPGA的存储加速功能。
EPYC™ (霄龙)在单路和双路设计中均原生支持多达 32 个 NVMe 或 SATA 设备,从而大幅简化了软件定义和直连存储解决方案。
演示:世界上最快的数据中心加速卡 Alveo
在去年硅谷举行的赛灵思开发者大会( XDF) 上, 赛灵思CEO Vicrtor Peng 和AMD CTO Mark Papemaster共同展示了一项基于EPYC霄龙处理器的一项可谓吉尼斯世界纪录的AI人工智能识别成就:每秒识别30,000张图像。
当时,这项令全球设计者瞩目的技术演示搭载了两个 AMD EPYC 7551 服务器 CPU 和业界领先的 PCIe 连接,以及八片刚刚推出的赛灵思 Alveo U250 加速卡。推断性能由赛灵思 ML 套件提供支持,方便开发人员优化和部署加速推断,并支持 TensorFlow 等大量机器学习框架。基准测试在 GoogLeNet*,一种广泛使用的卷积神经网络上执行。
赛灵思CEO Victor Peng 和 AMD CTO Mark Papermaster 一起宣布,双方联手定制的基于AMD EPYC 7551处理器的工作站创造了每秒识别30,000张图像的一项吉尼斯纪录
此次带来的现场演示是Alveo的与AMD 共同实现的JPEG图片的解码/放缩/编码应用:该演示同样搭载AMD EPYC 7551 服务器 CPU 和业界领先的 PCIe 连接,以及赛灵思 Alveo U200 加速卡。JPEG图片的解码/放缩/编码的计算负载都移交到U200加速卡上,对于4K/2K的JPEG图片,吞吐率达到1.8GBPS,大幅领先于同价位的GPU。JPEG图片的解码/放缩/编码广泛用于网络图片传输、以图搜图和内容识别等领域。
赛灵思 Alveo™ 数据中心加速器卡专为满足现代数据中心变幻莫测的需求而设计。对于常规工作负载,与 CPU 相比性能提升高达 90 倍,这 其中包括机器学习推断、视频转码和数据库搜索与分析。
由于复杂算法的发展速度快于半导体设计周期,因此功能固定的 GPU 和 ASIC 器件已经无法跟上发展步伐。基于赛灵思 16nm UltraScale™ 架构,Alveo U200 和 U250 加速器卡可提供能适应连续算法优化的灵活应变的加速功能,在降低总拥有成本的同时,可以支持任何类型的工作负载。
演示:基于人工智能的车牌识别
赛灵思在现场还展示了自其全球分销合作伙伴安富利设计团队开发的基于人工智能的车牌识别方案,该方案支持自定义的深度学习网络,TensorFlow以及MMDNN架构,采用赛灵思人工智能平台 DNNDK 2.08 和DPU IP开发,可以非常方便地部署于智能交通和智能安防领域的端应用之中。
AMD EPYC 是为人工智能和高性能计算工作负载提速的理想 CPU 平台。EPYC 拥有 32 个内核、64 条线程、8 个存储器通道及每插槽最大 2TB 的存储器,以及 128 条信道,并结合业界首款硬件嵌入 x86 服务器安全解决方案,专为提供存储器容量、带宽和处理器核而设计,有助于高效运行常见于 AI 和 HPC 的存储器占用量较大的工作负载。借助于 EPYC,客户能以显著提高的速度采集和分析较大的数据集,帮助他们显著加快复杂问题的解决速度。
了解更多有关 Alveo 加速卡的详情及用户案例,敬请点击 https://china.xilinx.com/products/boards-and-kits/alveo.html 。