AMD 与 Xilinx 在 2020 世界超算大会预演融合 ROCm 运行时技术

judy 在周三, 11/25/2020 - 09:35 提交

在上周举办的 2020 世界超算大会（SC20）上，赛灵思通过现场演示，展示了赛灵思 Alveo 加速器卡与 AMD ROCm™ 开放软件平台的集成。该技术预演基于 AMD 高性能计算技术领域的领先地位，特别运用了用户模式队列和共享虚拟存储器，在 Alveo 加速器上提供直接、低时延的工作分派。

Alveo 加速器用于在高性能计算应用中提供计算、联网和存储加速。赛灵思器件在加速基础设施和专用计算方面发挥着关键作用，与 GPU 和 CPU 配合工作，能支持世界上大多数要求最严苛的工作负载，例如机器学习推断、实时视频转码和数据库分析。

SC20 技术演示展示了 Alveo 加速卡如何通过支持 PCIe 地址转译服务（ATS）及用户空间队列与事件，来进一步增强功能。这些服务允许 Alveo 使用通用虚拟地址空间访问系统和 GPU 内存。运行时用来控制可见性，并安全地隔离每个用户的存储器访问，以高效的用户模式操作方法实现工作分派和同步。

这些新的硬件特性，让赛灵思 FPGA 能够深入广泛地与 AMD ROCm 开放软件平台集成，为 AMD Instinct™ GPU 加速器与赛灵思 Alveo 加速器在计算、联网和存储解决方案中的无缝集成奠定基础。

（独立的软件堆栈：AMD ROCm 和赛灵思 Vitis 软件）

（技术演示：CPU、GPU、FPGA 的融合运行时）

本次技术演示展示的内容：
◀ 使用 AMD ROCm 开放软件平台上的融合运行时，统一探索和预留 AMD 和赛灵思加速器；

◀ 使用与 AMD Instinct 加速器低时延工作分派相同的用户 – 空间队列，将工作分配给 Alveo 加速器；

◀ 在 GPU 和 FPGA 器件之间实现点对点同步；

◀ 以及使用共同的共享虚拟地址空间，访问 GPU、CPU 和 FPGA 器件上的存储器；

AMD 的 SC20 在线展台也播出了该联合技术演示的视频。

AMD CPU、GPU 与赛灵思 FPGA 结合所创造的机遇令人满怀欣喜。今天的演示，是迈向百亿亿次计算（Exascale computing，E级计算/艾级计算）普及化的实质性第一步。该解决方案分别运用了上述两种平台在高吞吐量浮点计算和优化网络方面的优势。

注：AMD、AMD 箭头标识、AMD Instinct、ROCm 以及组合均为超威半导体公司（Advanced Micro Devices, Inc.）的商标。

文章来源：Xilinx赛灵思官微

2020 世界超算大会

Alveo加速器卡

ROCm

本文讲述如何在根文件系统 (rootfs) 中添加自定义配方和层以及如何在其中包含多个程序包。

Vitis HLS 系列 2：Vivado IP 流程 (Vitis Unified)

这篇博客是在上一篇博客 Vitis HLS 系列 1 的基础上撰写的，但使用的是 Vitis Unified IDE，而不是之前传统版本的 Vitis HLS。

QDMA Subsystem for PCI Express v5.0 产品指南

AMD QDMA Subsystem for PCI Express（ PCIe® ）旨在利用多队列的概念实现高性能 DMA，以搭配 PCI Express® Integrated Block 一起使用

ZU+RFSoC之RFDC IP使用

RFDC这个IP，是RFSoC系列中ADC、DAC的核心。这个IP和PL的资源有互联通道，和ARM相对是独立的。

使用 Vitis 进行数据中心加速用户指南

本指南的目标是介绍关键概念，并提供一条途径以供您使用基于 FPGA 的 AMD Alveo 加速器卡、 AMD Vitis 编译器和统一集成设计环境来开始应用加速。

智多晶EthMAC IP介绍

EthMAC是西安智多晶微电子有限公司在2024年基于IEEE802.3-2008 协议clause 3章节开发的通信IP。

如何修改DisplayPort EDID

在最新的DisplayPort 1.4 RX Subsystem IP GUI界面, 有使能Video EDID的选项, 如下：

AIE PLIO 简介

AIE graph通过PLIO与PL(programable logic)连接, 以交换数据, PLIO既可以通过DMA S2MM或者MM2S连接到AI Engine的buffer