AI引擎

"AI引擎"通常指的是专门设计和优化用于人工智能(AI)工作负载的硬件或芯片。这些引擎旨在加速机器学习(ML)和深度学习(DL)任务,提高性能并降低功耗。 AI引擎在推动人工智能技术的发展和普及中起着关键作用,通过提供高效的硬件加速,使得处理大规模的深度学习任务变得更为可行。

YunSDR小课堂-AIE编程指南(第51讲)

AI引擎API为基于向量的矩阵乘法提供了一个aie::mmul类模板。多个中间矩阵相乘的结果被累加以给出最终结果。

YunSDR小课堂-AIE编程指南(第49讲)

对于非相邻AI引擎,可以使用与每个AI引擎相关联的存储器模块中的DMA来建立类似的通信。在每个存储器模块中使用乒乓缓冲器,并通过锁进行同步

YunSDR小课堂-AIE编程指南(第48讲)

AI引擎是一系列超长指令字处理器,具有单指令多数据向量单元,针对计算密集型应用进行了高度优化,特别是数字信号处理、5G无线应用和机器学习等AI技术。

AI 引擎编程:Kahn 处理网络的演进发展

本白皮书探讨了如何基于 Kahn 处理网络( KPN )定义 AI 引擎图形编程模型。KPN 模型有助于实现数据流并行化,进而提高系统的整体性能

AI 引擎机器学习内核与计算图编程指南

AMD Versal™ AI Core 系列和 Versal AI Edge 系列旨在凭借 AI 引擎机器学习 ( ML ) 架构来提供突破性的 AI 推断加速

Versal裸机使用AI Engine的完整流程

有很多文档都描述了AI Engine的架构和性能参数,但是看完这些后,现实中遇到的问题最多的是这个AI Engine到底怎么用

如何查找 AI 引擎 NoC 接口拼块的列位置?

本文涵盖了 AI 引擎 NoC 接口拼块的位置查找方法。

AI 引擎系列 11 - 使用 AIE API 对 FIR 滤波器进行代码矢量化

本文讲解如何使用 AIE API 进行 AI 引擎内核代码矢量化

AI 引擎系列 10 - 运行 AI 引擎的完整系统(第二部分)

在文中,我们将构建系统、分析生成的输出并在硬件仿真中使用 QEMU 运行系统。

AI 引擎系列 9 - 运行 AI 引擎的完整系统(第一部分)

本文将演示在这 3 个不同域上运行的完整系统示例