矩阵乘法

代码开源!用Versal FPGA加速矩阵乘法

该论文主要围绕着深度学习应用对密集矩阵乘法(Matrix Multiply, MM)的大量需求展开

加速AI算法中矩阵乘法的FPGA实现

随着大模型越来越火,算力成了绝对的稀缺资源,因此现在很多的研究方向都是如何降低AI算法中的运算

FPGA加速神经网络的矩阵乘法

本文描述了为实现深度学习神经网络推理应用程序中的矩阵乘法加速而设计的大型乘法脉动阵列的实现和评估。