代码开源!用Versal FPGA加速矩阵乘法
judy 在 周二, 07/16/2024 - 09:32 提交该论文主要围绕着深度学习应用对密集矩阵乘法(Matrix Multiply, MM)的大量需求展开
该论文主要围绕着深度学习应用对密集矩阵乘法(Matrix Multiply, MM)的大量需求展开
随着大模型越来越火,算力成了绝对的稀缺资源,因此现在很多的研究方向都是如何降低AI算法中的运算
本文描述了为实现深度学习神经网络推理应用程序中的矩阵乘法加速而设计的大型乘法脉动阵列的实现和评估。