手撕IP核系列——Xilinx FIR IP核之一

judy 在周三, 08/24/2022 - 11:04 提交

注：本文由作者授权转发，如需转载请联系作者本人

前言
在Xilinx和Intel平台的FPGA中提供了给我们各种各样的IP核，这些IP核都是厂家的成熟设计，使用起来也非常的方便。但因为我们的项目经常存在跨平台的问题，两家的IP核从参数、时序到风格都有一些区别，越复杂的IP核越难以移植，特别是如果两家的IP核输入输出的时序不一致的话会导致设计需要改动很大。因此有必要对IP核进行RTL描述，
1、通过自己的代码写出了IP核的功能，对IP核的实现进行了深入的理解。
2、使用纯RTL对于跨平台非常方便，由于全部都是verilog代码，跨平台移植那是分分钟的事情

但既然都能够手写了，那我们为什么还要用IP核呢。

IP核的使用对于FPGA资源和时序都会有一定优化，有些资源的使用无法简单通过RTL语言直接描述出来的。

因此在跨平台移植代码的时候，遇到比较复杂的算法模块，如果没有碰到较复杂的IP核，最好全部先进行RTL实现，后续有需要可以重新转化为另一个平台的IP核。这样就保证了功能的正确

FIR 滤波器模块的设置
FIR 滤波器模块的不同设置会导致时序出现不同，因此，我们要记录下我们要手写的FIR ip核的具体信息，必须完全一样。

我们需要手写以下IP核，其配置要点如下：
1系数：256个，非对称，位宽16bit，signed模式
2输入：位宽16bit，signed模式
3输出：全精度35bit，实际输出是40bit
4特点：时钟/采样率 = 32/1

详细配置图如下：
配置卡片1

配置卡片2

配置卡片3

配置卡片4

配置卡片5

配置总结

IP核的接口：

实现分析
因为是非对称的，所以不能通过折叠来节省一半乘法器
FIR系数为256个，实现一次FIR计算，需要256次乘法加法, 但时钟/采样率 = 32/1，因此我们可以复用乘法器。只需要256/32 = 8 个乘法器即可

实现框图：

总体模块中包括8个分段累加模块，这是分段累加模块的实现细节框图：

总体模块:

注意要点：
1、该框架可以实现FIR(卷积)或者相关，区别在于抽头是否翻转
2、为了和IP核的时序保持一致，尽量在乘法器打足够的拍，以便将来使用IP核替换的时候有余量

功能仿真对比

通过仿真，IP核和手写的RTL代码输入数据的时序和数据是一致的，IP核和手写的RTL代码输出数据的时序和数据也是一致的。表明，手写的RTL代码可以完全的替代IP核的功能

最后说明：

资源备份：百度网盘-Xilinx设计-手写FIR_COE256
对应的matlab程序可以参照XXX_detect_XXX_FPGA.m文件的相关部分
执行srcs中tb_xxx_top_and_xxx_source.tcl 文件即可直接仿真

FIR
IP核

精彩推荐

AI说它能写芯片，验证工程师笑了

芯片行业这几年被AI带动得很热，一个反复出现的说法是：未来可以从规格直接生成硬件，甚至不需要懂RTL、不需要懂架构，只要描述需求，AI就能完成设计。

Tandem PCIe 在 UltraScale+ Windows 驱动适配问题分析

在实际项目中， Windows 驱动适配过程中需要注意一个兼容性问题。本文对该问题进行简要分析，并给出解决建议，供相关开发人员参考。

3DIC EDA之二 | 基于芯粒的存储架构演进

存储芯粒从传统2D DRAM瓶颈出发，经3D堆叠（HBM/HMC）提升带宽，演进至近存/存内计算架构，将算力移至数据旁以突破“存储墙”不断突破实现高能效处理。

Versal Gen2连载第五篇--KPL3858 PS 10GbE/1GbE及PL ETH介绍和测试

开普勒KPL3858评估板搭载AMD Versal AI Edge Series Gen 2器件（2VE3858），板上共有四个以太网接口，本篇逐一介绍这四个接口的硬件架构和测试方法。

芯片设计的“翻译官”与“优化师”：揭秘逻辑综合

在我们谈论智能手机、人工智能芯片等现代科技奇迹时，其核心都是一块指甲盖大小的芯片。这块芯片上布满了数十亿甚至上百亿个晶体管

从PetaLinux到EDF迁移开发指南

AMD嵌入式开发框架(EDF)是一个完整的开源环境，旨在帮助嵌入式工程师基于AMD自适应SoC高效评估、开发和部署应用。

在 Versal Gen2上通过 JTAG 启动 EDF镜像并刷写 UFS 的流程

本文基于 EDF 2025.11 版本进行测试，记录了在 VEK385 开发板上，如何：通过 JTAG 模式启动 EDF 镜像；使用 TFTP 引导 Linux 内核与 rootfs；

在 ZCU102 上使用 PS AXI性能监视器（APM）测量 PS内部的DDR 带宽

本文提出了一种基于 PS的AXI 性能监视器（APM）在 ZCU102 开发板上实现的硬件级 PS内部DDR 带宽监控解决方案。