FPGA实现Aurora 8B/10B接口(4)--官方例程学习(Streaming接口)

文章来源:FPGA技术联盟

1、IP核定制与官方例程的生成

   首先新建一个工程,这个工程什么除了生成Aurora 8B/10B IP核以外什么也不做。IP核的定制过程如下。

1.1、第一页配置:物理层以及链路层信息选择

1.png

物理层Physical Layer:

  • Lane Width:链路位宽,可选项2或者4,单位Bytes(这里我们为了将用户时钟降下来方便后续做时钟约束,选择4bytes)

  • Line Rate:线速率,范围0.5~6.25Gbps,这个根据项目需求来就行,选择3.125Gbps

  • GT Refclk:串行收发器GT的参考时钟,根据板卡实际情况来,我们这里选择125M

  • INIT clk:初始化时钟,在GT复位时,user_clk是停止工作的,推荐INIT CLK时钟频率低于GT参考时钟,直接选择默认50M

  • DRP clk:动态重配置时钟,该功能用的不多,直接按默认50M来就是的

链路层Link Layer:

  • Dataflow Mode:数据流模式,可选全双工/ 只接收/ 只发送,我们这里选择全双工模式

  • Interface:Framing/streaming可选。本文为streaming接口

  • Flow Control:流控,streaming接口模式下不可选

  • Back Channel:只有在单工模式才能选择(sidebands/timer 可选)

  • Scrambler/Descrambler :绕码/解绕,这里不选择

  • Little Endian Support :勾选小端模式,小段模式对应[31:0]这种书写习惯,大端模式对应的是[0:31]这种书写习惯

调试和控制----Debug And Control:

     提供了诸如ILA和VIO等调试IO核和其他一些状态指示位来对IP的运行状态进行监控,我们为了测试方便,这类调试接口暂时都不选取。

1.2、第二页配置:对应GT收发器的物理位置选择

      这里根据自己的FPGA芯片上的GT实际情况选择就行,我们仅为仿真测试就随便选取一条通道:

2.png

1.3、第三页配置:共享逻辑的位置

     例如时钟以及复位等逻辑,是在核内还是在例子工程内(大多数IP核Xilinx都会提供例程供参考)。推荐将共享逻辑设置在官方例程内,这样我们后续对IP核的使用就可以直接在官方例程的基础上进行一点小修改就行了。

3.png

1.4、官方例程Example Design的生成

    将IP核定制好并综合后,就可以生成官方例程Example Design了:

4.png

2、官方例程解析

   对官方例程的解析主要参考生成源码以及《PG046:Aurora 8B/10B v11.1 LogiCORE IP Product Guide》。通过上述资料,我们可以掌握IP核的使用方法和了解例程的大致组成。

2.1、官方例程的组成

     我们首先看下生成例程资源的逻辑层级排列:

5.png

    设计资源的层次这样看不是很明显,我们调出框图再来看看:

6.png

这样基本能看明白大概了:

  • support模块:核心,包含了对IP、GT等的例化处理等一系列操作;后续在我们的应用中此部分不需要修改

  • frame_gen:数据生成模块,采用LFSR的方式生成伪随机序列;后续在我们的应用中此部分可替换成我们的数据输入模块(建议加入FIFO,这样代码的复用性更佳)

  • frame_check:数据检验模块,对接受的数据进行检验以验证传输的正确性;后续在我们的应用中此部分可替换成我们的数据检查模块或者删除

  • LL_AXI:LL总线转AXI总线(据说该例程原本的接口是LL接口,后面Xilinx为了推广AXI总线,所以本例程直接在原来代码的基础上增加了总线转换模块)

  • AXI_LL:AXI总线转LL总线,原因同上

     仿真部分的内容根据层级就很容易理解--调用了两次例程。根据Xilinx一贯的尿性,很容易猜出来这又是要进行环回测试。实际上从手册中也可以窥见一二:

  • Testbench例化了两个例程 

  • 例程1生成数据后经Aurora发给了例程2的检测模块,并将结果反馈给Testbench

  • 例程2生成数据后经Aurora发给了例程1的检测模块,并将结果反馈给Testbench

7.png

2.2、Support模块(IP核例化核心模块)

     废话不多说,先来看下Support模块的组成: 

8.png


从组成就不难看出,Support模块最主要的功能是例化aurora IP核并将时钟、复位等信号统统一起打包。所以我们不需要对Support模块的内部构造进行详细了解,直接看看其对外接口就差不多可以拿来用了。Support模块下的子模块:

  • clock_module:时钟处理生成模块

  • support_reset_logic_i:复位逻辑生成模块

  • gt_common_support:与GT收发器相关的时钟生成其其他

  • Aurora IP核模块

2.3、数据生成模块(发送)

     完整代码如下:

9.png

10.png

11.png

2.3.1、端口

12.png

  • TX_DST_RDY_N:等同于s_axi_tx_tready,置位时表示此时IP核准备好发送数据了

  • TX_SRC_RDY_N:等同于s_axi_tx_tvalid,置位时表示此时用户准备通过IP核发送数据了

  • TX_D:等同于s_axi_tx_data,欲发送的数据

  • USER_CLK:用户时钟,用户对IP核的操作都需要在这个时钟下

  • RESET:复位信号,由support模块生成,可能是GT的硬复位,也可能是传输错误导致的软复位

  • CHANNEL_UP:置位表示此时对应的channel初始化完成,处于正常工作的状态

     再来看看图对比理解:

13.png

2.3.2、等待初始化

14.png

如果CHANNEL_UP还没有起来,那么channel_up_cnt将为全0,而dly_data_xfer为0,所以语句assign reset_c = RESET || !dly_data_xfer恒成立,reset_c恒为1,所以一直处于复位状态。

    当CHANNEL_UP起来后,channel_up_cnt需要一定的时间才能计数到5‘b11111,然后dly_data_xfer为1,所以此时assign reset_c = RESET || !dly_data_xfer等价于assign reset_c = RESET,即RESET控制reset_c信号。而RESET一般在CHANNEL_UP起来前就处于无效复位状态了,所以此时通道进入正常工作模式。

2.3.3、LFSR的使用

     这里就是用来生成伪随机数据序列,此时载入的种子为16'hABCD。

15.png

2.4、数据检查模块(接收与检查)

     既然数据有发那就有收,同时既然是例程,那么我收了你的货也得验验货不是(检查收发过程的正确性)?check模块的完整代码如下:

16.png

17.png

18.png

19.png

  代码继续拆分,走着!

2.4.1、端口与中间变量

20.png

  • RX_SRC_RDY_N:等同于m_axi_rx_tvalid,置位时表示总线上的数据为有效信号

  • RX_D:等同于m_axi_rx_tdata,从总线上接收的数据

  • USER_CLK:用户时钟,用户对IP核的操作都需要在这个时钟下

  • RESET:复位信号,由support模块生成,可能是GT的硬复位,也可能是传输错误导致的软复位

  • CHANNEL_UP:置位表示此时对应的channel初始化完成,处于正常工作的状态

  • ERR_COUNT:对接收过程中的错误进行计数

2.4.2、端口寄存与LFSR数据生成

21.png

 assign reset_c = RESET。复位信号直接链接到RESET这没什么好说的。

22.png

    这里将输入的数据及有效信号均寄存了一拍以便改善时许,实际上Xilinx大多数的例程中都是这样处理。

23.png

 这一段是在通道正常起来后生成与发送模块对应的LFSR数据,以便后续比对来验证通讯过程是否正确。

2.4.3、数据正确性验证

24.png

当接受到的收据与自身通过LFSR生成的数据不一致时,则拉高错误指示信号表示此时发生了传输错误,为了消除毛刺,还将此信号寄存了一拍。若错误指示信号为高,则将错误指示计数器+1。

3、仿真结果

    直接进行功能仿真直到自动停止,先看下整体框图:

25.png

  可以看到在50多us的时候,例化的两个模块的通道都已经建立了正常的连接(红框),然后一段时间后仿真结束。至于其他的话,各种时钟信号也都起来了,复位也都是正常的,所以仿真应该没啥问题。

     接下来我们看下第一个回环:第一个模块发送+第二个模块检查,只看下面两个模块(一发一收)的波形:

26.png

    信号太多,我们删去一些,只保留关键的时钟和发送的数据和检查的数据。


    发送端发送的数据,限于篇幅,只截取了前三个:d5e6d5e6----eaf3eaf3----f579f579。

27.png

 接收端接收到的数据,限于篇幅,只截取了前三个:d5e6d5e6----eaf3eaf3----f579f579。

28.png

  可以见到接收的数据与发送的数据一致,证明数据通道的第一个环回成功。第二个环回通道的配置--第二个模块发送+第一个模块检查,只看下面两个模块(一发一收)的波形:

29.png

  参考上面,直接看下发送端与接受端的数据:

30.JPG

可以看到,情况与上述一致,那就证明第二个环回也成功了。

4、其他

4.1、仿真速度

    vivado自带的simulator做仿真是真的挺慢的。而且Aurora这个IP核的仿真速度貌似还和选择的器件有关。一开始我直接按手里开发板的FPGA型号(A7)来生成官方例程,结果channel_up这个信号是一直拉不高,我等啊等,等啊等,差点给我人等崩溃了。

     最后发现仿真时间居然要1ms,如下:

31.png


  为了验证是否是器件仿真模型带来的影响,又分别选择一款K7器件和V7器件对IP核重新生成并仿真,其channel_up起来的时间分别如下。

     K7(50多us):

32.png

  V7(也是50多us):

33.png

所以,如果您仿真时间过长,建议先换个器件试试(有可能仿真模型差距真就这么大)。

4.2、线速率与用户时钟的关系

     用户时钟是IP核反馈给我们的时钟,我们对数据的操作都应该在此时钟域下。用户时钟*数据位宽/0.8 = 线速率。除以0.8是因为8B/10B的编码方式下存在20%的编码开销,而lane的数量则与线速率无关,因为实际上一条lane就是一条线,也就是说线速率其实就是lane速率。

   将我们在上面测试的数据代入,线速率3.125Gbps,数据位宽32位,算得用户数据应该为:3.125Gbps * 0.8 / 32 = 78.125MHz,也就是时钟周期应该是1/78.125 = 12.8ns。我们在仿真界面测一下,用户时钟的周期,结果如下:12.8ns,正与理论一致。

34.png

 可以看到Aurora 8B/10B IP核 还是比较容易上手。在官方例程的基础上,把发送和接受模块稍微修改一下,差不多就可以直接拿过来进行简单的使用了。

最新文章

最新文章