Xilinx原语详解及仿真——ISERDESE2

judy 在周五, 12/13/2024 - 10:14 提交

前面在讲解HDMI接口之前，讲解过IDDR、ODDR、OSERDESE2、IBUF等原语，之后一直有读者在问什么时候更新ISERDESE2这个原语。前文讲解过这些原语都在HDMI或者RGMII中使用过，但是ISERDESE2这个原语目前我的板子除了HDMI输入，其余并不会使用到，所以当时就没有出。

最近在网上看并没有用户对ISERDESE2的使用讲解的很清晰，所以本文就通过手册、仿真和ILA去讲解一下这个原语的使用方式，希望对大家的使用有所帮助。

1. ISERDESE2的功能

ISERDESE2就是一个串并转换的模块，支持单沿或者双沿传输数据，其实ISERDESE2和IDDR使用的是同一个器件，所以均有双沿转单沿的功能，这可以在vivado综合后的布局布线中查看，也是同一管脚输入的信号不能同时使用IDDR和ISERDESE2的原因。

理想情况如下图所示，并行输出的数据就刚好被ISERDESE2采集，进而完成串并转换，然而真实情况是这样吗？

图1 理想情况串并转换.JPG

由于器件上电和初始化等等原因，实际的情况更可能如下图所示，并串转换模块工作时，串并转换模块还没有工作，导致并串转换模块输出的前几个数据丢失，下图中前面黑框中三个串行数据丢失。

此时串并转换模块就只能从后面黄色框中依次取八个数据进行转换，由此转换出的数据会是正常的数据？

显然不是，因此在串并转换模块正常工作的初期，往往需要对转换后的数据进行判断，如果转换后的数据不对，则需要将ISERDESE2转换的起始位置更改，直到转换后的数据正确为止，之后数据的数据才是有效的。

这个校准的过程需要用户通过ISERDESE2的BITSLIP引脚去完成，在校准的过程中，输入端必须一直循环输入一个校准序列，就像下图中一直输入8’h5c和8’h82组成的序列一样，这是相对于其他原语会难一点的地方。

图2 真实情况串并转换.JPG

通过上面知道了ISERDESE2原语需要解决的问题后，下面就通过手册讲解原语的各个端口以及参数，后面通过仿真验证前面所说的原因。

2. ISERDESE2原语端口及参数

2.1 ISERDESE2端口信号

下图是ISERDESE2的框图。

图3 ISERDESE2框图.JPG

Q1~Q8：ISERDESE2模块的并行输出数据，其中Q8是最先输入的串行数据位。一个ISERDESE2块最多输出8位并行数据，在DDR双沿采样模式下，两个ISERDESE2块级联可以输出10位和14位并行数据。

Q8是接收到的最低位数据，如下图所示，OSERDESE2将8位从高到低为HGFEDCBA的并行数据转换为串行数据输出，最先输出最低位D1的值A。当ISERDESE2块接收串行数据时，Q1出现最高位，Q8出现最低位。

图4 ISERDESE2接收数据.JPG

端口O：由图3知，该端口直接连接到串行输入的几个端口，并没有经过ISERDESE2核心逻辑，可以把D或DDLY的数据直接输出。

SHIFTIN1、SHIFTIN2、SHIFTOUT1和SHIFTOUT2与OSERDESE2中该信号的原理一致，都是在两个OSERDESE2级联的时候，把从OSERDESE2的SHIFTOUT与主OSERDESE2的SHIFTIN连接。

ISERDESE2的输入可以来自FPGA的管脚，即D端输入信号。也可以来自IDELAYE2的输出，即DDLY端口作为输入。还可以来自OSERDESE2的输出，即OFB作为输入，与OSERDESE2连接方式如下所示，两个器件的OFB信号相连即可。

图5 ISERDESE2与OSERDESE2连接.JPG

ISERDESE2与OSERDESE2连接时需要添加“OFB_USED = TRUE ”属性，并且ISERDESE2和OSERDESE2的DATA_RATE、DATA_WIDTH参数必须设置一致。

高速时钟输入CLK，与串行数据流对齐。

辅助时钟输入CLKB，在MEMORY_QDR模式下，CLKB应连接到唯一的相移时钟，其余模式下，CLKB连接到CLK取反信号。

分频时钟CLKDIV，用于驱动串并转换器、Bitslip子模块和CE模块的输出，与输出的并行数据对齐。

在SDR模式下，如果输出的X位并行数据，那么CLKDIV的频率是CLK频率的1/X，如果是DDR模式，则CLKDIV的频率是CLK频率的2/X。

手册要求CLK和CLKDIV的相位必须对齐，一般推荐两种连接方式，一种如下所示，时钟输入管脚通过BUFIO之后直接作为串行输入数据的时钟信号，BUFIO优点就是路径短，延时小，缺点就是只能驱动当前时钟区域的IDDR和ISERDESE2的时钟管脚。而并行时钟需要通过BUFR进行分频，分频系数根据并行数据位宽和工作模式确定。

关于BUFIO和BUFR的相关使用，可以查看前文关于时钟资源相关原语的讲解，清晰讲解过BUFG、BUFIO、BUFR、BUFH、BUFMR的使用。

图6 时钟推荐.JPG

另一种就是通过同一个MMCM产生CLK和CLKDIV两路时钟信号，这种方式更常用。原因是BUFIO和BUFR需要用户提供高频串行时钟，如果需要几百M的串行时钟，显然用户的外部晶振一般是无法提供的。

时钟使能CE1和CE2，与参数NUM_CE的值有关。当NUM_CE为1时，使用CE1作为时钟使能信号。当NUM_CE为2时，当CLK_DIV为低电平时，CE2作为时钟使能信号，当CLK_DIV为高电平时，CE1作为时钟使能信号，对应真值表如下图所示。图片

图7 输入时钟使能模块.JPG

BITSLIP引脚在高电平时执行与CLKDIV同步的移位操作，后文详解。

RST复位信号，高电平有效，推荐退出复位时间与CLKDIV同步。

过采样模式时钟OCLK，仅当INTERFACE_TYPE设置不为NETWORKING，才会使用OCLK时钟。

2.2 ISERDESE2原语参数

上述就是ISERDESE2原语相关的端口信号，下面讲解ISERDESE2原语的参数。

DATA_RATE用于设置ISERDESE2工作模式，可选择单沿工作模式（SDR）和双沿工作模式（DDR），默认DDR模式。

DATA_WIDTH用于设置输出并行数据位宽，取决于DATA_RATE和INTERFACE_TYPE的设置。如下图所示，SDR模式下可以设置为2、3、4、5、6、7、8。DDR模式下单个ISERDESE2块只能设置为4、6、8，两个ISERDESE2块级联可以设置为10、14。

图8 支持的数据宽度.JPG

INTERFACE_TYPE参数决定ISERDESE2是配置为内存模式还是网络模式。可选的值有MEMORY、MEMORY_DDR3、MEMORY_QDR、OVERSAMPLE、NETWORKING，默认模式是MEMORY，常用NETWORKING模式。

NUM_CE参数定义使用的时钟使能（CE1和CE2）数量，可设为1和2（默认值为2）。

OFB_USED参数使能从OSERDESE2的OFB引脚到ISERDESE2 OFB引脚的路径，禁用外部管脚输入D和IDELAYE2的输入DLY。

当使用DDR模式进行10位或者14位并行数据转换时，需要将两个模块级联，此时需要通过参数SERDES_MODE确定哪个是主ISERDESE2，哪个是从ISERDESE2。

INIT_Qn用于设置第n个采样寄存器的初始值，而SRVAL_Qn用于设置复位第n个采样寄存器后的值。

由图3知D和DDLY都是ISERDESE2的专用输入，D直接连接到IOB（直接与管脚相连），DDLY直接连接到IDELAYE2（在ISERDESE2和管脚之间有IDELAYE2加入延迟）。

允许用户把延迟或非延迟的外部管脚输入信号作为ISERDESE2输入，通过参数IOBDELAY确定D和DDLY哪个作为ISERDESE2的输入，下图是IOBDELAY参数与输入信号的关系，经常设置位NONE，将外部管脚信号作为ISERDESE2串行数据输入。

图9 IOBDELAY参数值.JPG

3. 位滑块（BITSLIP）

这个信号就是进行校准的关键信号，如果没有这个信号，那么ISERDESE2的输出数据其实没有意义，很大可能是错误的。

通过拉高ISERDESE2模块的Bitslip信号，输入的串行数据流在并行端重新排序，Bitslip与CLKDIV同步。

下图说明了SDR和DDR模式下位滑移操作对数据采样的影响，ISERDESE2的数据宽度是八。在SDR模式下，每次Bitslip拉高都会导致输出数据左移一位。在DDR模式下，每次Bitslip拉高都会导致输出数据在右移1位和左移3位之间交替变化。

图10 位滑移操作示例.JPG

上述操作其实可以看成下图所示的操作，上电后因为初始化结束比较晚等原因，ISERDESE2错过了下图黑框中前三位数据的采集时刻，从红框处开始取数据进行转换。

图11 采集数据.JPG

转换结果为8’he4，并不是8’h5c或者8’h82，此时将Bitslip拉高一个CLKDIV时钟周期，则ISERDESE2会将下次采集数据的位置向后移动一位，如下图所示。

本来第二次转换应该从下图中天蓝色方框开始，因为Bitslip拉高一个时钟，就会将开始位置向后移动一位，从红框处开始转换，转换结果继续与目标结果对比，如果不是，则继续拉高Bitslip，直到ISERDESE2的输出是8’h5c或者8’h82为止。

图12 采集数据.JPG

其实用户并不需要关心Bitslip为高电平后，SDR和DDR模式下，输出数据怎么移动，只需要在这段校准的时间内保证输入串行数据一直都是8’h5c或者8’h82即可，然后去检测ISERDESE2的输出是不是8’h5c或者8’h82，不是则拉高Bitslip将转换开始的位置移动，直到找到开始转换的位置为止。

只有当ISERDESE2处于网络模式（NETWORKING）下，位滑块（BITSLIP）才可用。Bitslip每次只能拉高一个CLKDIV周期，不能在两个CLKDIV周期内连续拉高Bitslip信号。

在SDR和DDR模式下，从ISERDESE2检测到Bitslip的高电平开始，到ISERDESE2把Bitslip移动后的数据输出到Q1–Q8引脚为止，延迟时间为两个CLKDIV周期。

在分析接收到的数据模式并可能发出下一个Bitslip命令之前，用户逻辑应在SDR模式下等待至少两个CLKDIV周期，在DDR模式下等待至少三个CLKDIV周期。

综上Bitslip拉高后，需要等待至少三个时钟周期，才能检测并行输出结果是否与预期一致，进而确定是否通过拉高Bitslip信号继续调整输出。

下图是4位并行数据的DDR模式下Bitslip的时序图，数据（D）重复的4位串行数据ABCD。ABCD可能以四种方式出现在ISERDESE2的Q1–Q4并行输出端：ABCD、BCDA、CDAB和DABC，只有ABCD才是正确的输出。

拉高Bitslip信号选择所需的对齐方式（ABCD），下图显示了Bitslip的时序以及ISERDESE2并行输出Q1–Q4的校准时序。

图13 DDR Bitslip功能图.JPG

注意上图在Bitslip拉高后的第三个时钟，Q4-Q1才输出移位后的转换结果，与前文的延时一致。

4. 代码设计

本文利用OSERDESE2和ISERDESE2回环，来验证前文所讲ISERDESE2和Bitslip的功能。ISERDESE2采用网络模式（NETWORKING），选择DDR的串行采样方式，并行数据位宽为8位。

OSERDESE2相关模块如下图所示，用于产生测试的并行数据，然后转换为串行数据，对应代码如下所示。

通过一个计数器cnt，上电后前64个时钟周期用于产生用于校准的序列，为8’h5c和8’h82交替发送的串行序列。当校准序列发送完毕后，通过m序列生成伪随机数据用于测试。

//--###############################################################################################

//--#

//--# File Name : oserdese2_ctrl

//--# Designer : 数字站

//--# Tool : Vivado 2021.1

//--# Design Date : 2024.4.4

//--# Description : 并串转换数据生成模块；

//--# Version : 0.0

//--# Coding scheme : GBK（If the Chinese comment of the file is garbled, please do not save it and check whether the file is opened in GBK encoding mode）

//--#

//--###############################################################################################

module oserdese2_ctrl(

input clk ,//系统时钟信号；

input clk_div ,

input rst ,//系统复位信号，高电平有效；

output ofb //直连iserdese2的OFB管脚。

);

reg flag ;//

reg [7 : 0] cnt ;//

reg [7 : 0] din ;//

//辅助生成测试信号；

always@(posedge clk_div)begin

if(rst)begin//初始值为0;

flag <= 1'b0;

end

else begin

flag <= ~flag;

end

//用于对校准序列个数进行计数。

always@(posedge clk_div)begin

if(rst)begin//初始值为0;

cnt <= 'd0;

end

else if(&cnt)begin

cnt <= cnt;

end

else begin

cnt <= cnt + 1;

end

//生成用于校准的循环数据；

always@(posedge clk_div)begin

if(rst)begin//初始值为0;

din <= 8'h82;

end

else if(&cnt)begin//如果校准序列发送完毕，则发送伪随机信号用于测试。

din <= {(din[0] ^ din[4] ^ din[5] ^ din[6]),din[7:1]};//M序列公式为x^8+x^4+x^3+x^2+1。

end

else if(flag)begin//发送校准序列8'h5c；

din <= 8'h5c;

end

else begin//发送校准序列8'h82.

din <= 8'h82;

end

//例化主OSERDESE2原语

OSERDESE2 #(

.DATA_RATE_OQ ( "DDR" ),// DDR, SDR

.DATA_RATE_TQ ( "DDR" ),// DDR, BUF, SDR

.DATA_WIDTH ( 8 ),// Parallel data width (2-8,10,14)

.INIT_OQ ( 1'b0 ),// Initial value of OQ output (1'b0,1'b1)

.INIT_TQ ( 1'b0 ),// Initial value of TQ output (1'b0,1'b1)

.SERDES_MODE ( "MASTER" ),// MASTER, SLAVE

.SRVAL_OQ ( 1'b0 ),// OQ output value when SR is used (1'b0,1'b1)

.SRVAL_TQ ( 1'b0 ),// TQ output value when SR is used (1'b0,1'b1)

.TBYTE_CTL ( "FALSE" ),// Enable tristate byte operation (FALSE, TRUE)

.TBYTE_SRC ( "FALSE" ),// Tristate byte source (FALSE, TRUE)

.TRISTATE_WIDTH ( 1 ) // 3-state converter width (1,4)

)

OSERDESE2_inst (

.OFB ( ofb ),// 1-bit output: Feedback path for data

.OQ ( ),// 1-bit output: Data path output

// SHIFTOUT1 / SHIFTOUT2: 1-bit (each) output: Data output expansion (1-bit each)

.SHIFTOUT1 ( ),

.SHIFTOUT2 ( ),

.TBYTEOUT ( ),// 1-bit output: Byte group tristate

.TFB ( ),// 1-bit output: 3-state control

.TQ ( ),// 1-bit output: 3-state control

.CLK ( clk ),// 1-bit input: High speed clock

.CLKDIV ( clk_div ),// 1-bit input: Divided clock

// D1 - D8: 1-bit (each) input: Parallel data inputs (1-bit each)

.D1 ( din[0] ),

.D2 ( din[1] ),

.D3 ( din[2] ),

.D4 ( din[3] ),

.D5 ( din[4] ),

.D6 ( din[5] ),

.D7 ( din[6] ),

.D8 ( din[7] ),

.OCE ( 1'b1 ),// 1-bit input: Output data clock enable

.RST ( rst ),// 1-bit input: Reset

// SHIFTIN1 / SHIFTIN2: 1-bit (each) input: Data input expansion (1-bit each)

.SHIFTIN1 ( ),

.SHIFTIN2 ( ),

// T1 - T4: 1-bit (each) input: Parallel 3-state inputs

.T1 ( 1'b0 ),

.T2 ( 1'b0 ),

.T3 ( 1'b0 ),

.T4 ( 1'b0 ),

.TBYTEIN ( 1'b0 ),// 1-bit input: Byte group tristate

.TCE ( 1'b0 ) // 1-bit input: 3-state clock enable

);

endmodule

为了方便后续上板测试，OSERDESE2的串行输出信号和ISERDESE2串行输入信号采用OFB直连，不需要经过IOB，直接在芯片内部进行回环。

之后是ISERDESE2模块，对应的原语调用如下所示，采用DDR双沿采集数据模式，启用OFB作为串行输入，将输出Q8-Q1顺序调换，使得ISERDESE2输出并行数据与OSERDESE2并行输入数据保持一致。

//例化主ISERDESE2原语

ISERDESE2 #(

.DATA_RATE ( "DDR" ),// DDR, SDR

.DATA_WIDTH ( 8 ),// Parallel data width (2-8,10,14)

.DYN_CLKDIV_INV_EN ( "FALSE" ),// Enable DYNCLKDIVINVSEL inversion (FALSE, TRUE)

.DYN_CLK_INV_EN ( "FALSE" ),// Enable DYNCLKINVSEL inversion (FALSE, TRUE)

.INIT_Q1 ( 1'b0 ),// INIT_Q1 : Initial value on the Q outputs (0/1)

.INIT_Q2 ( 1'b0 ),// INIT_Q2 : Initial value on the Q outputs (0/1)

.INIT_Q3 ( 1'b0 ),// INIT_Q3 : Initial value on the Q outputs (0/1)

.INIT_Q4 ( 1'b0 ),// INIT_Q4 : Initial value on the Q outputs (0/1)

.INTERFACE_TYPE ( "NETWORKING" ),// MEMORY, MEMORY_DDR3, MEMORY_QDR, NETWORKING, OVERSAMPLE

.IOBDELAY ( "NONE" ),// NONE, BOTH, IBUF, IFD

.NUM_CE ( 2 ),// Number of clock enables (1,2)

.OFB_USED ( "TRUE" ),// Select OFB path (FALSE, TRUE)

.SERDES_MODE ( "MASTER" ),// MASTER, SLAVE

.SRVAL_Q1 ( 1'b0 ),// SRVAL_Q1 : Q output values when SR is used (0/1)

.SRVAL_Q2 ( 1'b0 ),// SRVAL_Q2 : Q output values when SR is used (0/1)

.SRVAL_Q3 ( 1'b0 ),// SRVAL_Q3 : Q output values when SR is used (0/1)

.SRVAL_Q4 ( 1'b0 ) // SRVAL_Q4 : Q output values when SR is used (0/1)

)

ISERDESE2_inst (

.O ( ),// 1-bit output: Combinatorial output

.Q1 ( q[7] ),// Q1 - Q8: 1-bit (each) output: Registered data outputs

.Q2 ( q[6] ),

.Q3 ( q[5] ),

.Q4 ( q[4] ),

.Q5 ( q[3] ),

.Q6 ( q[2] ),

.Q7 ( q[1] ),

.Q8 ( q[0] ),

.SHIFTOUT1 ( ),// SHIFTOUT1 : 1-bit (each) output: Data width expansion output ports

.SHIFTOUT2 ( ),// SHIFTOUT2 : 1-bit (each) output: Data width expansion output ports

.BITSLIP ( bitslip ),// 1-bit input: The BITSLIP pin performs a Bitslip operation synchronous to

// CLKDIV when asserted (active High). Subsequently, the data seen on the Q1

// to Q8 output ports will shift, as in a barrel-shifter operation, one

// position every time Bitslip is invoked (DDR operation is different from SDR).

.CE1 ( 1'b1 ),// CE1: 1-bit (each) input: Data register clock enable inputs

.CE2 ( 1'b1 ),// CE2: 1-bit (each) input: Data register clock enable inputs

.CLKDIVP ( 1'b0 ),// 1-bit input: TBD

// Clocks: 1-bit (each) input: ISERDESE2 clock input ports

.CLK ( clk ),// 1-bit input: High-speed clock

.CLKB ( ~clk ),// 1-bit input: High-speed secondary clock

.CLKDIV ( clk_div ),// 1-bit input: Divided clock

.OCLK ( 1'b0 ),// 1-bit input: High speed output clock used when INTERFACE_TYPE="MEMORY"

// Dynamic Clock Inversions: 1-bit (each) input: Dynamic clock inversion pins to switch clock polarity

.DYNCLKDIVSEL(1'b0 ),// 1-bit input: Dynamic CLKDIV inversion

.DYNCLKSEL ( 1'b0 ),// 1-bit input: Dynamic CLK/CLKB inversion

// Input Data: 1-bit (each) input: ISERDESE2 data input ports

.D ( 1'b0 ),// 1-bit input: Data input

.DDLY ( 1'b0 ),// 1-bit input: Serial data from IDELAYE2

.OFB ( ofb ),// 1-bit input: Data feedback from OSERDESE2

.OCLKB ( 1'b0 ),// 1-bit input: High speed negative edge output clock

.RST ( rst ),// 1-bit input: Active high asynchronous reset

// SHIFTIN1, SHIFTIN2: 1-bit (each) input: Data width expansion input ports

.SHIFTIN1 ( ),

.SHIFTIN2 ( )

);

之后需要对ISERDESE2并行输出进行校准，OSERDESE2产生的校准序列是8’h5c和8’h82交替串行序列，因此ISERDESE2转换结果也应该是8’h5c或者8’h82。如果转换结果不是这两个数据，那么将bitslip拉高一个时钟周期，对应代码如下所示。

//当没有完成校准时，如果检测到转换结果与要求不一致，则把该信号拉高。

always@(posedge clk_div)begin

if(rst)begin//初始值为0;

bitslip <= 1'b0;

end//当没有校准，且没有处于校准阶段时检测到串并转换结果不为8'h5c或者8'h82时拉高；

else if(((q != 8'h5c) && (q != 8'h82)) && (~slip_flag) && (~bitslip) && (~dout_vld))begin

bitslip <= 1'b1;

end

else begin//其余时间拉低；

bitslip <= 1'b0;

end

Bitslip拉高之后，ISERDESE2输出数据不是立即有效的，需要经过几个时钟的转换时钟，手册中说SDR模式需要消耗2个时钟，而DDR模式需要消耗三个时钟。

为了方便设计，此处直接使用一个位宽为2的计数器，每次bitslip拉高之后，等待4个时钟，之后才对ISERDESE2的并行数据进行检测，确定是否满足要求，bitslip还是否需要拉高。

//滑块计数器，因为bitslip拉高后，输出需要经过一段时间才会有效，因此这段时间不能对输出数据进行读取判断。

always@(posedge clk_div)begin

if(rst)begin//初始值为0;

slip_cnt <= 'd0;

end

else if(slip_flag)begin//对bitslip拉高后的时钟计数。

slip_cnt <= slip_cnt + 'd1;

end

//bitslip拉高后的标志信号，初始值为0，当bitslip拉高时拉高，当slip_cnt计数器计数到最大值时清零。

always@(posedge clk_div)begin

if(rst)begin//初始值为0;

slip_flag <= 1'b0;

end

else if(&slip_cnt)begin

slip_flag <= 1'b0;

end

else if(bitslip)begin

slip_flag <= 1'b1;

end

在校准阶段ISERDESE2输出可能会出现偶然结果，导致没有校准情况下，输出的部分并行数据与校准序列一致。为了避免这种情况，应该多次检测连续输出数据均与校验数据一致时，才认为校准完成。

因此需要一个计数器，对ISERDESE2输出的正确数据进行计数，当bitslip拉高或者处于拉高后的一段时间时，证明前面检测到的数据错误，将计数器清零。

当连续检测CNT_NUM个数据均正确时，认为校准完成，将计数器置为最大值，之后一直保持不变。

//转换成功计数器，用于记录校准阶段，当校准阶段检测到固定个连续有效数据时，认为校准成功。

always@(posedge clk_div)begin

if(rst)begin//

cnt <= 0;

end//当在校准阶段时，当bitslip有效时拉高；

else if((slip_flag || bitslip) && (~dout_vld))begin

cnt <= 0;

end

else if(cnt == CNT_NUM - 1)begin//当检测到固定校准数据时，计数器保持该数值。

cnt <= CNT_NUM - 1;

end

else if(add_cnt)begin

cnt <= cnt + 1;

end

//当不处于移动滑块状态且检测到输出数据为规定数据时加1.

assign add_cnt = ((q == 8'h5c) || (q == 8'h82)) && (~slip_flag) && (~bitslip);

//将转换后的数据输出，只有当校准完成后，输出有效指示信号磁能拉高，表示输出的数据有效。

always@(posedge clk_div)begin

dout <= q;

dout_vld <= (cnt == CNT_NUM - 1);

end

之后是顶层模块的处理，对于串行时钟和并行时钟的处理方式有如下两种，第一种是本时钟区域的外部时钟管脚输入串行时钟信号，之后通过BUFIO作为ISERDESE2和OSERDESE2的串行时钟信号。通过BUFR分频输出的时钟作为ISERDESE2和OSERDESE2的并行数据时钟信号，对应代码如下所示。

但是这种方式仿真会出现错误，OSERDESE2输出的数据始终是不定态，不知道为什么。另外要求输入串行时钟，然而串行时钟一般频率很高，用户的晶振一般是提供不了的，因此这种方式不太常用。

//调用BUFIO；

/*BUFIO u_BUFIO (

.O ( o_clk ), // 1-bit output: Clock output (connect to I/O clock loads).

.I ( clk ) // 1-bit input: Clock input (connect to an IBUF or BUFMR).

);

//调用BUFR对时钟进行分频；

BUFR #(

.BUFR_DIVIDE ( "4" ),//Values: "BYPASS, 1, 2, 3, 4, 5, 6, 7, 8"

.SIM_DEVICE ( "7SERIES" ) //Must be set to "7SERIES"

)

u_BUFR (

.O ( clk_div ),//1-bit output: Clock output port

.CE ( 1'b1 ),//1-bit input: Active high, clock enable (Divided modes only)

.CLR ( 1'b0 ),//1-bit input: Active high, asynchronous clear (Divided modes only)

.I ( clk )

);*/

另一种时钟处理方式是使用同一个MMCM，生成串行时钟和并行时钟，对于输入时钟频率没有太大要求。本文外部输入100MHz时钟信号作为ISERDESE2和OSERDESE2的并行时钟信号，通过MMCM生成400MHz作为串行时钟信号。对应代码如下所示：

clk_wiz_0 u_clk_wiz_0(

.clk_out1 ( clk_div_o ),//output clk_out1

.clk_out2 ( clk ),//output clk_out2

.reset ( rst ),//input reset

.clk_in1 ( clk_div ) //input clk_in1

);

MMCM的输出配置如下所示：

图14 MMCM输出配置.JPG

之后顶层模块需要例化前面两个模块，对应的完整代码如下所示。

//例化并串转换原语；

oserdese2_ctrl u_oserdese2_ctrl(

.clk ( clk ),//系统时钟信号；

.clk_div ( clk_div_o ),

.rst ( rst ),//系统复位信号，高电平有效；

.ofb ( oserdese_ofb )

);

//例化串并转换原语；

iserdese2_ctrl u_iserdese2_ctrl(

.clk ( clk ),//系统时钟信号；

.clk_div ( clk_div_o ),

.rst ( rst ),//系统复位信号，高电平有效；

.ofb ( oserdese_ofb ),

.dout ( o_iserdese2 ),//输出数据

.dout_vld ( o_iserdese2_vld ) //输出数据有效指示信号；

);

//例化ILA

ila_0 u_ila_0 (

.clk ( clk_div_o ),//input wire clk;

.probe0 ( u_oserdese2_ctrl.din ),//input wire [7:0] probe0;

.probe1 ( u_iserdese2_ctrl.q ),//input wire [7:0] probe1;

.probe2 ( u_iserdese2_ctrl.dout ),//input wire [7:0] probe2;

.probe3 ( u_iserdese2_ctrl.cnt ),//input wire [3:0] probe3;

.probe4 ( u_iserdese2_ctrl.slip_cnt ),//input wire [1:0] probe4;

.probe5 ( u_iserdese2_ctrl.bitslip ),//input wire [0:0] probe5;

.probe6 ( u_iserdese2_ctrl.slip_flag),//input wire [0:0] probe6;

.probe7 ( u_iserdese2_ctrl.add_cnt ),//input wire [0:0] probe7;

.probe8 ( u_iserdese2_ctrl.dout_vld ) //input wire [0:0] probe8;

);

顶层模块对应的RTL视图如下所示：

图15 顶层模块RTL.JPG

5. 工程仿真

对应的TestBench很简单，只需要提供时钟和复位信号即可，如下所示：

//--###############################################################################################

//--#

//--# File Name : testBench

//--# Designer : 数字站

//--# Tool : Vivado 2021.1

//--# Design Date : 2024.4.4

//--# Description : 测试串并转换原语

//--# Version : 0.0

//--# Coding scheme : GBK（If the Chinese comment of the file is garbled, please do not save it and check whether the file is opened in GBK encoding mode）

//--#

//--###############################################################################################

`timescale 1ns / 1ps

module test ();

localparam CYCLE = 10 ;//系统时钟周期，单位ns，默认10ns；

localparam RST_TIME = 10 ;//系统复位持续时间，默认10个系统时钟周期；

reg clk ;//系统时钟，默认100MHz；

reg rst_n ;//系统复位，默认低电平有效；

wire [7 : 0] o_iserdese2 ;

wire o_iserdese2_vld ;

top u_top(

.clk_div ( clk ),//系统时钟信号；

.rst_n ( rst_n ),//系统复位信号，低电平有效；

.o_iserdese2 ( o_iserdese2 ),

.o_iserdese2_vld ( o_iserdese2_vld )

);

//生成周期为CYCLE数值的系统时钟;

initial begin

clk = 0;

forever #(CYCLE/2) clk = ~clk;

end

//生成复位信号；

initial begin

rst_n = 1;

#2;

rst_n = 0;//开始时复位10个时钟；

#(RST_TIME*CYCLE);

rst_n = 1;

@(posedge o_iserdese2_vld);//校准完成；

repeat(400)@(posedge clk);

$stop;//停止仿真；

end

endmodule

之后运行vivado仿真，下图是OSERDESE2的时序图，将并行数据转换为串行数据输出，串行数据与时钟clk的双沿对齐。

图16 OSERDESE2时序.JPG

之后查看ISERDESE2时序，如下图所示，在校准开始阶段，ISERDESE2输出数据Q为8’h20，并不是校准序列8’h5c或者8’h82，所以将bitslip拉高一个clk_div时钟宽度。

等待四个clk_div时钟周期后，再次检测ISERDESE2输出并行数据，依旧不是规定数值，继续拉高bitslip进行调整。

图17 OSERDESE2时序.JPG

直到某次调整之后，ISERDESE2输出的并行数据序列均为8’h5c或8’h82，如下图所示，此时就可以拉高bitslip了。

图18 OSERDESE2时序.JPG

之后检测连续16个ISERDESE2并行输出数据，如果均为规定序列，没有问题，则将dout_vld拉高，表示输出数据已经对齐，是有效数据。

如果检测过程中出现错误，则计数器清零，bitslip拉高继续调整，直到满足要求即可。图片

图19 计数器对校准序列计数.JPG

下面是截取当转换完成后，发送端校验数据发送完成之后，发送伪随机的测试数据，ISERDESE2的输出依旧是正确的，证明前文的校准方式没有问题。

图20 接收伪随机序列.JPG

上述仿真就没有问题了，之后上板通过ila抓取相关信号，查看结果是否正确。

6. 上板测试

至于在使用OFB回环时，为什么不能使用D管脚，如下图所示，ISERDESE2和OSERDESE2会使用掉一个管脚的ILOGIC和OLOGIC资源，导致这个IOB管脚不能使用，ISERDESE2的D管脚就不能使用了。

下图中白色走线就是ISERDESE2和OSERDESE2的OFB回环走线。

图21 IO资源分布.JPG

工程综合完毕之后，将代码下载到开发板中，之后把dout_vld的上升沿作为ILA的触发条件。由于该条件在复位之后只会触发一次，因此在ILA启动之后，需要按一下开发板的复位引脚，才能够触发条件，对应截图如下所示。

图22 ILA的触发条件设置.JPG

如下图所示，开始校准时，ISERDESE2输出并行数据并不是校准序列的8’h5c或者8’h82。之后把bitslip拉高一个时钟，调整串并转换的起始位置，下图只调整了两次，ISERDESE2就输出了正确数据。

图23 校准时序.JPG

计数器cnt对ISERDESE2输出的正确数据进行计数，当ISERDESE2连续输出16个正确数据时，认为校准成功，如果觉得16个太少，在校准的时候可以设置更大的数据。

图24 校准计数器.JPG

最后就是对比校准后伪随机序列的转换了，din是OSERDESE2并串转换的输入数据，而dout是ISERDESE2串并转换的输出结果，下图中两图的数据相等，证明校准电路和串并转换均没有问题。

din和dout有延时是正常现象，因为两者中间有很多电路和触发器嘛，延时是正常的。

图25 转换数据.JPG

关于ISERDESE2的讲解到此结束了，本文虽然只是讲解了DDR模式的使用，但SDR原理也是类似的，只不过是单沿转换数据，两个时钟频率的比值不一样罢了。

主要理解bitslip的使用，才能够真正的了解该模块，不必在意bitslip拉高后，数据该怎么移动，只需要关注ISERDESE2输出是不是需要的输出，不是就继续通过bitslip调整ISERDESE2输出。这个校准的过程需要输入一直连续输入固定序列，不然无法校准。

文章来源：数字站微信公众号