YunSDR小课堂-AIE编程指南(第54讲)

judy 在周一, 06/16/2025 - 16:43 提交

7. AI Engine Kernel and Graph Programming

异步缓冲区端口访问

在某些情况下，如果您没有在每次调用内核时消耗相当于缓冲区端口的数据，或者如果您没有在每次调用时产生相当于缓冲区端口的数据，那么您可以通过在内核函数原型中使用BRAC声明BRAC缓冲区端口来声明内核端口来控制缓冲区同步。下面的例子说明了内核简单的使用：

· ifm：同步输入缓冲区端口。

· wts：异步输入缓冲器端口。

· ofm：异步输出缓冲器端口。

下面的声明通知编译器在进入内核时忽略名为wts的缓冲区的同步。在使用读/写迭代器/引用访问缓冲区端口之前，必须使用内核代码中显示的缓冲区端口同步成员函数，如下所示。

缓冲区对象wts的acquire（）成员函数执行适当的同步和初始化，以确保缓冲区端口对象可用于读取或写入。此函数跟踪要在内部获取的适当缓冲区指针和锁，即使缓冲区端口在AI Engine处理器之间共享并且可以进行双缓冲。此函数可以在动态控制下无条件或有条件地调用，并且可能是一个阻塞操作。您有责任确保稍后执行相应的release（）成员函数（甚至可能在随后的内核调用中），以释放与该缓冲区对象关联的锁。不正确的同步会导致代码中的死锁。

重要提示！对异步缓冲区的操作应在获得缓冲区后进行。例如，在acquire（）API之后声明缓冲区迭代器。

在下面的示例中，位于tile 1中的内核在每次运行时请求三次锁获取（写访问）。位于瓦片2中的内核在每次运行时请求两次锁获取（读访问）。

锁的获取和释放是一个仅限内核的过程。主要功能不是处理缓冲区同步;缓冲区同步是用户的责任。瓦片1中的内核请求三次对乒乓缓冲区的访问，瓦片2中的内核仅请求两次。为了平衡访问次数，每个迭代中，区块1应该运行两次，区块2应该运行三次。

如图所示，锁定获取交替发生在ping缓冲区和pong缓冲区上。缓冲液选择是自动的。此时不需要用户决定。锁获取的最小延迟是内核停止的七个时钟周期。如果缓冲区不可用于获取，则内核将暂停更长时间（如图中红色所示），直到缓冲区可用。根据应用程序的不同，可能存在ping和/或pong缓冲区根本不锁定的时间间隔。

对于异步缓冲端口，内核的缓冲端口由获取和释放API显式获取和释放。异步输出缓冲区可以在内核内部的任何时候由释放API释放，无论内核将多少样本写入缓冲区。在端口被释放后，异步输出缓冲区可以由其消费者内核获取，也可以由DMA传输到其目的地，如PLIO。

缓冲区端口数据类型