作者:Adiuvo 工程师 Adam Taylor,来源:XILINX开发者社区微信公众号
1. 目录
目录
白皮书版本历史
简介
什么是 COP? 能为开发者带来哪些优势
如何选择最佳 COP 器件
案例研究
总结
2. 白皮书版本历史
本文为相关内容首次发行,版本为 1.0。
3. 简介...
技术
作者:Denis Tramarin,AMD工程师;来源:AMD Xilinx开发者社区
本文档提供了有关 SelectMAP 启动设置的技巧和指南。在提交个案服务请求之前,应认真查看以下检查表。
SelectMAP 启动模式的常规检查表:
1. 是否已查看 SelectMAP 文档,了解连接和电源轨的用法?
请参阅相应的 Versal DC 和 AC 数据手册,...
作者:Florentw,AMD工程师;来源:AMD Xilinx开发者社区
简介
在先前的 AI 引擎系列博文中,我们以 x86 模型为目标运行了 AI 引擎编译器,并运行了 X86 仿真器来验证 AI 引擎应用的功能模型。
在本文中,我们将以 AI 引擎模型为目标来运行 AI 引擎编译器并观察生成的部分文件。
要求
下文要求您通读前几篇 AI 引擎系列博文...
作者:Nick Liu,来源:FPGA FAE技术分享选集微信公众号
一、Nand Flash接口定义解析
Nand Flash因其具有容量大、成本低、寿命长的特点,被广泛的用作数据存储的解决方案。然而Nand Flash的读写控制较为复杂,Nand Flash的接口控制器大多是基于PC机或ARM处理器为架构进行开发的,存在操作不方便的问题。
FPGA实现Nand...
作者:Davis Zhang,AMD工程师,来源:AMD Xilinx开发者社区
在一些系统安全性要求较高的设计里,通常会加入系统自检功能。通常会在系统启动时进行一次系统自检,然后系统工作过程中实时监测。Zynq Ultrascale+器件里的on-chip memory(OCM)支持ECC,并支持单比特错误修正,多比特错误检测,并且提供人工插入ECC测试error的功能。相关的OCM...
作者:Ivy Guo,AMD工程师;来源:AMD Xilinx开发者社区
SEM IP将错误大致分为两类,可纠和不可纠。在开启了Correction纠错功能后,绝大部分SEU错误都能被IP及时检测到并纠正;但是也有极小一部分因为位置、数量的原因,仅能被检测到但是无法纠正。一般IP碰到此类错误,会上报错误信息然后进入IDLE停止状态,等待上层机制的判定:比如复位,重新配置,掉电等等。...
作者:Yang Iris,AMD工程师,来源:AMD Xilinx开发者社区
本博客将介绍如何通过CPM、NOC和LPD访问OCM。
片上存储器 (OCM)是一个在FPGA 内部包含 256 KB 的存储器,可通过其128位AXI 进行访问 接口端口。 OCM 可通过LPD的OCM 开关访问,其中包括两个 Cortex-R5F处理器和其他可以用于访问的OCM 的开关。...
作者:Florentw,AMD工程师;来源:AMD Xilinx开发者社区
简介
在 AI 引擎系列的前 3 篇博文中,我们探讨了 AI 引擎应用所需的不同文件。在本篇中,我们将为 X86 目标运行 AI 引擎编译器,观察它生成的不同输出。
要求
下文要求您通读前几篇。
AI 引擎系列 1 - 从 AI 引擎工具开始(2022.1 更新)
AI 引擎系列 2...
Xilinx Runtime (XRT) 库旨在促进应用代码与加速器之间的通信,此处所指应用代码在嵌入式 ARM 或 x86 主机上运行,加速器则部署在基于 PCIe 的 AMD 加速器卡、基于 MPSoC 的嵌入式平台或自适应 SoC 的可重配置部分上。
XRT 是开源工程。其源代码托管于 https://github.com/Xilinx/xrt。
其文档托管于 https://...
作者:Robert Hormuth,AMD公司副总裁,数据中心解决方案事业部,负责架构与战略
在服务器技术领域,双路曾经是尖端技术。双路技术曾是提升单个服务器性能的不二之选,因为它在单台服务器中配置两个处理器。从理论上讲,在大约相同的服务器占用空间内能够将性能最高提升一倍。在从纵向扩展(更多路数)计算到横向扩展(更多服务器)计算的过渡过程中,该技术一度成为主流。...
在关注机器健康和其他物联网(IoT)解决方案的现代应用中,随着检测功能的日趋普及,对更简单的接口以及更少的I/O和更小的器件尺寸的需求也随之增长。连接到单个微处理器或FPGA的器件密度不断增加,而应用空间(以及由此导致的I/O引脚数量)却受到限制。在理想情况下,所有应用都需要一个ASIC来提供小巧的集成式解决方案。
但是,ASIC的开发既耗时又昂贵,并且不具备满足其他用途的灵活性。因此,...
作者:Chen Yang,AMD工程师;来源:AMD Xilinx开发者社区
在Vitis调试kernel过程中(对于host代码问题,可以使用主流的debug方法,GDB等,这里不做讨论),用户可以在先行通过SW_EMU和HW_EMU测试,这能排除kernel大部分的功能问题。当然,最终的目的还是成功地运行在板卡上,即FPGA上。如果在硬件运行中遇到相关的问题,如遇到程序卡住问题,...
一、视频分布式的定义
分布式视频系统的概念是与集中式视频系统相对应的:分布式系统是音视频IP化的一种实现方案,是由若干个独立的功能节点通过网络分散组合而成,可以在空间部署上进行随意分布,各个节点通过网络实现互联。分布式系统包括三类节点:编码器、交换机、解码器,各类节点的数量不做限制,系统规模可以做到灵活的扩展。
二、分布式视频系统的种类...
傅里叶变换实际上就是对一个周期无限大的函数进行处理,将一个时域非周期的连续信号,转化为一个在频域非周期的连续信号,从这个方面来说傅里叶变换可以处理周期和非周期信号
傅里叶级数处理周期信号
傅里叶变换处理周期和非周期信号
生活中遇到的很多事情都是非周期的,比如将我们的生命比作一个沿时间不断变化的函数,有高潮有低谷,但是添加上傅里叶变换以后可以看作各种正弦波或者圆环不断叠加、...
作者:Peter Zhou,AMD 工程师;来源:AMD Xilinx开发者社区
有的朋友在Versal的板子上跑Linux时,想知道如何使用AXI HPC端口进行CCI coherent的高速数据传输呢?
在解决这个问题之前,首先我们需要修改一些寄存器的配置,为此要解决另外一个问题:
我们需要在CDO中手动修改0xFF41A040,这个寄存器主要修改enable OWO,...
作者:florentw,AMD Xilinx开发者社区
简介
在 AI 引擎系列的上一篇博文中,我们认识了 AI 引擎应用的顶层计算图 (graph) 文件。从中我们了解了如何使用此计算图文件来例化内核、将内核连接在一起以及将内核连接到 AI 引擎阵列端口。
在本篇博文中,我们将聊聊内核。在所使用的模板中,有 2 个内核(分别名为 first 和 second)...
1. 单击 www.xilinx.com 网站右上角的头像 打开“Sign in”(登录)面板,然后单击“Login | Register”(登录 | 注册)”。
2. 单击此面板上的“Create Account”(创建帐户)链接创建新的 Xilinx.com 帐户:
3. 在“Account Creation”(帐户创建)页面上完成要求提供的信息,然后单击“Submit”(...
把波动分解成三角函数是一种将任意周期性函数分解成一系列三角函数的方法。这种方法在信号处理、音频处理、图像处理等领域中得到了广泛的应用。
在波动分解成三角函数的方法中,我们首先需要了解傅里叶级数的概念。傅里叶级数是一种将周期函数分解成一系列正弦和余弦函数的方法。具体来说,对于一个周期为T的函数f(x),它的傅里叶级数可以表示为:
f(x) = a0 + Σ(an*cos(nωx) +...
作者:Florentw,来源:AMD Xilinx开发者社区
简介
在前文中,我们首先认识了 Vitis™ 2022.1 统一软件平台内适用于 Versal™ 的 AI 引擎 (AIE) 应用。
我们认识了 Vitis IDE 2022.1 中 AIE 应用工程的结构,还了解了用于 graph 初始化、运行和终止的一些 API。在本文中,我们将进一步深入讲解工程内的 AIE...
作者:Alan Zhang,来源:FPGA FAE技术分享选集微信公众号
一、前言
在基于FPGA和 SoC器件的产品设计过程中,从器件选择到系统级电源设计、散热设计,电源功率估算对于设计方案确定至关重要;早期进行极端情况下的功耗分析,可以帮助用户产品避免进入系统电源、散热设计过度或设计不足的陷阱。从Xilinx Power Estimator (XPE)工具问世以来,...
作者:姬晓婷,来源:中国电子报
关于FPGA是否会被替代的讨论时常会出现,近期甚至有FPGA企业在推出新产品时会特别强调“无需FPGA知识背景即可上手”,令人怀疑FPGA的未来市场前景。然而,这类诞生于上世纪80年代、在半导体极度追求高算力的背景下存在感稍弱的品类,正在汽车向智能化、定制化、新能源化转型的路上崭露头角,呈现出不可替代的作用。
智能座舱定制化需要更高灵活度
“...
作者:Florentw,来源:AMD Xilinx开发者社区
AI 引擎系列简介
在这篇题为 Versal 自适应 SoC AI 引擎入门的文章中,我介绍了一些 Versal™ 自适应 SoC 器件中存在的 AI 引擎 (AIE) 阵列。本系列是全新的 AI 引擎系列博文,我们将在其中提供一些示例用来说明如何使用集成到 Vitis™ 统一软件平台中的 AI 引擎工具。
要求...
此文提供了一个表格,其中总结了 Vivado 2023.1 中针对不同 Versal PCIe IP 的 10 位标签请求器功能的支持信息。
如需了解有关 PCIe 调试的更多信息,请访问
https://xilinx.github.io/pcie-debug-kmap/pciedebug/build/html/index.html
PL...
软件版本:vitis2021.1(vivado2021.1)
操作系统:WIN10 64bit
硬件平台:适用AMD-XILINX A7/K7/Z7/ZU/KU系列FPGA
1 概述
在开发工程中,我们需要对一些信号进行debug调试,如果对于CPU的软件开发一般可以设置断点,但是对于FPGA来说,FPGA是无法设置断电的,但是FPGA可以通过内嵌的逻辑分析仪(ILA)...
作者:米联客(milianke)
软件版本:vitis2021.1(vivado2021.1)
操作系统:WIN10 64bit
硬件平台:适用AMD-XILINX A7/K7/Z7/ZU/KU系列FPGA
1 概述
仿真是每个初学者必须学会的一项技能,因为FPGA程序编译时间往往很长,所以对程序进行仿真就成为了校验程序正确性的最快捷的方式。
本节课,...
作者:Gary Pan,来源:AMD Xilinx开发者社区
CPRI是无线通信里的一个标准协议,连接REC和RE的通信。
Xilinx有提供CPRI IP核。
区别于其它通信协议,如以太网等,CPRI是一个同步系统。
这就意味着两端的Master和Slave应当是同源时钟的,两边不存在频差,并且内部延时也都是固定的,每次运行可以通过计算获得,供上层应用使用。因此,...
作者:米联客(milianke)
软件版本:vitis2021.1(vivado2021.1)
操作系统:WIN10 64bit
硬件平台:适用AMD-XILINX A7/K7/Z7/ZU/KU系列FPGA
1 概述
本实验通过一个基本的FPGA工程创建,编译,下载测试,演示如何快速上手AMD-FPGA开发工具软件vitis-vivado。...
作者:Txu,来源:AMD Xilinx开发者社区
在设计周期中,您可保留多个版本的工程,这些工程使用相同的 IP 和相同的配置。重新运行整个工程会导致每次都要重新生成 IP,很费时间。
在 Vivado 工程设置中,您的 IP 存储库允许您将自己的 IP 添加到 Vivado IP 目录中,搭配远程 IP 高速缓存一起使用时,即可显著缩短编译时间。这篇博文解释了具体设置方法...
作者:Gary Pan,来源:AMD Xilinx开发者社区
目前Xilinx的以太网IP核,如软核10G/25G,40G/50G或者硬核CMAC,MRMAC,DCMAC等等,都采用的是同一种Pause帧处理方式。
这篇blog主要介绍了,用户应当如何设置以太网IP的相关参数,使其能够有效处理以太网的Pause帧。
按照IEEE802.3协议,一个Pause帧是一个最小长度,...
作者:Rob Green,AMD 专业音视频、广播与消费业务高级经理
在《任意网络上的任意媒体》系列的首篇中,我们重点介绍了传统音视频连接标准和以太网 IP 网络之间的桥接支持,这是许多多媒体系统所需的一项关键功能。接下来,我们将深入研究设计人员使用 AMD 自适应 SoC 通过以太网进行音视频传输时所拥有的选择。
Zynq™ 7000 SoC
对于空间受限、...
作者:Rob Green,AMD 专业音视频、广播与消费业务高级经理
任意网络上的任意媒体
在不断变化的专业多媒体世界中,向以太网和 IP 网络的转变是从根本上改变行业的最重要趋势之一。音频和视频( A/V )不再受限于点对点连接。设备正从大型机架单元资本支出转向更灵活的、基于运营支出的网络可寻址平台的使用,这些平台存储在本地或云端,并且仅在需要时进行配置。
对各种设备(...
作者: Brian Liu,来源:FPGA FAE技术分享选集微信公众号
一. 2D 去噪介绍
ISP中通常包括对图像的去噪,英文名称为Image Denoising。是指的对数字图像中的噪声进行消除或减少的过程。2D去噪指的是对单帧图像进行帧内降噪处理,而3D去噪则需要关联前后帧。本文仅介绍几种常见的基于滤波器的方法的2D去噪:均值滤波、高斯滤波、中值滤波。
二. 均值滤波...
作者:付汉杰 hankf@amd.com
介绍
AMD MPSoC Linux一般使用PetaLinux编译Linux系统,包括Linux内核、DTS、文件系统。
PetaLinux内部集成Yocto,自动下载、配置、编译各种软件包。 它简化了编译流程,也导致有些工程师找不到软件包的源代码,不知道如何调试软件。
在PetaLinux工程的目录下,根据下列步骤,...
嵌入式系统的开发和调试是一项复杂的任务,需要强大的工具和接口来确保硬件和软件的正确性。在这个领域,JTAG(Joint Test Action Group)和SWD(Serial Wire Debug)是两个常用的调试接口标准,它们在嵌入式系统开发中起到关键作用。本文将深入研究JTAG和SWD,比较它们的特点、优劣势以及适用场景。
JTAG:传统的调试接口
1、JTAG简介...
GTP/GTX 中的 LOS 状态机行为与各种以太网协议的规范不同。本文介绍了 LOS 状态机行为,并提供了解决问题的方法。该方法可能不适用于所有设计、特别是需要 Channel Bonding 的设计。
解决方法:
不使用 Channel Bonding 时 不使用 Channel Bonding 时,GTP/GTX 中的 Loss of Sync 状态机会无限停滞在 RESYNC...
作者:Ivy Guo,AMD工程师,来源:AMD Xilinx开发者社区
UltraScale / UlraScale+系列的SEM IP一共有6种工作模式,分别是:
• Mitigation and Testing
• Mitigation only
• Detect and Testing
• Detect only
• Emulation
• Monitoring...
采集时间
采集时间是从释放保持状态(由采样-保持输入电路执行)到采样电容电压稳定至新输入值的1 LSB范围之内所需要的时间。采集时间(Tacq)的公式如下:
混叠
根据采样定理,超过奈奎斯特频率的输入信号频率为“混叠”频率。也就是说,这些频率被“折叠”或复制到奈奎斯特频率附近的其它频谱位置。为防止混叠,必须对所有有害信号进行足够的衰减,使得ADC不对其进行数字化。欠采样时,...
作者:Rob Green,专业音视频、广播与消费业务高级经理
Versal™ 自适应 SoC 为 8K 处理做好准备
图1:Versal 器件图
为了获取和传输 8K 视频,接口必须提供 4 倍于其 4K 前代产品的带宽,从而使接口具备更多数据通道、更高速率,或二者兼备。AMD Versal™ 自适应 SoC(片上系统)非常适合此类接口(线速为 20 Gbps...
作者:Txu,来源:AMD Xilinx开发者社区
增量综合流程:
增量综合的工作方式与增量实现流程相似,但仅适用于综合阶段,并且不会对紧随其后的实现阶段给予引导。
此流程需独立的综合参考文件(综合后 DCP),因此您需完成初始综合运行以获取首个综合后 DCP 文件。增量运行会复用设计中未更改的部分,并且仅对已更改的部分进行重新综合。复用的各部分会在分区级别予以保留。...
作者:Amanda Emerson,专业音视频、广播与消费业务技术营销专员
8K带宽瓶颈
音频/视频(A/V)接口是任何显示系统不可或缺的一部分,因为它们负责传输流媒体内容、玩游戏和显示高质量图像所需的数据。对于最终客户来说,它们似乎没有改变,但这些接口其实是在持续演进的,以跟上最新的显示标准。现在,系统正在从 4K 转向 8K(甚至更高),它们处理的数据比以往任何时候都多,...
Vitis™ HLS 2023.1 支持新的 L1 库向导,本文将讲解如何下载 L1 库、查看所有可用功能以及如何在 Vitis HLS GUI 中使用库函数。
Vitis 软件包含一套丰富的开源优化库,只需对现有应用进行最低限度的代码修改,便可提供开箱即用的加速功能。
L1 库包括用于 C、C++ 实现方案的低级原语和基本算法函数。
其中的多个库共支持 600...
(原载于《微波杂志》23年7/8月号)
物联网(IoT)在过去几年中呈指数级发展,这得益于LEO卫星星座的建立。MBI研发的LEOnida方案基于返回链路(RL)和一种改进的增强扩频Aloha(E-SSA)空中接口[1]。E-SSA是一种随机访问(RA)技术,由之前的Aloha协议进化而来,允许在信噪比(C/N)远低于0dB的情况下对接收到的异步突变信号进行解调。它结合了直接序列扩频(SS...
正如许多行业内读者可能已听说的,Digilent目前已发布Analog Discovery 3 产品。而我们作为负责在 Analog Discovery 3 资源中心制作说明文档的团队成员之一,往往遇到的最大问题之一便是“Analog Discovery 3 与 Analog Discovery 2 产品两相对照下有着那些差异?”
有鉴于此,在这篇文章中,...
作者:Txu,来源:AMD Xilinx开发者社区
这篇博文介绍了多种自动生成报告的有效途径,以便您在尝试对设计中特定阶段所耗用的编译时间进行调试时使用,例如,自动报告加载设计约束的时间、每条命令的持续时间,甚至是跨多个设计的运行时间差异。
此外还提供了关于如何解读这些结果的建议。
其中涵盖了 3 个强大的脚本,用于应对这些用例。
report_constraints...
作者:付汉杰 hankf@amd.com
由于客户需要,需要在Linux里启动服务,使一个脚本在后台一直运行。
于是创建一个systemd服务,使其运行顶层脚本,再在其中以后台运行方式启动另外一个长期运行脚本。
结果发现,后台运行的长期运行脚本,过一段时间也退出了。
经过调试和分析,发现systemd创建的后台进程,以“Type=forking”方式运行,就不会退出...
作者:Cheng Zhang,AMD工程师;文章来源:AMD Xilinx开发者社区
1. 关于PRBS13、QPRBS13、PRBS13Q和QPRBS13-CEI的定义
1)PRBS13的表达式为 x13 + x12 + x2 + x + 1
2)在AR72117中对QPRBS13、PRBS13Q和QPRBS13-CEI有以下定义:
PRBS13Q按照IEEE 802....
作者:付汉杰 hankf@amd.com
命令pstree将相关进程以树状图显示,方便查看进程间的关系。由于调试需要,需要在Linux里使用命令pstree。但是PetaLinux产生的Linux映像,默认不带命令pstree。
在rootfs里查找pstree
首先使用命令“petalinux-config -c rootfs ”尝试在rootfs里查找pstree。...
本文将指导您完成提交 Alveo 卡的 RMA 所需的步骤。
注:退货授权 (RMA) 流程用于处理与不合符 Xilinx 规定相关的硬件故障。
RMA 只适用于根据 Xilinx 标准条款和条件担保的 Alveo 产品。
本文记录涵盖以下内容:
故障排除、已知问题和技术支持
提交 RMA 所需的信息
如何提交 RMA 请求
故障排除、已知问题和技术支持...
作者:Albert Wei,文章来源: FPGA FAE技术分享选集微信公众号
QT是一个跨平台的C++图形用户界面应用程序开发框架。它既可以开发GUI图形用户界面程序,也可用于开发非GUI程序,比如控制台工具和服务器。由于QT良好的跨平台特性,基本上不做修改就可以在Windows或Linux或嵌入式设备上实现同样的界面。Linux操作系统是嵌入式的主力军,广泛应用于消费类电子、工业控制、...
什么是神经网络?
神经网络是一个具有相连节点层的计算模型,其分层结构与大脑中的神经元网络结构相似。神经网络可通过数据进行学习,因此,可训练其识别模式、对数据分类和预测未来事件。
神经网络将您的输入细分为多个抽象层。比如,可通过大量示例训练其识别模式为语音还是图像,就像人类大脑的行为一样。神经网络的行为由其各个元素的连接方式以及这些连接的强度或权重确定。在训练期间,...