技术

作者:安平博,Xilinx高级工程师,来源:AI加速微信公众号 理论介绍 相比于训练后量化方法,将量化过程插入到训练中可以弥补量化产生的误差,但是带来的问题可能是增加了训练的时间。在tansformer的量化实现中,我们采用了训练中量化的方法,在网络前向传输中,对权重等参数进行线性量化。反向传播中,对scale和权重参数的求导采用Hinton的strait-through...
本文转载自: XILINX技术社区微信公众号 本篇博文主要讲解了动态更改 UltraScale/UltraScale+ GTH/GTY 收发器线速率设置的方法。 您是否曾想过要使用 UltraScale/UltraScale+ GTH/GTY 收发器来动态更改线速率设置? 有许多客户会将 GTH/GTY 收发器用于其自己的通信协议,因此询问我们如何才能使用收发器来更改线速率...
本文转载自:根究FPGA微信公众号 在FPGA程序设计的很多情形都会使用到AXI接口总线,以PCIe的XDMA应用为例,XDMA有两个AXI接口,分别是AXI4 Master类型接口和AXI-Lite Master类型接口,可通过M_AXI接口对数据进行读取操作,此时设计一个基于AXI-Slave接口的IP进行数据传输操作就非常的方便。 封装的形式并不复杂,只是略微繁琐,...
作者:付汉杰,hankf@xilinx.com,文章转载自:赛灵思中文社区论坛 MPSoC 为PL提供了96个GPIO,通过EMIO管脚链接到PL。 普通PL设计,一般只会用到几个GPIO管脚。可以使用Vivado IPI中的Slice IP, 从其中分出指定数量的管脚。 Slice配置界面 上图中,输入宽度是95,因为pl_reset占用率一个管脚。...
编译:CSDN- 孙薇,作者:Martin Andersson Aaberge Python是一种很棒的语言,语法简单,无需在代码中搜索分号。对于初学者来说,Python是入门最简单的语言之一。 Python有大量的库支持,你还可以安装其他库来增加自己的编程经验。 学了一阵子之后,你可能会觉得:为如此简单的操作写大量的代码有些令人困惑。实际上,事情并没有你想得那么糟。...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 在ZCU106上,使用VCU TRD的MIPI的例子,可以从MIPI摄像头采取图像数据,并使用GStreamer推送到HDMI显示器上。 echo -e "\n\nXilinx CSI2 Rx Subsystem Information: " dmesg | grep -i "Xilinx CSI2 Rx...
本文转载自: PYNQ开源社区微信公众号 感兴趣者可与 pynq_china@xilinx.com 联系,共同合作拓展项目。 简介 本案例主要基于DPU-PYNQ来实现一个常见的手势识别--石头剪刀布,目的是让大家了解如何使用DPU开发深度学习应用的整个流程。本案例分为三个部分:分别是PC模型训练、VitisAI模型编译、Edge模型部署三个部分。...
本文转载自: XILINX技术社区微信公众号 通过之前的博文,我们已经学会了如何使用 Report QoR Assessment (RQA) 和 Report QoR Suggestions (RQS) 来改进总体设计分析以及设计的时序收敛体验。 本篇博文将通过一个具体设计示例来演示如何在实现流程中将 RQA 与 RQS 结合使用。 RQA 能为设计提供评估得分,...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 MicroBlaze可以使用AXI BRAM存放数据和指令。有些客户软件很大,需要把AXI BRAM的空间做到最大。AXI BRAM底层是Block RAM或者Ultra RAM。器件的Block RAM或者Ultra RAM个数,决定了AXI BRAM的大小。 在ZCU106单板上,有312个Block RAM,...
本文转载自:PYNQ开源社区 微信公众号 感兴趣者可与 pynq_china@xilinx.com 联系,共同合作拓展项目。 本文内容以采访上海科技大学哈亚军教授,姜伟雄博士整理所成。 关于DAC-SDC比赛详细情况,请参考上一篇文章:快讯|中国团队包揽顶会DAC-SDC竞赛冠亚军 来自上海科技大学的SkrSkr队脱颖而出获得亚军。作品以2019年DAC-...
本文转载自:XILINX技术社区微信公众号 Report QoR Assessment (RQA) 用于详述您的设计 QoR 目标实现的可能性。如果此命令返回的结果与您的期望不符,那么本篇博文包含了有关您可采取的后续行动的附加信息。本篇博文不仅适合首次使用这些命令的新用户,对于有经验的用户应该同样很实用。 什么是 QoR 评估报告 ? (Report QoR...
本文转载自:ILINX技术社区 在某些情况下,比如远程工作时,可能需要访问本地不可得的器件。 本篇简介教程演示了如何共享并访问位于远程实验室内的开发板或归同事所有的开发板。 本教程分 2 个部分: 第 1 部分:必须由开发板所有者执行的任务。 第 2 部分:必须由此开发板的访问者执行的任务。 步骤 1:共享开发板 将此开发板通过 USB...
作者:安平博,Xilinx高级工程师;来源:AI加速微信公众号 前言 AI芯片(这里只谈FPGA芯片用于神经网络加速)的优化主要有三个方面:算法优化,编译器优化以及硬件优化。算法优化减少的是神经网络的算力,它确定了神经网络部署实现效率的上限。编译器优化和硬件优化在确定了算力的基础上,尽量最大化硬件的计算和带宽性能。经历了一年多的理论学习,开始第一次神经网络算法优化的尝试。...
本文转载自:PYNQ开源社区微信公众号  ORB特征是一种图像识别、追踪和匹配中常用的特征,大名鼎鼎的ORB-SLAM就是使用的这一特征。它提取FAST特征点,并通过特征点附近的窗口矩计算特征点的方向,含方向的FAST特征也被称为oFAST特征。对提取到的oFAST特征,进一步计算BRIEF描述子。ORB特征包含了两部分,一是特征点位置,二是它的BRIEF 256位描述子。...
作者:Noam Levine,文章来源:MATLAB微信公众号 一些 5G 系统的制造商正在转向更高水平的硬件集成,并在片上系统(SoC)设备中整合射频转换器和基带处理引擎,以解决功耗和电路板空间问题。虽然这种集成有好处,但负责这些系统表征的工程师面临着访问数据的新挑战,因为之前的独立射频数据转换器现在将与 FPGA 和处理器在同一芯片上进行组合。 另一个困扰工程师的因素是 5G...
现代 RF 信号链对于跨多通道的数据转换器性能具有极高的要求。换言之,对于赛灵思 RF Data Converter 而言,关键要求之一是在多个 ADC/DAC Tile、RFSoC 器件甚至开发板之间都必须保持同步。 了解赛灵思如何探索多块同步 (Multi-Tile Synchronization) 问题解决之道,以支持实现波束成形、大规模 MIMO (Massive MIMO)...
硬件加速器已在数据中心得到普遍使用,一系列新的工作负载已经能够成熟地发挥 FPGA 的加速优势及其更优异的计算效率。业界对机器学习 (ML) 的关注度不断提高,推动 FPGA 加速器在私有云、公有云、混合云数据中心环境中日益普及,从而为计算密集型工作负载加速。近期,在推动 IT 基础设施向异构计算转型的过程中,赛灵思与 VMware 展开协作,在 VMware...
作者:付汉杰,hankf@xilinx.com,文章转载自:赛灵思中文社区论坛 在OpenAMP的应用程序中,经常看到地址被设置成RPMSG_ADDR_ANY。在通信过程中,为什么可以把源地址、目的地址设置成任意值? 这个宏的名字不够清楚,它的本意是让系统自动选择。如果设置源地址为RPMSG_ADDR_ANY,则系统自动选择一个空闲的源地址。...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 不同使用场景,对芯片的性能和功耗要求不一样。为了测试Xilinx MPSoC PS侧的最低功耗,基于ZCU106单板做了功耗优化。为了方便,使用最简单的软硬件环境。软件使用死循环做串口打印,硬件保留了如下模块。 A. A53 0 B. QSPI flash Dual Parallel C. I2C 0/1 D...
什么是EasyDL? EasyDL是百度大脑推出的定制化AI训练及服务平台,支持面向各行各业有定制AI需求的企业用户及开发者使用。支持从数据管理与数据标注、模型训练、模型部署一站式AI开发流程,通过原始图片、文本、音频、视频类数据经过EasyDL加工、学习、部署可发布为公有云API、设备端SDK、本地化部署及软硬一体产品。 百度大脑EasyDL怎么玩转AI? 01....
本文转载自:XILINX技术社区微信公众号 赛灵思 PCI Express IP 随附以下集成调试功能。 JTAG 调试器 启用 In-System IBERT 第三代模式解扰器 “JTAG 调试器 (JTAG Debugger)”可提供以下信息来帮助调试 PCI Express 链接训练问题: LTSSM 状态的图形化视图 基于 GUI...
作者:范龙飞 文章来源:MYMINIEYE微信公众号 1.FSK信号的解调原理 FSK信号的解调也有非相干和相干两种,FSK信号可以看作是用两个频率源交替传输得到的,所以FSK的接收机由两个并联的ASK接收机组成。 (1)相干解调 相干解调是利用乘法器,输入一路与载频相干的参考信号与载频相乘,通过低通滤波,滤除高频信号,即得原始信号,FSK经过带通滤波之后,...
如果您正在使用 MATLAB 建模数字信号处理(DSP)或者视频和图像处理算法,并且最终将其用于 FPGA 或 ASIC,本文可能将为你带来帮助。 从 MATLAB 生成 HDL 代码 FPGA 在通用处理器(GPP)和专用集成电路(ASIC)之间提供了很好的折中方案。GPP 是完全可编程的,但在功率和性能方面效率较低;ASIC 可实现专用的功能,并展现出最佳的功率和性能特性,...
作者:范龙飞 ,文章来源:MYMINIEYE 一 .滤波器介绍 滤波器是一种用来减少,消除干扰的电器部件,有对特定频率的频点或该频点以外的频率信号进行有效滤除,从而实现消除干扰、获取特定频率信号的功能。数字滤波器相比模拟滤波器,有着更高的精度、信噪比、无可比拟的可靠性。 FIR,IIR是数字滤波器中最常见的两种滤波器。FIR滤波器是有限冲击响应,最主要特点是没有反馈回路,...
介 绍 对实时视频流的需求已发展成为一项至关重要的业务需求。视频服务提供商面临着艰难的权衡取舍,因为他们必须在管理基础设施和运营成本的同时,还要为客户提供高质量体验。鉴于视频转换的计算强度,转码不断推升对灵活应变硬件加速的需求。 赛灵思已开发出一款高性能视频转码包,无需改变现有基础设施即可为服务提供商提供所需低功耗与优异性能。 此外,该解决方案采用业经验证的非常强大的...
本文转载自: XILINX技术社区微信公众号 本篇博文将为您演示如何创建 AXI CDMA Linux 用户空间示例应用。 示例设计将在 Zynq UltraScale+ RFSoC ZCU111 评估板上实现通过 AXI CDMA 把数据从 PS DDR 传输至 AXI BRAM。 适用平台 Vivado 和 PetaLinux 2019.2。 Zynq...
测试工具版本:PetaLinux 2018.2 测试单板: ZCU106 UBIFS是更强壮的FLash文件系统。很多嵌入式系统都使用了UBIFS。Xilinx PetaLinux 2018.2也支持UBIFS。只需要在Linux/U-Boot里添加相关配置选项,就能为QSPI Flash创建UBIFS。 第1步,为Linux Kernel添加UBIFS配置选项。...
介 绍 对实时视频流的需求给视频服务提供商带来了严峻挑战,因为他们必须在管理基础设施和互联网带宽运营成本的同时,还要为客户提供高质量体验。鉴于视频转换的计算强度,转码不断推升对灵活应变硬件加速的需求。 如今,视频服务提供商运用新一代压缩标准和自适应比特率 (ABR) 视频流协议,在保障高质量视频分发的同时对带宽进行管理。然而,两种方法虽都能降低比特率,但却会提高计算的复杂性。...
作者: OpenSLee,来源: FPGA开源工作室微信公众号 1 xilinx FFT IP介绍 Xilinx快速傅立叶变换(FFT IP)内核实现了Cooley-Tukey FFT算法,这是一种计算有效的方法,用于计算离散傅立叶变换(DFT)。 1)正向和反向复数FFT,运行时间可配置。 2)变换大小N = 2m,m = 3 – 16 3)数据采样精度bx =...
导 读 近日,赛灵思发布重磅消息,同时推出两款易于扩展的、超高密度视频转码专用视频实时转码一体机。基于新型的赛灵思实时服务器( Xilinx RT Server)参考架构,两大全新一体机将双管齐下,助力当今服务提供商以每通道最低成本提供视频质量和比特率优化的多种类型应用。自本期开始,我们将通过一系列解密文章,为您揭开这一与众不同的实时转码一体机... 方案介绍...
作者:品客 ,来源:PYNQ开源社区微信公众号 PYNQ-PRIO是一个介绍如何利用FPGA部分可重配置特性和PYNQ框架提供的方便的API,对FPGA分时复用,提高FPGA灵活性的项目。可重配置是指在一个FPGA工程中,划分了静态逻辑部分和动态逻辑部分,静态逻辑部分是指在运行过程中逻辑不变的部分,动态逻辑部分是指在运行过程中可以根据需要下载特定比特流文件实现不同逻辑的部分,在工作时,...
作者:付汉杰,hankf@xilinx.com,文章转载自:赛灵思中文社区论坛 一个工程师打算在命令行里编译Xilinx SDK工程,以便集成进入其它自动化构建工具。Xilinx SDK工程都支持在命令行编译。在命令行里编译Xilinx SDK工程前,需要执行call C:/Xilinx/SDK/2019.1/settings64.bat,设置编译环境。...
本文转载自:XILINX技术社区微信公众号 Versal™ ACAP(自适应计算加速平台)是高度集成化的多核计算平台,可通过灵活的自适应能力来满足不断变化的动态算法的需求。VCK190 是赛灵思最早发布的 Versal AI Core 评估器件之一。 本篇博文将为您详解如下所述设计创建步骤: 1. 在 Vivado 中构建基于 Versal 的 IP 集成器 (IP...
作者:付汉杰,hankf@xilinx.com,文章转载自:赛灵思中文社区论坛 MPSoC A53执行的第一条代码定义在BSP工程的目录\psu_cortexa53_0\libsrc\standalone_v7_0\src\asm_vectors.S里。 去掉Xen相关代码后,简化如下: .org 0 .section .vectors, "a"...
介绍 DesignLinx 及其客户是赛灵思 SDAccel™ 开发环境的早期用户。他们使用 SDAccel 开发环境,针对搭载加速软件的亚马逊 AWS F1 和赛灵思 Alveo™ 数据中心加速器卡,开发云端应用和本地应用。 结合 SDSoC 和赛灵思 SDK,SDAccel 流现在是 2019.2 Vitis™ 统一软件平台的组成部分,...
概述 Zynq® UltraScale+™ MPSoC 系列基于 Xilinx® UltraScale™ MPSoC 架构,在单个器件中集成了功能丰富的、基于 ARM 的 64 位四核或双核处理系统 (PS) 和 Xilinx 可编程逻辑 (PL) UltraScale 架构。此外,还包括片上存储器、多端口外部存储器接口以及丰富的外设接口,尤其是 16.3 Gbps GTH 收发器,...
作者:Stephen Evanczuk,Digi-Key 北美编辑;文章转载自:Digikey 飞行时间 (ToF) 技术越来越多地用于测距和接近感应,应用范围从消费品到工业设备。单芯片 ToF 处理 IC 的出现有助于简化这些解决方案的实施,但开发人员仍需完成一些关键任务,例如找到合适的发射器和光电二极管并进行优化,以及将这些器件与该 ToF 处理器进行集成。通过使用更加集成的方法,...
作者:付汉杰,hankf@xilinx.com,文章转载自:赛灵思中文社区论坛 MPSoC EV 系列支持H.265编解码。在规格中,1080p编解码都可以达到8路1080p30,总体相当于1080p240。使用2018.3 VCU TRD 实际测试,性能更好。按如下测试,编码每路的帧率达到达到45,总体相当于1080p350;解码总体相当于1080p390。编码时,每路的CPU负载在15...
作者:范龙飞 ,文章来源:MYMINIEYE微信公众号 1、FSK信号的调制原理 数字频率调制是利用载波的频率传输信息的一种调制方式,FSK是在ASK之后出现的一种调制方式,抗衰落能力较强,在一些衰落信道中应用广泛。 数字频移键控(FSK)是用载波的频率来传递数字信息,符号1对应某个载频,符号0对应某个载频,频率之间的改变瞬间完成的,根据码元转换时刻的载波相位特征,...
作者:付汉杰,hankf@xilinx.com,文章转载自:赛灵思中文社区论坛 1. MicroBlaze AXI访问返回DECODE1C 在ZC702单板上,MicroBlaze通过IC/DC端口连接到PS S_AXI_GP0,MicroBlaze读取OCM,得到值DECODE1C。 DECODE1C is returned by the AXI Interconnect if it...
本文转载自: XILINX技术社区微信公众号 改进设计时,如果 QoR 不升反降,那么您势必将面临如下选择。 是继续修复?还是重新寻找新的解决方案?您可能忽视了某些问题,或者可能工具在运行给定轮次时性能有所下降。能否快速准确解答这一问题恰恰是判断 FPGA 工程师是否足够出色的标准之一。 这里有一个好办法 - 解决方法问题即可简化这一任务。在最近赛灵思内部调研中发现,29...
作者:Parker Holloway,来源:赛灵思中文社区论坛 Parker Holloway 在赛灵思工作仅有一年多的时间,他专注于边缘平台和加速设计工作。他对这些主题的关注来自于对 FPGA 和 ACAP 器件上以软件为中心的算法设计方法的兴趣,尤其是在计算机视觉和机器人领域。Parker 毕业于南卫理公会大学,居住在得克萨斯州达拉斯 。 导读 Ultra 96™...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 1. 测试环境 Ubuntu 16.04 PetaLinux 2019.1 PetaLinux 2019.1 ZCU106 BSP ZCU106 2. PetaLinux介绍 PetaLinux是Xilinx基于Yocto推出的Linux开发工具。Yocto是业界主流的Linux发行版的构建工具,...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 1. Vivado里关闭R5/A53/GPU 有些应用中,需要降低Xilinx MPSoC的功耗。缺省设置中,R5/GPU都被使能。如果需要省电,可以在Vivado里关闭R5/GPU。步骤如下: 选中 MPSoC IP,在右键菜单中选择Block Properties. 在窗口Block Properties中,...
本文转载自: PYNQ开源社区微信公众号 IIoT-SPYN是一个基于IIoT-EDDP开源平台和PYNQ软件框架的项目,它展示了如何在PYNQ开源框架下对电机进行控制、监视、捕获数据、可视化和分析。 上图为工程项目示意图,PL侧包含了对电机控制、状态采集的模块。在PYNQ中加载比特流后,就可以访问到这些已实现好的模块,对电机进行控制和状态检测。...
作者:范龙飞 ,文章来源:MYMINIEYE微信公众号 1. ASK信号的解调原理 振幅键控信号的解调主要有包络检波和同步检测两种方法,后者又被称为相干解调。 (1)相干解调 相干检测器组成的原理如下所示: ASK相干解调原理 由图可知,输入信号和相干载波在乘法器中相乘,然后由低通滤波滤除所需要的基带波形,然后通过判决输出解调后的基带数据,...
本文转载自: XILINX技术社区微信公众号 XAPP1247 是对应使用屏障镜像时的多重启动 (Multiboot) 和回退 (Fallback) 的示例应用。 本篇博文提供了一种屏障定时器流程测试方法以及使用此方法时可能出现问题。 屏障定时器流程测试方法多种多样,包括以下 2 种方法: 1. 移除镜像末尾部分 2. 尝试破坏同步 (Sync) 字 对于选项...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 运行 Xilinx Low Latency PL DDR XV20 HDMI Video Capture and Display,可以测试HDMI输入输出,和VCU的低延时编码。Xilinx wiki的文章MPSoC VCU TRD 2019.2 - Xilinx Low Latency PL DDR XV20 HDMI...
作者:Avinash N Bhat 得益于人工智能的发展,它在机器人、物联网和智能个人助理(如Siri和Alexa)等方面创造了惊人的发展。那什么是人工智能呢? 人工智能最简单的定义是:收集有关世界的数据,并利用这些数据进行短期和长期的预测。1996年,当IBM的国际象棋程序——超级计算机“深蓝”击败世界冠军加里·卡斯帕罗夫时,人工智能开始崭露头角。人们称之为奇迹,...
作者:付汉杰,hankf@xilinx.com,文章转载自:博客园 1. Linux的非对齐访问 Linux下,可以在设备树里保留一段内存,留给用户自己管理和使用,Linux保证不会使用保留内存。在使用中,有人发现,保留内存不能使用非对齐的方式访问。 经研究,如果在保留内存时,声明了“no-map”属性,Linux会把这段内存映射为strongly order模式,...