技术

【分享】在Linux用户态使用MPSoC AES 加密加速器

文档Using Cryptography in Zynq UltraScale MPSoC提供了在Linux用户态使用MPSoC AES 加速器的例子。如果要使用Device key或者PUF key，需要使用Xilinx Linux 2020.1。Xilinx Linux 2020.1增加了选择密钥类型的功能。

暑期学校优秀项目分享|手写体数学公式计算器

本项目主要设计了一个手写体数学公式的计算器，其主要功能包括：首先从USB摄像头或者SD卡上存储的图片数据获取图像的输入，随后在Arm核上将其转变为单通道灰度图像，然后根据像素阈值确定图像内可能存在数字或者数学符号的区域，并将该区域的像素点提取出来

Transformer量化笔记（二）

相比于训练后量化方法，将量化过程插入到训练中可以弥补量化产生的误差，但是带来的问题可能是增加了训练的时间。在tansformer的量化实现中，我们采用了训练中量化的方法，在网络前向传输中，对权重等参数进行线性量化。

开发者分享 | 如何动态更改 UltraScale/UltraScale+ GTH/GTY 线速率

本篇博文主要讲解了动态更改 UltraScale/UltraScale+ GTH/GTY 收发器线速率设置的方法。

手把手教你设计一个属于自己的AXI接口IP

在FPGA程序设计的很多情形都会使用到AXI接口总线，以PCIe的XDMA应用为例，XDMA有两个AXI接口，分别是AXI4 Master类型接口和AXI-Lite Master类型接口，可通过M_AXI接口对数据进行读取操作，此时设计一个基于AXI-Slave接口的IP进行数据传输操作就非常的方便

【分享】在PL设计中使用MPSoC EMIO GPIO，并使用脚本设置MPSoC EMIO GPIO

MPSoC 为PL提供了96个GPIO，通过EMIO管脚链接到PL。普通PL设计，一般只会用到几个GPIO管脚。可以使用Vivado IPI中的Slice IP，从其中分出指定数量的管脚。

Python 初学者进阶的九大技能

Python是一种很棒的语言，语法简单，无需在代码中搜索分号。对于初学者来说，Python是入门最简单的语言之一。Python有大量的库支持，你还可以安装其他库来增加自己的编程经验。学了一阵子之后，你可能会觉得：为如此简单的操作写大量的代码有些令人困惑。

ZCU106使用VCU TRD的MIPI的例子

在ZCU106上，使用VCU TRD的MIPI的例子，可以从MIPI摄像头采取图像数据，并使用GStreamer推送到HDMI显示器上。

周末创客| 与DPU-PYNQ玩石头剪刀布

本案例主要基于DPU-PYNQ来实现一个常见的手势识别--石头剪刀布，目的是让大家了解如何使用DPU开发深度学习应用的整个流程。本案例分为三个部分：分别是PC模型训练、VitisAI模型编译、Edge模型部署三个部分。

【开发者分享】利用 RQA 和 RQS 实现设计收敛

通过之前的博文，我们已经学会了如何使用 Report QoR Assessment (RQA) 和 Report QoR Suggestions (RQS) 来改进总体设计分析以及设计的时序收敛体验。本篇博文将通过一个具体设计示例来演示如何在实现流程中将 RQA 与 RQS 结合使用。

【分享】MicroBlaze大内部存储器（AXI BRAM）设计

MicroBlaze可以使用AXI BRAM存放数据和指令。有些客户软件很大，需要把AXI BRAM的空间做到最大。AXI BRAM底层是Block RAM或者Ultra RAM。器件的Block RAM或者Ultra RAM个数，决定了AXI BRAM的大小。在ZCU106单板上，有312个Block RAM，有96个Ultra RAM。客户需要1MB存储空间。

2020 DAC-SDC亚军作品开源与技术访谈

来自上海科技大学的SkrSkr队脱颖而出获得亚军。作品以2019年DAC-SDC的双料冠军iSmart3的开源方案为基础，进行了量化算法、加速器以及系统三个层级的优化，实现了速度x2.4，精度+1.5%，能效x1.4

开发者分享 | 使用 Report QoR Assessment 命令

Report QoR Assessment (RQA) 用于详述您的设计 QoR 目标实现的可能性。如果此命令返回的结果与您的期望不符，那么本篇博文包含了有关您可采取的后续行动的附加信息。本篇博文不仅适合首次使用这些命令的新用户，对于有经验的用户应该同样很实用。

开发者分享 | 远程共享和访问赛灵思器件

在某些情况下，比如远程工作时，可能需要访问本地不可得的器件。本篇简介教程演示了如何共享并访问位于远程实验室内的开发板或归同事所有的开发板。

Transformer量化笔记（一）

AI芯片优化主要有三个方面：算法优化，编译器优化以及硬件优化。算法优化减少的是神经网络的算力，它确定了神经网络部署实现效率的上限。编译器优化和硬件优化在确定了算力的基础上，尽量最大化硬件的计算和带宽性能。经历了一年多的理论学习，开始第一次神经网络算法优化的尝试。之所以从一个FPGA开发者转向算法的学习，有几个原因

周末创客| ORB-SLAM算法加速

ORB特征是一种图像识别、追踪和匹配中常用的特征，大名鼎鼎的ORB-SLAM就是使用的这一特征。它提取FAST特征点，并通过特征点附近的窗口矩计算特征点的方向，含方向的FAST特征也被称为oFAST特征。对提取到的oFAST特征，进一步计算BRIEF描述子。ORB特征包含了两部分，一是特征点位置，二是它的BRIEF 256位描述子

5G 应用中集成射频硬件的表征

一些 5G 系统的制造商正在转向更高水平的硬件集成，并在片上系统(SoC)设备中整合射频转换器和基带处理引擎，以解决功耗和电路板空间问题。虽然这种集成有好处，但负责这些系统表征的工程师面临着访问数据的新挑战，因为之前的独立射频数据转换器现在将与 FPGA 和处理器在同一芯片上进行组合

开发者分享 | 利用 RF Data Converter 保持同步

现代 RF 信号链对于跨多通道的数据转换器性能具有极高的要求。换言之，对于赛灵思 RF Data Converter 而言，关键要求之一是在多个 ADC/DAC Tile、RFSoC 器件甚至开发板之间都必须保持同步。了解赛灵思如何探索多块同步 (Multi-Tile Synchronization) 问题解决之道

VMWare 在 vSphere 上验证 Alveo FPGA 的机器学习推断性能

近期，在推动 IT 基础设施向异构计算转型的过程中，赛灵思与 VMware 展开协作，在 VMware 的云计算虚拟化平台vSphere上测试 FPGA 加速。由于赛灵思 FPGA 越来越广泛地应用于 ML 推断加速，本文将展示的是如何将赛灵思 FPGA 与 VMware vSphere 相结合，在虚拟部署和裸机部署上实现基本相同的高吞吐量、低时延 ML 推断性能。

【分享】OpenAMP的RPMSG_ADDR_ANY含义

在OpenAMP的应用程序中，经常看到地址被设置成RPMSG_ADDR_ANY。在通信过程中，为什么可以把源地址、目的地址设置成任意值？这个宏的名字不够清楚，它的本意是让系统自动选择。如果设置源地址为RPMSG_ADDR_ANY，则系统自动选择一个空闲的源地址。

首页
前一页
…
70
71
72
73
74
75
76
77
78
…
下一页
末页