跳转到主要内容
【白皮书】Versal: 首款自适应计算加速平台 (ACAP)

近来涌现的技术挑战迫使业界跳出传统的通用(one-size-fits-all)型CPU标量处理解决方案,进而探讨新的发展方向。大型的矢量处理(DSP-GPU)技术能够解决一些问题,但由于其灵活性欠佳及低效率存储器带宽的使用,导致再次陷入了传统的扩展挑战。传统FPGA解决方案提供可编程存储器层级,但传统的硬件开发流程一直是阻碍数据中心市场等应用领域广泛、大规模采用FPGA的障碍。

该解决方案将所有这三大要素与一个新的工具流相结合,通过单个自适应技术加速平台(ACAP),提供了从框架到C到 RTL级编码的各种不同抽象。赛灵思Versal ACAP作为一大新器件门类,支持用户利用三大可编程要素定制自己的特定领域专用架构(DSA)。

Xilinx推出全球最快的数据中心和AI加速器卡

<font color="#FF8000">性能超越 GPU 4 倍,超 CPU 90 倍,并可针对不同工作负载提供前所未有的灵活应变能力</font>

Xilinx推出首款新类别平台—— Versal : 利用软件可编程性与可扩展的 AI 推断技术支持快速创新

赛灵思开发者大会 (XDF) —自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))首席执行官 Victor Peng 宣布推出 Versal™ – 业界首款自适应计算加速平台 (Adaptive Compute Acceleration Platform ,ACAP),从而为所有的开发者开发任何应用开启了一个快速创新的新时代。Versal ACAP 整合标量处理引擎、自适应硬件引擎和智能引擎以及前沿的存储器和接口技术,能为所有的应用提供强大的异构加速功能。不过,最重要的是, Versal ACAP 的硬件和软件均可由软件开发者、数据科学家和硬件开发者进行编程和优化,这要归功于其符合业界标准设计流程的一系列工具、软件、库、IP、中间件和框架。

魔视智能在Xilinx开发者论坛宣布:辅助自动驾驶产品领先在一线乘用车主机厂量产

魔视智能,嵌入式人工智能自动驾驶领导者,在赛灵思开发者论坛( XDF)宣布基于魔视智能先进的嵌入式深度学习技术的辅助自动驾驶产品已经领先在国产一线乘用车主机厂项目上正式量产落地。XDF是一个连接软硬件及系统开发者与赛灵思及合作伙伴和业界领袖并进行深度交流的行业盛会。

魔视智能已经在和包括比亚迪,北汽新能源,一汽,众泰等国内的一线整车主机厂进行不同LEVEL等级,面向多个产品方向,满足多个应用场景的自动驾驶项目合作。魔视智能还和包括转向和刹车执行器,智能网联,仪表,新能源动力系统总成,雷达在内的多个一级体系供应商进行多种形式的深入产品合作。到目前为止,魔视智能已经和18个主机厂OEM及TIE1进行量产和产品研发合作,已有包括乘用车和商用车在内的9个项目正式定点。自18年6月正式批量量产至今,累计出货已经超过万台规模。

详细揭秘赛灵思第一款ACAP产品Versal

在今天赛灵思开发者大会北京站上,赛灵思CEO发布了第一款7nm工艺的ACAP平台第一款产品Versal,赛灵思产品技术营销高级总监Kirk Saban详细介绍了这款产品。
<center><img src="http://www.eetrend.com/sites/default/files/inline-images/1_1533.jpg&quot; alt="" width="670"></center>

Xilinx助力Aupera带来互联网视频处理颠覆式创新

Aupera科技,一家专注于视频处理创新的科技公司,在赛灵思(Xilinx, Nasdaq: XLNX)开发者大会上公布其Aup2600系列视频处理平台正式商用,该系统基于赛灵思最新发布的Zynq® UltraScale+™ MPSoC芯片,旨在解决目前视频应用规模增长时面临的诸多挑战,包括海量视频实时编解码以及视频内容实时分析。

AuperaTM Aup2600 系列是一套分布式计算架构视频处理系统,其去中心化,打破传统x86架构瓶颈,将颠覆现有数据中心的视频处理格局。单台设备配置高达48个Zynq® UltraScale+™ MPSoC处理引擎,可并行处理380路H.264/H.265高清视频码流,实现单位能耗相同下相比传统方案33倍的性能以及1/10机架空间的压倒性优势。

Xilinx:让FFmpeg在FPGA上玩的爽

<font color="#FF8000">作者:Sean Gardner,来源:LiveVideoStack</font>

FPGA让企业和开发者有了新的选择,尤其在高运算复杂度和实时音视频场景下。不过FPGA也会带来较高的学习和开发难度,Xilinx的高级市场经理Sean Gardner告诉LiveVideoStack,Xilinx几年前就启动了FPGA对FFmpeg支持的项目,让FFmpeg开发者可以学习和使用FPGA。

<strong>LiveVideoStack:你好Sean,请向我们LiveVideoStack读者介绍下自己及加入Xilinx的相关背景。</strong>

MPSOC之9——host、embeded间tftp、nfs、ftp环境搭建

tftp
可传输单个文件,不能传文件夹
需要通过命令传输文件,略显复杂
==一般调试kernel时,用uboot通过tftp方式启动,不用每次都烧写存储介质==

nfs
在host linux(ubuntu)上的nfs文件夹中存放文件
开发板上mount ubuntu的文件夹,mount后就像自己的文件一样
这种方式共享文件很方便
也有linux启动后,拿nfs作为根文件系统,方便调试根文件系统的内容

ftp
没有host linux环境时,可以把windows当成ftp client,开发板ftp server
方便拖动文件

XDF 小助来了!参会任何问题可以随时召唤我来帮忙

大家好,我是 “XDF小助”,首先欢迎各位参加即将在明天拉开帷幕的 XDF(赛灵思开发者大会)。在参会期间,如果您需要帮助的时候,请召唤我吧,我将竭诚为您服务......
<center><img src="http://xilinx.eetrend.com/files-eetrend-xilinx/news/201810/13760-40022-…; alt=""></center>

Vivado(2017.1)中 BRAM IP核的配置与使用(1)

  Xilinx公司的FPGA中有着很多的有用且对整个工程很有益处的IP核,比如数学类的IP核,数字信号处理使用的IP核,以及存储类的IP核,本篇文章主要介绍BRAM  IP核的使用。

    BRAM是FPGA定制的RAM资源,有着较大的存储空间,且在日常的工程中使用较为频繁。BRAM以阵列的方式排布于FPGA的内部,是FPGA实现各种存储功能的主要部分,是真正的双读/写端口的同步的RAM。

    本片文章是基于Vivado的 2017.1的版本,其他版本都大同小异。

赛灵思与华为率先在华推出云端实时视频流解决方案

<font color="#FF8000">赛灵思 FPGA 助力 NGCodec H.265 标准尽快进驻华为云</font>

赛灵思公司(Xilinx, Inc.,(NASDAQ: XLNX))、华为和 NGCodec 今天宣布开发中国首款云端高效率视频编码 (HVEC) 解决方案。该解决方案独家采用赛灵思 Virtex UltraScale+™ FPGA 和 NGCodec 的全新 H.265 视频编码器。该技术将进驻华为云 FACS(FPGA 加速云服务器)并在年底前投入使用。这将在中国的可扩展云基础设施中实现首个使用FPGA的广播质量级的实时流媒体解决方案。

Vivado使用技巧(21)——仿真中的Debug特性

<strong>源代码级别调试</strong>
Vivado Simulator提供了在仿真过程中debug设计的特性,通过为源代码添加一些可控制的执行条件来检查出问题的地方。总的来说有三种调试方法:

Xilinx+AWS F1+VP9带来30倍实时转码性能提升

<strong>在实时、海量、高并发视频的场景下,FPGA加速找到了自己的发展空间,弥补了VP9在编码复杂度方面的不足,专利费的优势也得以体现。</strong>

Xilinx基于PCIE的部分重配置实现(一)

本博文主要是对基于PCIE(mcap)的部分可重构实现的步骤做一个简单的演示,如有错误之处,欢迎批评指正。值得说明的是,基于PCIE的部分可重构需在ultrascale系列及ultrascale+芯片才能实现,具体哪些系列能实现哪种配置方式如下图所示:
<center><img src="http://xilinx.eetrend.com/files-eetrend-xilinx/blog/201810/13754-39975-…; alt=""></center>

Alveo U250 数据中心加速器卡

Xilinx® Alveo™ U250 数据中心加速器卡旨在满足现代数据中心不断变化的需求,为重要工作负载(包括机器学习推断、视频转码和数据库搜索与分析)提供比 CPU 高 90 倍的性能。Alveo 加速器卡建立在 Xilinx 16 nm UltraScale™ 架构基础之上,能适应不断变化的加速要求和算法标准,能在不改变硬件的情况下,加速任何工作负载,并能降低总体拥有成本。

启用 Alveo 加速器卡是 Xilinx 及合作伙伴应用的一个生态系统,主要面向数据中心的工作负载。对于定制解决方案,Xilinx 应用开发工具套件 (SDAccel™) 和机器学习套件可为开发人员提供将差异化应用推向市场的各种工具。

<strong>主要性能和优势</strong>

MPSOC之8——启动及错误处理

有了BOOT.BIN(fsbl+pmu+atl+uboot)、uImage、uramdisk.image.gz,dtb文件,就可以启动了。把上述文件统统拷贝到SD卡,并设置开发板为SD卡启动。

0. U-BOOT启动参数
设置启动参数,然后启动
fatload mmc 0 0x1000000 uImage;fatload mmc 0 0x2000000 uramdisk.image.gz;fatload mmc 0 0x4000000 zynqmp-sf-zcu102.dtb;
setenv bootargs root=/dev/ram0
bootm 0x1000000 0x2000000 0x4000000

将上述参数固化到flash里,免得每次都要输入

学会System Generator(22)——图像采集与输出(数据流方法)

本文是该系列的第22篇。上一篇介绍了使用Image From File和Video Viewer完成图像的采集和输出,并将两部分分别打包为子系统,使其具有通用性。本文将介绍如何使用Simulink提供的回调函数机制,实现从MATLAB工作空间采集和输出图像。

ZYNQ的Linux开发--使用SDK生成设备树

开发环境:
Windows下的Vivado套件
Linux ubuntu

Step1:首先从Xilinx GitHub上下载Device Tree Generator(设备树生成器)的BSP https://github.com/Xilinx/device-tree-xlnx/pulls 并将其复制到SDK的安装目录下

Alveo U200 数据中心加速器卡

Xilinx® Alveo™ U200 数据中心加速器卡旨在满足现代数据中心不断变化的需求,为重要工作负载(包括机器学习推断、视频转码和数据库搜索与分析)提供比 CPU 高 90 倍的性能。Alveo 加速器卡建立在 Xilinx 16 nm UltraScale™ 架构基础之上,能适应不断变化的加速要求和算法标准,能在不改变硬件的情况下,加速任何工作负载,并能降低总体拥有成本。

启用 Alveo 加速器卡是 Xilinx 及合作伙伴应用的一个生态系统,主要面向数据中心的工作负载。对于定制解决方案,Xilinx 应用开发工具套件 (SDAccel™) 和机器学习套件可为开发人员提供将差异化应用推向市场的各种工具。

<strong>主要性能和优势</strong>

PYNQ 和 ZYNQ 对比

PYNQ = Python + ZYNQ —— ZYNQ部分功能的Python化

<strong>PYNQ</strong>

优点:

1、 Python用于ZYNQ开发,Python库和FPGA硬件库可以直接调用,极大加快开发进程、缩短开发周期、降低开发难度,更方便、快捷;

2、 用PYNQ开发,当Python有更加有效的可用库时(如图像处理—OpenCV),其性能要比C/C++开发更强。

缺点:

目前,PYNQ还不支持任何高级的综合,也无法将Python应用直接移植到FPGA中,仅能调用已有库。

<strong>ZYNQ</strong>

优点: