跳转到主要内容
自动编程DNN加速器!只需3步,云端终端通用

<font color="#FF8000">作者:张晓帆</font>

美国伊利诺伊大学、IBM中国研究院等的最新研究,提出一种基于FPGA的DNN推理加速器DNNBuilder,获得电子设计自动化领域学术顶会ICCAD的最佳论文。实验证明,DNNBuilder生成的加速器拥有现时最先进的性能和效率,超越了同类加速器。本文带来论文作者的详细解读。

FPGA 编程耗时耗力,即使对专业人员来说也颇有难度。如何才能加速深度神经网络模型在FPGA上的部署?

有没有想过,要是有个能“一键自动生成”FPGA上DNN模型实现的工具就好了?

你还别说,现在还真有一款这样的工具,而且云端和边缘的设备都适用!

【数据手册】Alveo U200 和 U250 数据中心加速卡(DS962)

赛灵思 Alveo U200 和 U250 数据中心加速器卡属于符合 PCI Express Gen3 x16 的加速器卡,设计用于加速密集型计算强度应用,包括机器学习、数据分析和视频处理等。部署 Shell 能让该卡通过 PCI Express 板载存储器完成配置。

双11个性化推荐背后,阿里云“舜天”如何应对百亿次挑战?

2018天猫双11在技术世界,创下不少新记录,其中有一个记录是11日当天阿里全平台共为用户做个性化推荐453亿次,这些推荐的图片长度加起来可以绕地球70圈。

当你在天猫/手淘上买买买的时,图片会以不同格式或分辨率来转码呈现,这就要求后台系统需要强大的算力来保障数倍于平时的转码需求。FPGA是可编程芯片中处理这类并行计算的最佳能耗比方案,这位曾经高冷的“王谢堂前燕”,通过云计算的价值加成,正在赋能越来越多的科技创新。

在今年的XDF 2018大会上,阿里云的工程师首次向业界揭开了阿里云FPGA平台“舜天”的神秘面纱,这台云端计算加速的新引擎初露锋芒。

<strong>初识FPGA:计算加速新引擎</strong>

基于模型的设计 | 现代无线通信系统的研发趋势

<font color="#FF8000">作者:单博,MATLAB</font>

【优惠促销】:Alveo U200 数据中心加速器卡

<h3><font color="red">您是一名应用开发人员吗?

如果是的话,您将有机会以特优价格获得 Alveo U200!!!

立即报名参加加速器计划!</font></h3>

<strong>加 速 器 计 划</strong>

一个快速启动计划,帮助公司在云端使用 Alveo 数据中心加速器卡 和 FPGA 实现产品与服务加速。目标工作负载包括数据分析、基因组学、视频处理、机器学习、金融技术、安全与存储等。

十分钟开发自己的IoT

在本教程的带领下,你将在十分钟内学会在PYNQ-Z2板卡上使用传感器和LED开发自己的IoT应用!

<strong>初始化板卡</strong>
from pynq.overlays.base import BaseOverlay
base = BaseOverlay("base.bit")

用于数据中心工作负载的自适应加速器卡——Alveo

赛灵思 Alveo 数据中心加速器卡专为满足现代数据中心变幻莫测的需求而设计。对于常规工作负载,与 CPU 相比性能提升高达 90 倍,这其中包括机器学习推断、视频转码和数据库搜索与分析。

由于复杂算法的发展速度快于半导体设计周期,因此功能固定的 GPU 和 ASIC 器件已经无法跟上发展步伐。基于赛灵思 16nm UltraScale 架构,Alveo U200 和 U250 加速器卡可提供能适应连续算法优化的可重配置加速,在降低总拥有成本的同时,可以支持任何类型的工作负载。

支持 Alveo 加速器卡的,是面向常见数据中心工作负载的不断壮大的赛灵思及合作伙伴应用生态系统。对于定制解决方案,赛灵思应用开发者工具(SDAccel 工具)和机器学习套件,为开发者提供了将差异化应用快速推向市场的开发工具。

【视频】了解 SDSoC 工具中的评算功能

将功能移至硬件后,剩下的问题就是:加速器能否适应硬件? 它的运行速度够吗?通过估算可得出答案。
<iframe src='//players.brightcove.net/17209957001/SywTPUVC_default/index.html?videoId=5841647867001' allowfullscreen frameborder=0 width="600" height="338"></iframe>

SC18:Xilinx 全面展示自适应加速、部署就绪型解决方案

赛灵思将在 2018 年超级计算大会第 927 号展台上展示 Alveo U280 面向数据库散列连接查询可实现的 8 倍加速,以及搭载 Alveo U200 的戴尔 EMC PowerEdge 服务器。更多展台演示还包括:

<strong>展 位 亮 点</strong>
> IBM PowerAI 视觉助力实现推断加速

该演示将展示简化的计算机视觉。了解如何在集成 Xilinx ML 套件进行推断的同时,在 IBM Power 系统上训练和部署模型。

> 高密度计算服务器中的推断加速

会议预约:Xilinx 深鉴 AI 专家坐镇高交会展区

2018年11月14-18日,中国国际高新技术成果交易会(简称高交会)将在深圳会展中心举办。在本届高交会上,赛灵思深鉴 AI 技术专家将向您现场展示最新的八大人工智能和机器学习方案,同期还有高效定制化 AI 方案的主题演讲。诚邀您的光临!

<strong>时间:2018 年 11 月 14 - 18 日</strong>
<strong>地点:深圳市福田区会展中心 1 号馆 | 1A35</strong>

Xilinx进一步巩固数据中心领导地位 发布新款 Alveo U280 HBM2 加速器卡 Dell EMC率先认证Alveo U200

<font color="#FF8000">Alveo系列和搭载 U200 的戴尔 PowerEdge 服务器将在 2018 年超级计算大会 ( SC18)上演示</font>

【视频】QEMU 仿真

视频描述了如何在 SDx IDE 中使用仿真功能。
<iframe src='//players.brightcove.net/17209957001/SywTPUVC_default/index.html?videoId=5841644739001' allowfullscreen frameborder=0 width="600" height="338"></iframe>

十分钟开发自己的AI

在本教程的带领下,你将在十分钟内学会在PYNQ-Z2板卡上使用二值化神经网络开发自己的AI应用!

1. AI初学者入门第一步:分类
AI入门第一步就是对输入的图片进行分类。首先我们需要初始化一个分类器,根据最终实现分类目标的不同需要选择不同的数据集。我们可以在‘road-signs','streeview'和‘cifar10’三个数据集中选择其一,这里选择的是'road-signs'交通标志数据集。

import bnn
print(bnn.available_params(bnn.NETWORK_CNVW1A1))

Zynq UltraScale+系列之“外围接口概述”

<font color="#FF8000">作者:XCZ,来源:硬件助手</font>

本篇主要介绍ZU+系列MPSoC的外围接口,针对每个接口进行概述性介绍,后续会针对个别接口进行详细介绍原理图设计和PCB设计。

Xilinx ZYNQ 7000+Vivado2015.2系列(五)之ZYNQ的三种启动方式-JTAG、SD card、Flash

<strong>前言:</strong>

前面我们都是使用JTAG方式下载比特流文件,然后下载elf文件,最后点击Run as或者Debug as来运行程序。JTAG方式是通过tcl脚本来初始化PS,然后用JTAG收发信息,优点是可以在线调试,缺点是断电后程序就丢失了。为了解决程序丢失的问题,可以制作镜像文件烧写到sd卡或者flash中,上电即可加载程序。

ZYNQ有两大类启动模式:从BootROM主动启动,从JTAG被动启动。

在没有外部JTAG的情况下,处理系统(PS)与可编程逻辑(PL)都必须依靠PS来完成芯片的初始化配置。即借助CPU来完成配置,这也是ZYNQ系列的不同之处。

板子依然使用的是zc702.

独家专访:华裔CEO临危受命,Xilinx 10亿美元大杀器搏命英特尔/英伟达

他是技术出身的华人CEO兼总裁;他是被Xilinx董事长称为公司过去十年创新的规划者,他是笑傲数十重量级高竞争对手的勇者,他想重新定义FPGA的未来!

为了抗衡英特尔和英伟达,数年磨一剑的秘密武器悄然出鞘。超过10亿美元研发投入,1500人历经5年的智慧结晶,台积电最先进7纳米工艺支持。

<font size="3"><strong> 巨头的PK</strong></font>

作为FPGA的发明者,作为全行业最难设计芯片的拥有者,Xilinx一直都在王者荣耀,独孤求败。30多年来,无论是Altera,Lattice,Microsemi,Quiclogic,以及被玩丢的Agere等,都没有对它造成过真正的威胁。

xilinx zynq RapidIO系统配置

参考

书籍《RapidIO The Embedded System Interconnect》
xilinx手册pg007《Serial RapidIO Gen2 Endpoint v4.1 LogiCORE IP Product Guide》
Zynq-Linux移植学习笔记之14-RapidIO驱动开发

<font size="3"><strong>host初始化</strong></font>

直接看RapidIO的初始化,一些底层的比如物理层链路层之类的不需要关心,用到了再去看,毕竟都是基于芯片或者IP来开发。先从高层了解这个过程。

<strong>系统启动过程概述</strong>

Python这么火,编码风格不可不知!

<strong>分号</strong>
Tip
不要在行尾加分号, 也不要用分号将两条命令放在同一行。

<strong>行长度</strong>
Tip
每行不超过80个字符

例外:
1. 长的导入模块语句
2. 注释里的URL

不要使用反斜杠连接行。

Python会将 圆括号, 中括号和花括号中的行隐式的连接起来 , 你可以利用这个特点. 如果需要, 你可以在表达式外围增加一对额外的圆括号。

嵌入式工程师如何用好GitHub

这年头GitHub可谓是程序员必备交友技能。毫无疑问GitHub现在已经是全球最大的开源社区了,也常常被人戏称为“全球最大同性交友平台”。

你可以在这里follow各种开源社区的技术大牛,学习到各种各样的开源技术和开源项目。

那么作为一个嵌入式工程师,我们应该如何用好GitHub呢?GitHub可以用来做些什么好玩有意思的事情呢?

<font size="3"><strong>追随开源项目</strong></font>

要说在嵌入式方面应用最广的是什么,大家一定不会忽略Linux。

借助vivado来学习FPGA配置模式

DA(Vivado)软件可以很好的帮助我们更好的去学习FPGA相关知识,例如: