VCK5000 开发者开箱初体验

本文作者:赛灵思开发者 李阳

VCK5000对于大多数开发者来说仍然是非常新的一款器件,由于VCK5000目前主要应用在数据中心进行AI推断方面的运算加速,所以开发者们对其性能和部署方式非常好奇,部分开发者通过官方硬件租借或者参加比赛能方式获取了提前上手实验的机会,来听听他们的开箱报告:

又是一年自适应计算挑战赛,今年和往年一样依旧有多条赛道可以选择,分别是边缘计算、数据中心AI和大数据分析三个赛道,每条赛道均有机会获得最高10000美元的奖励。

今天要说的VCK5000加速卡就是数据中心AI赛道指定的参赛硬件。Xilinx VCK5000开发卡专为需要高吞吐量 AI 推理和信号处理计算性能的设计而设计。Xilinx表示您可以在几分钟内使用 Python 或 C++ API 运行 Tensorflow、Pytorch、Caffe 模型,而无需任何有关 FPGA 的硬件知识(这句话暂时存疑)。当然如果有其他Avleo板卡例如U50、U200、U250、U280参赛官方也是承认的。

硬件外观

刚收到VCK5000的包裹,激动和兴奋的心情按下不表,对它第一印象是沉,拿在手里感觉比一般显卡都要沉。做工异常扎实。我和公司的涡扇3090对比了一下,VCK5000方正得多,线条更硬朗。

和显卡一样,这张加速卡也需要单独供电。后边的两组供电线(6pin+8pin)不光是为风扇供电的,也为整个板卡供电。不过板卡本身可以在拆掉风扇,在有风道的服务器机箱中作为被动散热卡。

这里小小的吐槽下这个风扇,太暴力啦,声音有点大,不太适合家用。建议官方能考虑下涡扇版本的散热方式呀,这样噪声可能会控一点,应该也不会影响散热性能。毕竟FPGA加速卡的整体功耗是要比显卡低的。为了追求严谨(其实是风扇太吵了),我把风扇部分拆开看了下,风扇维护和更换还是很方便的。

安装

家里的机箱主板上需要有多的两条PCIE槽空间,从显卡供电那里分出一条6pin一条8pin的供电线,硬件就算安装完成了。不过呢,公司刚好有台线程撕裂者的服务器,机箱里还有几条pcie空位。我就先拿这台服务器来试试(年轻的我还不知道这里埋了个大坑)。


环境要求

最开始想在windows中使用WSL或虚拟机驱动这个卡,这样省的换linux操作系统。但是windos中能识别到卡,但是没有相应地驱动,也就不能虚拟化,所以WSL和虚拟机的方式就都不行了。

重新买了块ssd安装Ubuntu20.4,更换好显卡驱动,安装好CUDA,使用pytorch测试下,显卡调用没问题应该基础环境就差不多了。

这里提一下,如果有条件为使用这张加速卡重新装一个系统的话,这里是官方验证过的系统版本。因为从大多数反馈的问题来看,遇到最多的就是xrt安装时linux版本不匹配的问题。所以有条件更换系统的话,将会是更顺利的方式。

为避免看到这篇文章的时候信息过时了,贴个链接:
https://support.xilinx.com/s/article/XRT-Xilinx-Runtime-version-2021-2-2...

接下来就是按照github中的流程安装xrt,如果你使用的不是上面提到的验证过的linux版本,特别是linux内核版本。你大概率不能一次完成安装流程,最有可能出现问题的地方是安装xrt出问题,我使用的是ubuntu20.04.03.需要把内核降级到5.8,然后手动编译xrt源码的方式安装xrt。
还是那句建议,如果有条件直接更换上面列表中的系统,会顺利得多。

安装好加速卡,确认下是否能识别到卡:

中断号和官方的例子一致,不过我的没有Size=64M的那个memory。下面的xrt也没显示,这个就是典型的xrt没有安装成功。

如果你是自己编译xrt安装的话,还有可能会遇见使用vitis-ai git中提到的命令不能使用的情况。像下面这样:

这个一般是编译的xrt版本太高了,Git的描述里的xrt使用的还是旧版的命令,解决办法是在使用旧版命令时加上 --legacy 关键字。就像下面这样:

Vitis AI 环境安装

理论上讲,使用VCK5000加速卡,可以完全没有FPGA的经验,在烧写完板卡固件之后,它应该像显卡一样使用,不过仅限于神经网络的推理,目前好像还不太适合训练。

Vitis AI 提供了现成的docker无论是cpu环境还是gpu环境都可以支持caffe、tensorflow、tensorflow2和pytorch。

并且提供了多个通用网络的例子,例如vgg、resnet、yolo等否有对应的例子。

如果使用第三方的网络,或者自己训练的网络。Vitis AI 中提供了从网络框架一直到编译加速卡执行文件的全流程,包括AI库、性能分析、量化、运行时等四大工具。

总结

拿到VCK5000,看了外观、配置软硬件环境、安装上电。虽然加速卡还没完全驱动起来,不过看到软件安装流程现在封装的都很好,几乎是一键操作(如果系统及内核版本对的话)。后期还需要跑一跑zoo的例子,具体感受下它的性能。后期会再用自己的网络尝试量化部署流程,应该就会对这块板卡有更多深入的体会。

本文转载自: XILINX开发者社区微信公众号

最新文章

最新文章