基于 FPGA 的 Wide & Deep 模型加速器解决方案

结合机器学习和深度学习实现的 CTR 预估模型,相较于传统机器学习,模型评估指标大幅度提升。通过 FPGA 实现模型的推断过程,大幅度提高吞吐量,降低时延,对互联网公司大规模部署推荐系统节省更多成本。适用于广告 CTR 预估、推荐系统、新零售等场景。 相较于 96vCPU 服务器,雪湖的 FPGA 加速器把吞吐量提高了 2.4 倍,时延降低了 5.7 倍,其 TOC (总体拥有成本)相较于 CPU 云下降了 5.5 倍。

最新文章

最新文章