AI推理

第二代 Versal AI Edge 系列器件能够高效处理摄像头、雷达、激光雷达等多类传感器数据，而且兼具出色的灵活性与可扩展性，可实现传感器无缝接入。

今天我们用技术视角深度解读：为什么FPGA能做到这些？GPU在LLM推理上遇到了哪些系统性问题？

Achronix 正式推出基于 FPGA 架构的 VectorPath 815 AI 推理设备，专为低延迟场景优化 Llama 3.1 8B 模型推理。

在硅谷，几乎每周都有新的AI芯片故事上演。但今天这家刚结束隐身期的公司，讲的故事有点“反直觉”。

随着AI应用的迅猛发展，端侧推理正受到前所未有的关注。与数据中心对极致吞吐的追求不同，端侧推理更聚焦于低延迟、低功耗与高可靠性

FINN：FPGA AI 推理新范式 —— 定制化、高性能、量化神经网络编译器框架

由 judy 提交于周一, 22 十二月 2025 - 10:18

FINN 是一个由 Xilinx（现 AMD Research）集成通信与 AI 实验室开源的机器学习框架，它提供了一个端到端的方案，用于探索和实现量化神经网络（QNN）在 FPGA 上的高效推理加速器

在 AI 大模型时代，训练算力固然重要，但真正掣肘产业落地的往往是推理环节。企业每天处理海量请求，低延迟、高吞吐、成本可控的推理系统，才是 AI 商业化落地的关键。

当前，AI 推理正加速从云端走向边缘。过去，我们依赖云端强大的算力处理 AI 任务；现在，低延迟、高隐私和高能效的应用需求

由 judy 提交于周一, 28 十月 2024 - 09:28

今天看的这篇论文，是一篇关于FPGA和ASIC在大模型推理加速和优化方向的综述，我们看下目前的研究进展。

Altera最新发布的Agilex 3 FPGA系列吸引了行业内广泛关注，这不仅是因为其出色的硬件设计，还在于它针对嵌入式应用提供了高效的AI推理支持和安全保障