Lattice Nexus 2平台:低功耗、高性能、小尺寸FPGA再创新高

摘要 

小型FPGA平台通常是指逻辑密度低于200K SLC(系统逻辑单元)的FPGA,这正是莱迪思FPGA的优势所在。莱迪思Nexus™ 2 FPGA平台基于16 nm工艺节点。本文介绍了莱迪思Nexus 2平台在推出时与其他现有的同类FPGA的比较分析。分析包括功耗、启动时间、尺寸和安全特性。本白皮书探讨了这些因素如何影响总体拥有成本(TCO)和各种应用。

1. 引言

莱迪思半导体于2019年推出了Lattice Nexus™平台,为低功耗、小尺寸FPGA设定了新标准。在这一成功的基础上,莱迪思Nexus™ 2平台进一步增强了这些功能,与竞品相比,在功耗、尺寸、启动速度和安全性方面有了显著的提升。本白皮书探讨了莱迪思Nexus 2平台相对于市场上同类FPGA竞品器件的主要优势,并重点介绍了莱迪思Nexus 2器件加入莱迪思小型FPGA产品组合中后拓展了哪些应用。

2. Lattice Nexus 2拓展了逻辑和性能

2.1莱迪思Nexus 2平台的新功能

莱迪思Nexus 2平台通过扩展其逻辑密度和性能,对原有的Nexus平台进行了补充。一般来说,莱迪思Nexus 2器件的逻辑密度、SERDES带宽和外部存储器接口速度接近原来的2倍。下表重点介绍了两者的差异:

1.png


Lattice Nexus 2的强大性能可以带来以下好处:

  • 更高的数据吞吐量:更高的SERDES带宽和支持PCI Express可实现更快的数据传输速率,这对高带宽数据和视频桥接应用至关重要。 

  • 提高存储性能:更高的LPDDR4数据传输速率有助于更快地访问存储器,提高整体系统性能并降低延迟。 

  • 更快的闪存配置:将闪存接口宽度从4增加到8,并将单倍数据速率(SDR)提高到双倍数据速率(DDR),即使在逻辑密度增加的情况下也能保证瞬时完成配置。 

  • 增强时序收敛:优化时序收敛为布局布线提供了更大的灵活性,降低了延迟,提高了资源利用率,从而支持更复杂的应用。 

  • 单位逻辑更多的DSP:更多的DSP模块允许对复杂算法、视频处理和网络边缘人工智能推理进行更多并行操作,降低延迟,从而提高应用的实时性能。

凭借莱迪思小型FPGA产品组合中的这些扩展功能,开发人员可以选择从莱迪思Nexus或Nexus 2平台中挑选最佳器件来满足他们的设计目标。

3. Lattice Nexus 2平台的主要竞争优势 

莱迪思是小型FPGA领域的领导者。莱迪思Nexus FPGA系列(莱迪思CrossLink™-NX、莱迪思Certus™-NX和莱迪思MachXO5™-NX)支持各类注重低功耗、小尺寸和需要降低总体拥有成本(TCO)的应用。莱迪思Nexus 2平台继续强调这些特性,与竞品相比具有多项竞争优势: 

  • 外部闪存启动速度提高20倍:确保快速启动、缩短响应时间和即时故障恢复,这些都是高可靠性系统的重要要求。 

  • 功耗降低高达3倍:莱迪思Nexus 2平台的优化架构与同类FPGA竞品相比,功耗最多可降低3倍。 

  • 尺寸最多减小5倍:莱迪思Nexus 2拥有16 Gbps SERDES,尺寸比竞品小5倍。开发人员可以在更小的PCB上自由地放置器件。 

  • 简化电源管理:莱迪思Nexus 2器件使用简化的供电网络(PDN),无电源时序要求。 

  • 同类产品中最强的安全性:莱迪思Nexus 2集成了先进的安全特性以抵御潜在威胁,确保数据完整性和器件可靠性。功能包括AES-GCM、SHA-3、ECDSA和RSA。

莱迪思通过硬件测试以及比较产品数据表和用户指南中的参数对上述内容进行了验证。 

3.1 竞品比较和应用实例

在对比与竞品器件的性能时,莱迪思选择了AMD的Artix™ Ultrascale+ AU20P、Altera的Cyclone® 10GX 220和莱迪思Certus-N2 CT20 FPGA。比较的重点是功耗、尺寸、配置时间和总拥有成本。结果表明,莱迪思Certus-N2 CT20 FPGA在所有这些方面都优于竞品。 

3.2 快速的外部闪存配置

在任何设计中,快速配置都是至关重要的,尤其是在安全性至关重要的环境中,如生产车间或仓库中的机器人。为确保工人安全,所有系统都必须具备即时故障恢复能力。如果系统出现故障,需要立即恢复,这依赖于设计的启动速度。例如,如果智能传感器发生故障,它必须几乎在瞬间恢复运行,继续监控生产现场的安全状况。 

同样,在汽车分区网关中,系统必须迅速唤醒响应外部事件,确保驾驶员和乘客的安全。支持快速启动的设计可以在大部分时间内保持低功耗状态,并对唤醒信号迅速做出反应,提高整体效率和安全性。 

3.2.1 比较配置速度 

测量闪存配置速度的方法如下: 

  • 所有设计均基于RTL(寄存器传输级)。没有随机存储器初始化,这增加了配置文件的大小。 

  • 配置镜像是未压缩的纯位流。 

  • 无位流验证。 

  • 器件仅使用单个配置闪存来模拟最低BOM。 

  • 配置时间是从INIT有效(不包括各种电源轨的上升时间)到DONE(完成)信号引脚有效的时间。

结果如下表所示:

2.png

测量结果表明,莱迪思Certus-N2 CT20器件比竞品最高快20倍。这是莱迪思Nexus 2平台的一个显著优势。 

3.2.2 影响FPGA启动时间的因素 

有几个因素会影响FPGA从外部闪存进行配置的时间: 

  • 闪存速度:闪存的读取速度直接影响到向FPGA传输配置数据的速度。 

  • 时钟频率:配置过程中使用的时钟频率会影响数据传输速率。 

  • 接口类型:闪存和FPGA之间使用的接口类型(如SPI、并行、接口宽度)都会对数据传输速率产生重大影响。

  • 配置数据大小:更大的位流需要更长的传输和配置时间。 

让我们对每个因素进行分析,了解为什么莱迪思Certus-N2比竞品器件启动得更快。 

3.2.3 莱迪思Certus-N2如何实现更快启动? 

所有三种FPGA都使用其最大内部配置时钟频率,通过类似的闪存结构进行配置。然而,莱迪思Certus-N2器件的闪存时钟频率是所有FPGA器件中最快的,达到了160 MHz。紧随其后的是127.5 MHz的AU20P和60 MHz的Cyclone 10GX220。 

影响FPGA启动时间的下一个因素是接口类型。AMD和Altera FPGA支持QSPI闪存接口(4位)和单倍数据速率(SDR)。相比之下,Certus-N2支持DDR xSPI闪存接口(8位),在使用相同时钟速率时,带宽是QSPI接口的四倍。 

最后,莱迪思Certus-N2器件得益于Nexus 2平台的4输入LUT架构而脱颖而出,该架构可以很好地优化面积利用率。相比之下,AMD采用的是6输入LUT,Altera采用的是ALM,这是一种8输入LUT,可以配置为LUT4或LUT6。这些较大的结构其配置数据也更大。莱迪思Certus-N2更小的位流和更快的配置接口相结合,在启动时间方面具有显著的优势。 

影响启动时间的因素概述如下。估计的比较系数与实际测量值相近。

3.png

3.3 比较功耗 

功耗是所有应用中的一个关键因素。尽量降低功耗不仅能提高系统效率,还能带来多种好处。功耗降低可延长电池寿命,简化热管理,提高器件寿命和可靠性。这些优势共同降低了总体拥有成本,让低功耗设计备受青睐。 

3.3.1.测量的功耗结果 

以下是测量功耗的方法: 

  • 所有三款FPGA均采用相同的RTL设计。

  • RTL设计在三个FPGA中占用的资源近似,约为107K SLC(61K LUT和122K寄存器)。

  • 功耗测量在0MHz至300 MHz的频率范围内进行。 

结果如下图所示:

4.png

比较结果表明,在整个工作频率范围内,莱迪思Certus-N2的静态和动态功耗都最低。

3.3.2. 影响FPGA功耗的因素 

FPGA平台的架构决策是造成功耗差异的主要原因。FPGA中LUT4(4输入查找表)与LUT6(6输入查找表)的功耗会因多种因素而有所不同: 

  • 静态功耗:与LUT6相比,LUT4的静态功耗通常更低,因为它们的配置位数更少,面积更小。 

  • 动态功耗:LUT6可以最大限度地减少实现功能所需的逻辑级数,从而降低动态功耗。 

  • 面积效率:LUT4具有更高的面积效率,可减少漏电,从而降低静态功耗。

  • 性能/设计选择:LUT6能够以较少的逻辑级数实现更复杂的功能,因此通常具有更高的性能。 

总之,虽然LUT4通常在静态功耗和面积效率方面更胜一筹,但LUT6在性能方面也更有优势。在大多数小型FPGA应用中,LUT4可提供足够的性能。 

3.4. 比较尺寸 

在比较器件尺寸时,我们的目标是在提供基本功能的同时,选择最小的外形尺寸。莱迪思Certus-N2 CT20采用11 x 9 mm²封装,带有高速SERDES。相比之下,19 x 19 mm² Altera Cyclone 10GX 220和23 x 23 mm² AMD Artix Ultrascale+ AU20P也具有类似的功能。莱迪思Certus-N2 CT20 FPGA比最小的AU20P封装还小五倍。 

较小的尺寸不仅能节省PCB面积,还能简化系统内的元件布局。此外,更小的器件通常意味着更低的功耗和更高的成本效益,使其成为各种应用的理想选择。

5.png

3.5. 比较总拥有成本 

电路板的总拥有成本(TCO)包括电路板在整个生命周期内与设计、制造、运行和维护相关的所有费用。我们可以从使用这些FPGA进行设计时的物料清单(BOM)开始比较。

6.png

由于配置位流较大,AU20P和10GX220所需的配置闪存至少是莱迪思Certus-N2的两倍,因此成本较高。莱迪思Certus-N2功耗更低,外形小巧,因此无需散热器或占用额外的PCB尺寸。此外,与AU20P和10GX220相比,莱迪思Certus-N2具有更简单的供电设计,降低了使用莱迪思Certus-N2进行设计时的BOM和开发成本。 

在考虑总体拥有成本(TCO)时,系统的生命周期维护至关重要。因此,所用器件的安全性和可靠性成为关键因素。采用更安全可靠的FPGA设计的系统可降低黑客成功入侵的几率。莱迪思Nexus 2器件支持后量子安全AES-GCM和SHA-3算法,以及业界公认的ECDSA-521和RSA4K验证。在发生中断的情况下,更可靠的FPGA也能更快地恢复,并将黑客的影响降至最低。莱迪思Certus-N2可以通过瞬时上电配置快速恢复,保持系统运行,不会出现明显的中断。如下表所示,莱迪思Nexus 2器件在安全可靠性方面尽显优势。

7.png

3.6. 莱迪思Nexus 2的应用 

在本节中,我们将概述莱迪思Nexus 2平台的主要特性可以实现哪些应用。 

  • 马达控制机器人:自动化机器人技术在工业车间的应用越来越广泛,这就要求为经常与机器打交道的工人提供更多保护。增强的安全性和快速故障恢复功能可确保机器在工业环境中安全可靠地运行。 

  • 汽车区域网关:这是现代汽车电气和电子架构中的一个关键组件,旨在按物理位置管理汽车内的电子系统。分区网关的好处之一是提高效率,减少传感器、传动器和同一区域内其他设备的延迟。使用具有瞬时配置的莱迪思Nexus 2器件可缩短唤醒时间,确保对外部事件做出及时响应。 

  • 网络边缘监控:有些应用可能只需要FPGA进行周期性处理,例如人或物体存在检测。传统上,如果不持续处理网络边缘的数据,FPGA可能会处于空闲状态。对于电池供电系统或在散热条件较差的户外环境中的应用,莱迪思Nexus 2 FPGA可以在空闲期间断电,并使用瞬时启动的配置来捕捉下一个处理周期。电源的占空比(Duty-Cycle)功能可进一步降低平均功耗,减少散热压力,提高系统的可靠性。

莱迪思将电源占空比用例与竞争对手进行了比较。使用电源占空比功能时,莱迪思Certus-N2的平均功耗最多比竞品低8倍。AU20P和Cyclone 10GX 220的启动时间较长,约为200-300毫秒。为了利用占空比节省能量,它们只能以1到3Hz的周期运行,否则将保持全时“工作”状态。有关这一概念的说明,请参见下图。

8.png

通过比较总功率(曲线下的面积),我们可以明显看出,莱迪思Nexus 器件在网络边缘监控应用中,在保持高性能的同时,还能高效利用占空比节约能源。

结论

莱迪思Nexus 2平台代表了小型FPGA技术的重大进步,以紧凑的小尺寸提供无与伦比的能效、性能和安全性。开发人员可以通过这些增强功能,加快产品开发,满足网络边缘应用不断发展的需求。未来的Nexus 2系列将引入更多的功能,包括集成闪存、更强的安全性、更快的D-PHY和硬核C-PHY功能,进一步巩固莱迪思作为低功耗小型FPGA领导者的地位。

文章来源:Latticesemi

最新文章

最新文章