FPGA和数据溯源保障AI安全

数据几乎支撑着当今世界的方方面面,而生成、处理、共享或以其他方式处理的数据量也在逐年增加。据估计,全球90%的数据都是在过去两年中产生的,超过80%的组织预计将在2025年管理ZB级别的数据,仅在2024年就会产生了147 ZB数据。从这个角度看,如果一粒米是一个字节,那么一ZB的米就可以覆盖整个地球表面几米厚。

数据爆炸意味着它能提供更有价值的洞察力,但同时也增加了漏洞或攻击的可能性,并引发安全和合理使用数据的难题。因此,组织不仅要制定有效的管理策略,还要制定确保数据完整性的策略,尤其是用于开发模型或推动决策或创新的数据,这一点至关重要。

在这种情况下,数据溯源的概念——跟踪每个数据点从源头开始的移动和转换——已经从锦上添花的防御措施逐渐发展成为网络安全的关键组成部分。随着企业不断采用人工智能和机器学习技术,这一点变得尤为重要,因为只有底层的数据才是可信和可靠的。

数据完整性的坚实基础

数据溯源是防止数据篡改和设计可信、合规安全系统的关键。在高层面上,这一过程涉及将元数据与数据加密绑定,以创建每个节点完整历史的透明记录,从而确保其完整性并帮助应对网络威胁。溯源系统的工作原理是从起源点跟踪数据到当前使用状态的整个过程,从而创建一个不间断的信任链。

当信息在系统中首次数字化时,需要标注上时间、日期、地点、源设备类型、隐私权等信息。然后,所有这些信息都会以加密方式与数据本身绑定,记录不可更改的时间点。虽然当今的系统对数据来源的理解能力各不相同,但我们的目标是在整个系统的每个转换点添加和重新绑定元数据。区块链和其他分布式记账等新兴技术将成为这些防篡改系统的基础。

未重视数据溯源的组织可能会根据不准确或被篡改的信息做出决策,从而导致负面结果,甚至损害客户利益。就生成式人工智能和大型语言模型(LLM)而言,如果不能正确追踪数据的历史,也会导致版权问题。然而,如果企业成功实施了溯源系统,在数据的每一步都对其真实性进行评估,他们就能赢得客户、合作伙伴甚至监管方的信赖,从而创造优势。

增强人工智能的透明度

在各行各业中,运营中嵌入人工智能和基于人工智能的系统的情况显著增加。虽然这种创新提高了效率,但人工智能系统也容易受到威胁,从而损害数据完整性,而且这些威胁正变得越来越复杂。

想象一个使用基于人工智能的数字孪生技术来模拟和优化生产的智能工厂。只有当系统中使用的训练数据准确、高时效时,这种方法才能发挥作用,因此数据的可信度至关重要。数据溯源系统可以让工厂查看模型的源记录,以及是否和何时对其进行了修改,从而让工厂管理人员能够验证输出结果,并更轻松地检测数据保真度中的潜在威胁或基于时间的漂移。

遗憾的是,尽管数据溯源对于构建和维护可信的人工智能系统至关重要,但它并没有得到应有的广泛认可。部分原因是缺乏可遵循的广泛标准,如今大多数模型几乎都没有实施或强制执行必要的要求,因此容易受到不法分子的威胁:

  • 数据中毒。不法分子可以破坏训练数据,干扰模型的准确性或引入偏差。

  • 恶意训练。莱迪思分享了一个关于汽车行业恶意训练潜在后果的例子,其中提到了一项研究,研究中自动驾驶汽车中的人工智能系统被故意误导,将停车标志识别为限速提高,这显示了恶意训练在现实世界中的危险性。

即使没有外部干预,缺乏溯源洞察力也会给企业带来问题,比如数据漂移。当算法所训练的数据属性发生变化,而模型没有相应调整时,就会出现这种情况,从而降低输出的准确性。维护数据溯源是确保这些系统的输出长期可靠的最佳途径。

FPGA初露锋芒

为提高网络弹性,系统设计人员可将FPGA集成到数据溯源系统中。与固定功能的处理器不同,FPGA作为真正灵活、可重新编程的硬件,能够进行并行处理和实时安全操作。其内置的安全功能,如加密和验证机制,有助于在处理过程中保护和安全地标记数据。由于FPGA通常是系统数据的源点,因此在加密绑定过程中发挥着重要作用。此外,FPGA固有的灵活性允许对其进行编程和重新编程,可以随着时间的推移执行特定任务。这种可定制性使企业能够根据自身需求的变化,调整采集和管理溯源信息的方法。

FPGA还能优化系统性能,包括AI和ML模型。由于具有实时处理能力,FPGA 能够以最小的延迟管理不同来源的大量数据。这种处理速度可确保数据交易得到及时记录和加密绑定,并确保溯源记录反映最新信息,更好地为数据溯源提供支持。此外,FPGA可以并行执行许多操作。这使它们能够同时实现收集数据、执行加密操作和监控安全性,而不会影响系统的性能。

量子计算的影响

由于加密操作对元数据绑定过程至关重要,因此所使用的加密算法必须面向未来。这个问题非常紧迫,因为量子计算的发展有可能对我们今天所依赖的经典非对称加密保护造成巨大威胁。

为了在即将到来的量子计算机时代保护我们的数字数据,我们需要转向后量子加密(PQC)这一新型加密技术。PQC算法使用不同以往的创新的数学模型,能够抵御量子威胁。由于这种加密方法非常新颖,因此更加凸显了FPGA的 “加密灵活性 ”。如果运行PQC算法的FPGA在现场部署后发现漏洞,可以更新编程而无需更换硬件。这种灵活性使FPGA成为向PQC过渡和遵守不断变化的法规的先行者。

构建一个可信的未来

随着数据溯源越来越受关注,行业和政府标准机构需要制定新的溯源指南,要求至少在一定程度上披露模型的数据溯源完整性。不过,目前还不清楚这些措施最终会采取什么形式。

一种方案是根据数据溯源系统的稳健性对其进行分级,最底层代表缺乏数据溯源机制,最高层代表有明确记录的信任链,概述数据点的历史。同样,合规性和执行机制也需要在此框架内进行评估,以降低与数据滥用相关的风险,确保透明度和问责制。此外还需要对这些标准的遵守情况进行独立的第三方验证,减少潜在的利益冲突,并确保达成评估数据溯源可信度的最佳实践。

在不久的将来,随着开发人员接受数据记录后不得更改或删除的理念,我们还可能看到不可变数据方案的实施越来越多。区块链技术就是这样一种解决方案,因为它具有去中心化的安全性和分布式属性。在区块链网络中,每笔交易或每条数据都与前一笔交易或数据有加密链接,一旦交易被添加到区块链中,就几乎不可能被修改或删除,从而形成不可更改的链条。

开发关键系统和推动重要决策离不开数据支持,因此企业必须能够跟踪并信任数据。人工智能系统的兴起进一步强调了对有效数据溯源的需求,便于检测对这些模型的威胁并确保其长期可靠性。2025年及以后,数据溯源将成为网络安全、网络弹性和网络信任的基石,帮助企业识别数据完整性面临的威胁,遵守新法规,并在客户和合作伙伴网络中建立信任。

如果您想进一步了解莱迪思FPGA解决方案如何让您的系统设计更安全、应对未来的威胁,请联系我们的团队。

文章来源:莱迪思半导体

最新文章

最新文章