不就是相机和显示器?NO!机器视觉的前世今生,一文全知道

作者:Jon Gabay 来源:贸泽电子

机器视觉

从第一颗气象卫星开始,机器就被赋予了“视觉”,为机器视觉应用的发展奠定了基础。在早期阶段,这些应用中对关键信息的分析和提取严重依赖于人为干预。然而,随着技术的不断进步,现代图像处理技术已经超越了人类的能力,可以发现我们无法感知的元素。将图像数据数字化的工艺在实现这些能力方面发挥着重要作用。在这些数字化系统中集成人工智能(AI)开辟了一个新的可能性领域,即将机器转变为更复杂的工具。当我们站在这场革命的风口浪尖时,越来越多的设备正在其核心功能中融入视觉应用。

数码暗房简介

新闻服务和电视广播加速了数码照片的广泛采用。1957年罗素·基尔希(Russell Kirsch)创造的第一张数码照片标志着图像处理历史上的关键时刻。20世纪70年代末,新闻机构开始使用一种基于软件的方法,利用早期微处理器的能力创造了第一个数码暗室,这也标志着一项重大进步。1987年,早期的Macintosh应用程序“数码暗房”成为了历史上第一个可供大众编辑和处理图像的工具。随后,高分辨率扫描仪的出现使得图片数字化走进了寻常百姓家。数字化图片支持各种操作,如裁剪、调整对比度和亮度、调整大小以及基本增强功能,如边缘卷积。随着技术的进步,这些功能不断发展和扩展,需要更高级的硬件解决方案和更精妙的软件解决方案。

将机器视觉融入社会

在现代社会,图像传感器和机器视觉已经成为我们生活中不可或缺的一部分。这些技术无处不在,包括从电话、平板电脑和笔记本电脑等个人设备到工厂、车辆和高速公路上的工业成像系统。这些系统的性价比在过去几年里有了显著的提高,数码相机的普及也延伸到了我们的家庭和公共建筑中,它们为这些地方提供了安全保障。图像传感技术的进步大大减轻了工程师的负担,现在,他们可以使用一系列具有内置处理和通信功能的模块化相机。

机器视觉极大地造福了社会。在工厂,它被用来检查产品、控制机械手、检测制造缺陷以及确保安全。例如,现代的高帧率自动对焦相机可以在几秒钟内检查完电路板上的数千个焊点,而人类要完成这项任务则需要几分钟。

我们还看到汽车摄像头和图像传感器也使用机器视觉技术,以提供备份视图、存在检测和避免碰撞。在医学领域,高分辨率图像传感器的用途无所不在,囊括从诊断骨折到识别组织样本中的单个细胞。机器视觉和人工智能的结合在这些领域的表现超过了经验丰富的医生,经常发现以前未知的新指标。在城市中,街道和建筑物的摄像头使用实时面部识别来实现安防或定向广告。执法部门和军方也将机器视觉技术应用于无人机、导弹、飞机和卫星。

机器视觉的现代能力

虽然分辨率和帧率呈指数级增长,但机器视觉领域最显著的进步却是使机器能够感知三维空间的立体视觉。这一发展对工业和制造业产生了深远的影响,有助于快速识别和分类物体,以及增强缺陷检测功能。

3D感知技术已经彻底改变了制造工艺和自动驾驶汽车的操作。再加上强大的处理器和深内存池,3D机器视觉系统可以快速识别物体,跟踪其运动,辨别其速度和方向,并预测其未来位置。

新一代机器视觉系统不断变化的设计挑战

随着相机功能的增加,对更快、更先进电子设备的需求也在增加。例如,一台旧的256px × 256px灰度相机捕获一张照片需要65,536字节。在快于眼睛闪烁融合频率的中等30帧每秒频率下,长度为1秒的视频需要1,966,080字节。相比之下,高端、高分辨率、快帧率的相机在1080px × 800px 24位分辨率下每秒可处理4000帧(FPS)。这相当于每张照片包含2,592,000字节,一秒钟的视频包含惊人的10,368,000,000字节。

为了满足这些存储需求,支持硬件的处理和通信速度也一路飞涨。对大容量超高速内存池(通常是DDR4)的需求也是如此,其中使用两个时钟沿,每次读取都伴随着写入。幸运的是,多核处理器和专用FPGA硬件可以用于传输数据流,并实时执行基本的图像增强,如位面分离。位面分离可以通过简单地检查其单色图像中最重要的位来检测边缘。

或许机器视觉最重要的发展就是图形处理单元(GPU)与人工智能处理器和神经网络的结合。GPU使用内部并行处理技术和专用的图像处理硬件,大大简化了设计工程师的工作。因为机器学习喜欢大数据集,GPI和人工智能的结合将这些能力提升到了一个新的水平。

设计现代机器驱动应用的工程师还必须考虑通信系统要足够快,以便从点到点传输图像数据。例如,现代汽车使用100Mbps的以太网网络将中速、中等分辨率图像传输到显示器和汽车的超级计算机。此外,这些计算机还需要大量的非易失性闪存来存储其事件数据记录器(通常称为黑匣子记录器),这些记录器可以连续记录数据,以便用于事故再现和刑事调查。

现代机器视觉通常也需要夜视。例如,在汽车应用中,具有夜视功能的前视摄像头可在驾驶员看到潜在危险之前提醒驾驶员。

模块化更简便

人工智能视觉设计的学习时间过长会拖慢一个好创意的上市时间。幸运的是,诸如Advantech ICAM-520工业AI相机(图2)等模块可以抹平学习曲线。ICAM-520基于工业级1.6MP索尼图像传感器,具有可编程可变焦距镜头系统和多个Arm®处理器,适用于云到边缘视觉人工智能应用。

图2:Advantech ICAM-520工业AI相机.png

图2:Advantech ICAM-520工业AI相机(图源:贸泽电子)

ICAM-520集成有NVIDIA® Jetson Xavier™ NX模块化系统(SoM)和64位Camel Armv8.2 CPU。70mm × 40mm的Jetson Xavier NX被誉为世界上最小的超级计算机,是专为自主机器设计而开发的全功能多模态人工智能引擎。ICAM-520内置机器学习功能,随附基于HTML5的实用程序,用于集成到支持V4L2和RTSP接口的云服务。

60FPS ICAM-520包含一个用于高速数据传输的USB Type-C端口和一个10/100/1000自动协商以太网端口。集成的HDMI 2.0端口可轻松地直接连接到本地监视器或显示器。RS-485端口也可用于外设控制、命令或状态。集成的数字I/O支持自定义用户界面。

该模块提供嵌入式8GB 2级和4MB 3级内部缓存,外加16GB的eMMC存储器。

结语

机器视觉的概念已经远远超出了简单的相机和显示器。如今,机器视觉描述的是全面的图像处理系统,具有针对特定要求量身定制的各种功能。高性能处理和内存是任何高级应用的基本组件。

幸运的是,并非所有的机器视觉设计都过于复杂。有了图像模块和处理引擎的辅助,更多的设计师越来越容易接触到机器视觉技术。更快速的先进存储技术正在解决处理、存储和传输所捕获数据的挑战。

更宽的总线、管道传输的数据流、并行处理和人工智能等设计实践为工程师提供了不可估量的帮助。通过使用内置AI的摄像头模块,设计师可以专注于应用,而不是视频源。诸如Advantech ICAM-520的高质量模块化相机可简化定制设计的任务,并加快将具备先进功能的产品推向市场。


最新文章

最新文章