机器视觉软件的进步正在促进创新

公司正在使用软件来帮助实现许多机器视觉软件开发,如超高动态范围成像和自分析算法。

通过韦恩哈丁 2018年11月9日

随着机器视觉行业为其最繁忙的6个月技术活动做准备,各公司正在对大量机器视觉软件开发进行最后的润色。从超高动态范围成像到自我分析算法,机器视觉客户可能会接受软件的秘密武器,而不仅仅是最近被吹捧的深度学习。

Teledyne Dalsa开发负责人Jordan Wisniewski表示,电子行业对高动态范围成像很感兴趣。Wisniewski说:“随着电路板密度的提高和硬件的集成度的提高,电子产品客户希望他们的线路运行速度更快,分辨率更高。”“因此,信噪比(SNR)变得比以往任何时候都更加关键,特别是当你试图通过其他电子组件层来尝试表面以下的图像层时。”

Wisniewski说,答案是从硬件和软件的角度来解决这个问题。由于Teledyne Dalsa生产自己的传感器和摄像机,他们可以为客户提供嵌入内部开发的预处理算法的机会,也可以为客户解决非常特定的应用需求的信噪比挑战。

其他客户想要类似的嵌入式智能,用元数据标记图像,包括预处理动作和值,以帮助主机系统从先进机器视觉摄像机产生的数百gb图像数据中提取有意义的信息。

Wisniewski表示:“数据减少正在成为我们许多医疗和电子客户关注的关键问题,通过将关键算法嵌入到我们的相机中以满足客户的特定需求,我们正在帮助解决这一挑战。”“这几乎是一种新型的混合智能相机,它不使用集成开发环境,但内部确实有一些针对客户的处理。”

OCR增大

Datalogic提供基于图像的机器可读代码阅读器,还提供激光打标系统。为了使这两种功能更好地结合起来,该公司专注于改进其光学字符识别(OCR)和代码读取工具。

Datalogic产品营销经理Bradley Weber表示:“我们正在开发能够读取更具挑战性代码的工具。“很多时候,黑白打印的字符不清晰,很多时候打印不完美,或者背景不一样。”

机器视觉软件和相机制造商Tordivel AS加入了康耐视和MVTec GmbH,推出了其NeuralOCR工具,该工具使用深度学习来处理任何现有或新的字体,即使是在金属或橡胶上印刷的字母,字体和背景材料之间没有明显的可见对比。与其他基于神经网络的OCR工具不同,Tordivel的工具允许用户绘制字体,然后通过创建一个图像集来训练系统,在图像中引入各种噪声元素。

Tordivel AS的首席执行官Thor Vollset表示:“通过这种方式,就不需要为深度学习OCR工具生成所需的所有训练图像。“两种训练方法我们都可以,但我们认为这种方法更好。”

当与Scorpion的新型Venom(小到中等基线距离)或Stinger(长基线距离)3-D摄像机一起使用时,高度信息可以添加到2-D图像中,用于冲压金属零件或轮胎上凸起的字母等应用。

与此同时,康耐视的深度学习OCR工具在汽车、食品包装和其他具有挑战性的应用中开辟了新的应用程序,这些应用程序最近超出了传统OCR算法的能力。康耐视视觉软件营销总监John Petry表示,新的OCR工具配备了一个预先训练好的网络,只需要几张客户图像就可以学习一种新的字体。

Petry说:“没有人愿意花时间标记数百个OCR字符的图像,或者处理不可避免的错误。”

三维和深度学习

Matrox在他们的工具集中增加了一个光度3-D算法,以改进Matrox成像库(MIL)。光度3-D算法结合了使用不同光源的同一物体的多幅图像。通过组合图像,MIL可以大大提高3d特征的对比度,包括加盖或凸起的文本。

Matrox还添加了一个新的矩形形状查找器工具,用于对象定位,因为大多数机器视觉应用程序都是基于常见的几何形状来检查对象的。Matrox研究和创新总监Arnaud Lina表示:“简单的形状可以解决最常见的机器视觉应用,包括正方形、矩形、圆形和椭圆。”

深度学习方法基于图像分析开发检查标准,这些图像已被专业地标记为给定图像中显示的缺陷描述。这种方法对于处理难以定义的缺陷和产品变化非常有效,但是通常需要更多的时间来运行和特殊的知识来实现。

三大软件公司都将提供新的深度学习图像分类工具,不仅帮助识别图像中的部分或特征,还提供类似于模式搜索算法的位置信息。

随着客户通过先进的软件解决机器视觉挑战的选择越来越多,支持和培训变得更加重要。

韦恩哈丁是AIA的特约编辑。本文最初发表于视觉在线.AIA是先进自动化协会(A3)的一部分,是CFE媒体的内容合作伙伴。由CFE媒体制作编辑克里斯·瓦夫拉编辑,cvavra@cfemedia.com

原始内容可以在www.visiononline.org


作者简介:Winn Hardin是AIA的特约编辑。