人工智能及其对机器视觉的影响

几家公司正在为机器视觉行业开发人工智能(AI)解决方案,通过采用深度学习技术和人类用来开发大脑的其他功能,让人工智能更像人类一样思考。

通过韦恩哈丁 2017年2月17日

当“会思考的机器”的概念在20世纪50年代出现时,很快就有人对这一新人工智能领域发出了危言耸听的警告。从1968年那部标志性的电影开始,对机器崛起的恐惧就一直在流行文化中上演2001:太空漫游到最近的救世主

虽然人工智能还没有接管社会,但数据存储和处理能力的改进已经使IBM沃森这样的认知系统成为可能,这些系统旨在消除人类决策中的猜测。然而,目前大多数人工智能迭代都在解决更温和的任务,比如物体识别。

人工智能的前景是使机器视觉能够承担超出当今解决方案能力的具有挑战性的应用程序。但是这项技术是否已经为工业应用的黄金时期做好了准备呢?

测试人工智能水域

人工智能在机器视觉中的适用性依赖于机器学习的附属分支,更依赖于深度学习。在最广泛的层面上,人工智能是计算机模拟人类智能的能力。更深入地说,机器学习使计算机能够在没有明确编程的情况下行动。深度学习是机器学习的一个子领域,它使计算机能够从经验中学习。

过去十年的一些发展已经使深度学习成为现实,而不仅仅是机器视觉的一种可能性。“基于神经网络的新技术、gpu的足够计算能力和丰富的数据,只有现在我们才能将人工智能用于图像处理,”瑞士ViDi Systems公司的业务开发Olivier Despont说,该公司生产基于深度学习的视觉软件。

FISBA有限责任公司定制光学系统销售总监Wallace Latimer表示,深度学习优于传统机器视觉,因为与使用基于规则的方法的传统图像处理软件不同,“人工智能是我们的下一个步骤,我们将不容易表征或非线性的事物赋予机器,以创造下一个级别的可重复性。”拉蒂默继续说道:“线性算法创造了一个非常狭窄的空间,而人工智能/深度学习创造了更大的空间,可以接受更多的变化。”“它扩大了人们对好坏以及好坏原因的接受范围。通过拥有更大的桶,你可以专注于提供最大爆炸力的内容,并减少输入的变化。”

目前市场上至少有一种深度学习系统可供机器视觉用户使用。ViDi Systems的ViDi Suite是第一个商用的基于深度学习的工业图像分析软件。该软件集成了标准图像处理库,可以像孩子一样学习。

德庞特说:“你不能用一种基于规则的方法来教孩子,告诉他们房子是什么。”“基于几个例子,我们的大脑,甚至在很小的时候,就能提取出建造房子的要素。我们的系统和人脑的工作原理完全一样。”

ViDi Suite由三个不同的工具组成。ViDi Blue发现并检测图像中的单个或多个特征。该工具通过学习带注释的图像来定位和识别复杂的特征和对象。ViDi Red通过学习对象的正常外观(包括其变化)来检测异常。红色工具还可以分割图像中的特定区域。ViDi Green学习基于标记图像的集合分离不同的类来对对象进行分类。

除了新的机器视觉解决方案可以处理更大的产品变化,深度学习相对于传统机器视觉解决方案的另一个优势是,它可以减少开发机器视觉程序所需的时间。Despont说:“使用经典的视觉方法,许多应用程序需要60多天的软件开发和可行性。“ViDi可以在半天内完成开发。”

据德庞特介绍,与Facebook、谷歌和IBM的人工智能系统使用服务器群来支持软件不同,ViDi使用单个高端NVIDIA GPU在几分钟内就能训练系统,而不是像IBM Watson那样需要几天或几个月来编程和参数化。

德庞特说:“与其使用数百万或数十亿张图片,我们建议从30到50张有代表性的好图片开始教这个系统。”“我们不会将图像发送到基于云的服务器群来进行处理或培训。客户很高兴他们可以在一台拥有一个GPU的PC上运行所有程序,并保留自己的图像所有权。”

机遇与挑战

深度学习在给传统视觉系统带来挑战的应用中表现出特别的前景。Teledyne Dalsa的软件项目经理Bruno Ménard说:“人工智能非常适合用于食品检查,比如你想检查甜甜圈或一块肉,因为它们之间存在显著差异。”

但受益的不仅仅是有机检测应用。Ménard引用了传统的缺陷检测应用程序作为另一个例子。他说:“很难用传统算法对计算机进行编程来定义缺陷,而不必在每次出现新缺陷时都重新进行设置。”“但通过对大量样本使用人工智能,你最终可以很好地定义什么是好零件,什么不是。”

随着人工智能在机器视觉领域的出现,这项技术将在额外的检测任务中找到一席之地,并最终超越工业自动化领域。根据拉蒂默的说法,深度学习在医疗、生命科学、食品、假冒检验和木材分级等市场将具有优势。

“这些领域都有非常灰色的决策点,”拉蒂默说。“那个苹果够不够好?”很难用线性规则来说明它是。深度学习应该能让很多应用变得更高效、更可重复。”

ViDi Systems的德庞特预计,深度学习将包括医疗诊断、监控、自动驾驶汽车,以及用于检查或地图分析的智能农业。德庞特说:“人工智能是未来,它将帮助人们快速解决一些复杂的任务,因为计算能力几乎每一年半就会翻一番。”

许多机器视觉专业人士都认识到人工智能和深度学习为视觉行业带来的前景,但他们表示,人工智能的全部潜力至少在3到5年内不会实现。此外,人工智能并不一定能解决困扰传统视觉和图像处理的所有问题。

Ménard指出了人工智能系统的两个主要缺陷。他说:“首先,你需要进行大量的培训,你需要培养专家来达到下一个级别的分类。”“第二个缺点是,一旦经过训练,分类失败,就很难解决问题。你没有选择使用新样本进行再训练。”

业内专家认为,在人工智能在机器视觉领域变得普遍之前,该行业将不得不让更大的参与者来承担重任。拉蒂默说:“从我们的细分市场来看,我们将看到谷歌将这项技术推向令人难以置信的投资和改进水平。”“我们的行业无法投入必要规模的时间和金钱。我们将不得不利用它。”

韦恩哈丁是特约编辑,友邦保险。这篇文章最初出现在AIA网站上。友邦保险是先进自动化协会(A3)。A3是CFE Media的内容合作伙伴。由制作编辑克里斯·瓦夫拉编辑,控制工程, CFE传媒,cvavra@cfemedia.com

在线额外

参见A3的其他故事,链接如下。

原始内容可以在www.visiononline.org