人工智能并不全是魔法

软件利用实时数据得出真实世界的结论。

通过凯文·奥特 2019年3月6日

欢迎来到数据科学的神奇世界!好了,数学专业的同学们,你们的耳朵竖起来了。也许其他人都在抱怨。

跟着我!这不仅仅是数字的问题。我们即将探索最令人兴奋的新兴技术之一。我们将分解它来帮助你开始。听起来好吗?让我们开始吧。

你可能听说过机器学习和人工智能(AI)的前景。这两个技术概念引起了全世界的关注。自动驾驶汽车吗?类人机器人吗?那些在你之前就知道你日程安排的设备?他们的承诺并不局限于消费者领域;工业世界也掀起了这股热潮。看看最近许多主要工业出版物的头条新闻。这将伴随我们一段时间。事实上,它将无处不在。 So, you might as well get to know about it.

我们将介绍一些机器学习和人工智能基础知识,公司如何使用这些技术以及它们对未来的承诺。此外,我们将了解实现应用程序的一些实际细节和步骤。

人工智能的出现

传统上,分析是统计学家的领域。在计算机在工业中普及之前,分析师用铅笔和纸工作。“分析”是一个泛指数据科学的术语。

沿着一条简单的直线寻找一个点通常属于标准数据分析的范畴。这条线被认为是一种“回归”。沿着这条线找到这个点就是“回归分析”。执行简单的回归分析是司空见惯的。

机器学习可以被认为是人工智能的一个子集,尽管这两个术语经常互换使用。机器学习是人工智能的统计方面,它还包括认知计算和建模。每个类别的界限都很模糊。

描述人工智能的另一种方式是将其视为使用真实世界数据得出结论的计算机代码。如果系统是以这种方式建立的,那么这些结论可以自动执行,从而做出决策。这样就可以向系统输入更多的信息,做出更多的决策。这种对人工智能的描述反映了流行文化对人工智能的看法,认为它是反映人类思维的东西。我们接受信息,得出结论,做出决定。

因此,人类思维通常可以用“如果,那么”和其他类型命题的形式来表达。以类似的方式,人工智能被实例化为几种类型的算法中的任何一种。

算法由计算机代码组成。当编写这些代码用于人工智能时,将与描述性数据相结合,以得出支持结论的结果。人工智能中使用了许多类型的算法。根据功能对算法进行分组是很有用的。下面描述了一些较大的分组。

算法的分类

这就是事情开始变得有趣的地方。让我们来分析一下机器学习算法的主要类别。

聚类

一些算法将事物“分组”在一起。

用一个例子最好地说明了这一点。假设正在生产一个零件。质量保证部门或在线测量系统会将两种测量方法与零件联系起来:宽度和高度。该数据用于生成图表。根据设备的工作原理,部件通常属于三组之一,如图1所示。较宽的部分在右边,较高的部分在上面。

可以使用颜色来明确分类方案,如图2所示。

这很简单。如果你是一个Excel向导,你可以自己生成图表,在新部分出现时将其绘制到图表中。

随着更多的信息被添加到模式中,集群变得更加强大。假设添加了关于被拒绝单元的信息。结果显示,蓝色组代表了近80%的喷射物,而黄色和红色组约占20%。你说对了!

但为什么止步于此呢?假设我们也开始收集长度。假设图2是在三维空间中绘制的。红色、黄色和蓝色的人物可能离你很近,也可能离你很远。如果图像被旋转,则分组保持信息承载。高级绘图程序可以做到这一点,因此可以继续手动输入和分组信息。分组得到了改进,蓝色组中有85%的拒绝。

如果聚类是用机器学习算法完成的,它会执行分类,但只是将可以手动完成的事情自动化。那么为什么机器学习是更好的选择呢?

第四维

如果想要另一个维度呢?也许电导率是一个有意义的参数,或者是一个湿度读数,或者是一个阳极氧化电流。但是一个三维图形只能有三个维度。

另一方面,使用机器学习算法意味着可以绘制4、5、6甚至100个维度的图形。这意味着可以跟踪其他有趣的类别,并且特定类别组合的蓝色类别可能达到95%或99%。对构建后的产品最有可能需要返工的洞察力得到了显著的提高。可以选择在采取不必要的步骤之前将它们从生产中移除,从而节省时间和金钱。

决策树

刚才描述的思想实验暗示了这些技术中固有的一些可能性。让我们简单地看看其他一些。

决策树是另一种概念简单但意义重大的技术。在日常生活中,我们一直在构建决策树来回答这样的问题:交通状况如何?天气怎么样?我今天应该给我妈妈打电话吗?让一个算法为我们构建一个是一项简单的任务。首先确定描述过程的数据,以及关于结果的信息。结果生成的算法构建了一个映射预测结果的树。它通过无数种可能性(也许数千种或更多)来得出尽可能准确的树。

模型和培训

其他重要的概念包括建模和训练。当过程数据被输入到机器学习算法中,从而生成一个模型,允许识别好的和坏的过程示例时,就会进行训练。

想象一下,有人拿着笔坐下来,写出一棵决策树。然后他们写了一篇又一篇,直到他们写了一堆。在此之后,最好的决策树可以被识别出来,而其他的被丢弃。最终的决策树就是模型。对于聚类算法,该模型将被称为“聚类模型”或“模型”。所有的模型都是稍后用来做预测的。

换句话说,例如,使用最优决策树,可以使用一组数据来派生基于流程流的预测。回到前面的例子,第一个语句可能是“如果宽度小于23.5,则xxx”,第二个问题可能是“如果高度大于43.3,则xxx”。机器学习算法创造问题以获得最佳答案。

决策树在预测性维护应用中有很大的用处。

回归分析

如前所述,回归分析可以很简单。当涉及到机器学习算法时,它可能很复杂。

回归分析的基本原理可以用它在一条直线上找到一个点来说明。要画一条线,首先要决定画什么样的线。是曲线吗?它是一条直线吗?它有很多曲线吗?如果在x-y平面(二维)上绘制它,这很容易做到。当机器学习应用于复杂数据和多维度时,它就会大放异彩。手工绘制100个维度是不现实的,但一个算法可以很容易地处理这个问题,并且可以很容易地找到最适合的回归,如果存在的话。

回归分析在工艺调整和生产预测中非常有用。并不是所有的数据都适合进行回归分析(例如,聚类的数据),但是对于具有一个因素影响其他因素的关系的项目来说,回归分析是很好的。

深度学习

也许你听说过神经网络?你知道它们是什么吗?我有个秘密要告诉你:没人知道。好吧,这并不完全正确。但这基本上是对的。让我解释一下。

神经网络是包含数千或数百万个节点的模型,这些节点是计算机代码的小块,每个节点都可以接受输入并产生输出。神经网络之所以被称为神经网络,是因为它们旨在模拟神经元在我们大脑中的工作方式。节点之间的连接有些更强,有些更弱,就像我们大脑中的神经元一样。

对于神经网络,算法不仅仅是配置它们。他们建造它们。他们可以建立具有数百万个节点的模型来处理数据。

当神经网络消化数据时,它会变形和变化,直到它在预测结果或提供分类方面做得相当好。它可以被训练去做任何事情。它可以获取最近的传感器读数,并产生出现问题的概率。或者它可以评估一组1和0来确定它是否描绘了一只猫。所有这些数以百万计的节点以某种方式“理解”了图像。对于每个节点来说,这只是简单的数学运算,但节点的排列和权重使我们能够得出结论。

这就是为什么我说没有人真正理解他们。让数据科学家解释神经网络,他或她将能够解释数学。如果让同样的数据科学家解释它是如何在这些字节中识别出Fluffy的,那么“魔术”这个词可能会出现在解释中。

尽管神经网络令人印象深刻,但它们在工业领域提出了一个难题。如果一个算法让你做某件事,你会去做吗?如果它是一个决策树,或者一个回归,或者一个分配建议的聚类模型,那么就有可能跟踪得出结论的方式。但是对于神经网络来说,理解系统的“推理”是不可能的。它只是给出了一个答案,信不信由你。如果决策可能导致停机或生产瓶颈,那么人们可能会问,为什么要相信黑盒的说法。

未来就在这里

世界在变化。人工智能和机器学习将继续存在,科技行业也完全参与其中。这项技术已经证明了它的价值,采用这项技术的公司认为自己处于领先地位。人工智能并不是所有问题的答案,但如果应用得当,它可以在短时间内产生巨大的影响。即使人工智能提供了承诺价值的一半,它也将对各行业产生重大的积极影响。去那里,有一些乐趣和建立一些模型!你会很高兴这么做的。

获得一些实践经验

人们是如何开始机器学习或人工智能项目的?这里有几件事需要事先考虑。

  1. 找出问题所在。从选择一个需要改进的过程、领域或技术开始。找到一些有强烈需求的东西,上面的算法似乎可以提供帮助。
  2. 收集数据。数据越多越好。成千上万的数据点有助于训练一个尽可能好的模型。确保使用高质量的数据。糟糕的数据很容易使算法失效。数据预处理和清理几乎总是成功的关键。
  3. 温习统计学知识。(或者找一个专家。)了解抽样技术、因果关系和相关性,以及对结果的质量有一定的了解,有助于避免错误的开始。
  4. 具备领域知识。(或者找一个懂的人。)了解过程或技术对于了解结果是否合理至关重要。数据科学家是伟大的,但简单地释放一个数据不会得到好的结果。
  5. 创建模型。这适用于任何现有的机器学习软件。现代监控和数据采集(SCADA)系统内置了一些流行的机器学习算法。许多云产品和平台都将这些类型算法作为选项。
  6. 部署模型。通常,模型可以在机器旁边或内部运行,即使是在云上构建或使用其他工具。找到为组织运行模型的最佳方法。如果是关键流程的一部分,那么在内部运行它是理想的。
  7. 监视是否成功。如果成功不能被衡量,没有人会知道它的存在。与之前的数据进行比较。如果模型需要细化,请回到步骤5。请记住,有时尝试几个模型或结合几个模型会产生最好的结果。

本文发表在面向工程师的IIoT补充的控制工程设备工程。请参阅下面增刊中的其他文章。


作者简介:凯文·麦克拉斯基(Kevin McClusky)是感应自动化公司销售工程的联席主管。Kevin是工业自动化软件集成领域的专家。他的工作包括监督、创建和支持众多HMI、SCADA和MES项目。