人工智能和机器学习

面向制造群体的尺度机器学习

在易于使用的高级分析应用程序中允许访问机器学习算法,加速对过程数据的洞察。一家专业化学品制造商使用ML工具预测了超过90%的质量偏差,每年在质量下降方面节省了50多万美元。

由艾莉森Buenemann 2021年9月12日
礼貌:Seeq集团。

过程制造业的制造商在有效的数字转换所需的人员和技术上投入了大量资金,包括机器学习(ML)软件。因此,对数据科学家的需求很高,数据存储和迁移战略正在迅速发展,云计算原生分析产品正在充斥市场。

一家专业化学品制造商使用ML工具预测了超过90%的质量偏差,并采用了基于模型的控制方案,每年在质量下降方面节省了50多万美元。

为了提高数据科学资源的投资回报(ROI),组织需要扩大数据科学家的努力。数据科学软件必须服务于数据科学团队和第一线流程工程师、技术人员和专家的员工基础。

实现这一点的一种方法是将数据科学家、合作伙伴和第三方生成的算法发布到易于使用的工具和经验中,流程工程师可以使用这些工具和经验来扩展整个公司的数字创新工作。随着这些和其他进步,高级分析应用程序的局限性正在消失,新的可扩展接口支持流程制造组织中广泛的ML创新。

ML的民主化:面向所有人的机器学习

民主化是第四次工业革命中使用最广泛的流行语之一,在过程工业向数字化转型的过程中呈现出多种多样的特点。

首先是数据的民主化。在新冠肺炎大流行的帮助下,传统上行动缓慢的制造业公司加快了对数据战略的投资。数据民主化的基本目标是让正确的数据从任何地方提供给正确的人,无论是在工厂防火墙、家庭办公室还是远程监控设施内。其中的一个关键组成部分是一个高级分析应用程序提供的数据访问、完整性和一致性,该应用程序与源数据系统实时连接。

主题专家解决高价值的业务问题

数据的民主化让位于分析和见解的民主化。如果能够访问相关流程和上下文数据源,以及用户友好的高级分析体验,主题专家(SME)现在可以解决高价值的业务问题。虽然从这些分析中收集到的见解在历史上一直是孤立的,但高级分析应用程序的知识捕获和协作能力使结果能够在整个组织中被捕获和共享。

ML算法的民主化将成为下一个大浪潮。要扩大对企业数据科学团队或第三方创建的算法的投资,最有效的方法之一是将算法转换为更广泛的员工基础可以访问的形式。这需要高级的分析解决方案与实时数据源连接,以支持持续学习模型,并集成到现有的数据分析接口,以确保成功部署和采用。

可扩展应用程序、人工智能

与高级分析的可扩展性一样,通过使应用程序用户界面(UI)可扩展以访问客户创建的软件模块和算法,可以使ML和人工智能(AI)民主化。应用程序扩展的领域包括附加功能、附加显示窗格和附加工具。

这些附加功能为组织提供了将其知识产权和方法合并到现有的特定时间序列功能的软件套件的能力。这种方法的机会包括通过为参数(如热交换器u值、控制回路误差或锅炉效率)创建附加功能来标准化设备监控。

在U值示例中,附加函数允许用户通过引用定义为“U_值”的函数并指定温度、流速、密度和比热的输入变量,应用描述传热的第一原理方程。附加函数的复杂程度可以从传热的线性方程到描述流体动力学和反应动力学的微分方程。

越来越多的数据可视化选项可通过商业智能工具、统计软件和开源编程库获得。通过在高级分析应用程序中提供这些可视化选项,并与所有相关源数据系统建立实时连接,可以获得巨大的价值。

附加显示窗格可视化使最终用户能够利用独特的可视化功能与实时数据进行交互。这些显示可以由客户、合作伙伴或第三方供应商配置,并“插入”到流程工程师使用可用软件访问的显示下拉菜单中(图1)。

图1:与高级分析的可扩展性一样,Seeq通过使应用程序用户界面可扩展以访问客户创建的软件模块和算法,使ML和人工智能(AI)方面的创新民主化。这种可扩展性包括附加组件功能、附加组件显示窗格和附加组件工具。并行坐标的附加显示窗格可从Seeq Workbench软件的显示下拉菜单中访问。在Seeq Data Lab软件中,利用Seeq Python模块构建和部署附加工具。礼貌:Seeq集团。

图1:与高级分析的可扩展性一样,Seeq通过使应用程序用户界面可扩展以访问客户创建的软件模块和算法,使ML和人工智能(AI)方面的创新民主化。这种可扩展性包括附加组件功能、附加组件显示窗格和附加组件工具。并行坐标的附加显示窗格可从Seeq Workbench软件的显示下拉菜单中访问。在Seeq Data Lab软件中,利用Seeq Python模块构建和部署附加工具。礼貌:Seeq集团。

删除带有用户角色的数据竖井

为了打破数据科学团队和SME之间的孤岛,高级分析应用程序引入了针对不同用户角色的体验。每个角色的应用程序体验必须相互作用,以促进协作模型开发,消除反馈和返工的多次迭代。

一旦模型或算法被精细地调整,挑战就变成了如何将其从单个站点的单个流程扩展到制造组织的其他部分。这一挑战可以通过Add-on工具来解决,它提供指向和点击ui作为复杂ML和AI算法的前端,使流程工程师和其他中小型企业可以访问它们。

应用程序模式用于显示后台运行的算法的交互式前端设计。计划执行data lab笔记本可以使模型不断学习和重新计算。

制造商正在寻求灵活的分析软件,以将其内部知识产权(iP)纳入由合作伙伴或第三方构建或在公共市场购买的算法中。一个可扩展的分析应用程序可以满足这些需求。

尊重现有的数据治理

在多个级别(从数据源到算法到单个计算项)上配置权限,是确保支持组织数据治理和访问需求的成功解决方案的关键组件。在一个支持数据治理和访问的高级分析应用程序中部署定制功能、算法和显示,从而使公司能够利用现有的安全数据源连接。

在部署机器学习算法时,另一个关键考虑因素是确保解决方案体系结构保持源数据系统的完整性,而无需下采样、聚合或压缩。例如,当关键数据特征通过小时平均值平滑后,快速机械故障的检测变得更加困难。

两个用例演示了大规模的算法

环境管理:一家油气公司希望利用先进的分析技术实现可持续发展目标。一个集中的数据科学团队与现场工程师合作开发了一种神经网络算法,估计NOx基于当前状态运行的排放量。该算法作为一个附加工具进行操作,并可供现场工艺工程师进行连续监控。这种对过程排放的近实时洞察使工程师能够主动进行过程调整,以减少总体温室气体排放并改善现场环境性能。该附加工具已提供给该公司其他各炼油厂的工程资源,并作为监测环境绩效的最佳实践被广泛采用。

卓越的产品质量:一家专业化学品制造商希望建立一个产品质量配置的准确预测,但不确定哪个测量和操纵变量对目标信号有最大的影响。作为附加工具部署的相关算法确定了对产品质量影响最大的输入信号(图2)。

图2:一家专业化学品制造商试图建立产品质量处置的准确预测,但不确定哪些测量和操纵变量对目标信号的影响最大。Seeq开发了一种相关算法,并将其作为一种附加工具进行部署,以识别对产品质量影响最大的输入信号。通过量化多变量关系的大小,每年可节省50万美元。提供:Seeq公司。

图2:一家专业化学品制造商试图建立产品质量处置的准确预测,但不确定哪些测量和操纵变量对目标信号的影响最大。Seeq开发了一种相关算法,并将其作为一种附加工具进行部署,以识别对产品质量影响最大的输入信号。通过量化多变量关系的大小,每年可节省50万美元。提供:Seeq公司。

该算法还自动计算了上游信号与目标变量之间的过程动态滞后。在适当的时间延迟下,减少的信号数量被推回工作台软件,在工作台软件中部署一个预测模型。然后根据历史数据对模型进行验证,发现该模型能够准确预测90%以上的质量偏差。采用了这种新的基于模型的控制方案,每年在质量下降方面节省了50多万美元。

高级分析使ML可访问

ML是提高生产组织处理更多数据和改善结果压力的效率的必要创新。在应用ML算法解决过程控制问题时,数据科学家和中小型企业之间需要持续的交互,这阻碍了广泛的访问。

高级分析应用程序通过提供将ML算法纳入其软件的功能来解决这些问题和其他问题。这使中小企业和其他一线员工能够直接使用这些算法并与之交互,从而使这一强大工具民主化,在整个企业中广泛使用。

艾莉森·布尼曼他是一位在美国的行业负责人希克公司。由内容经理马克·t·霍斯克编辑,控制工程媒体与技术mhoske@cfemedia.com

关键词:数据分析,机器学习,人工智能

考虑一下这个

他们是主题专家你身边能应用机器学习吗?是竞争对手吗?


艾莉森·布尼曼
作者简介:Allison Buenemann是Seeq Corp.的行业负责人。她拥有过程工程背景,在普渡大学(Purdue University)获得化学工程学士学位,在路易斯安那州立大学(Louisiana State University)获得MBA学位。布内曼有超过5年的化学制造商工作经验,利用时间序列数据解决高价值的业务问题。作为Seeq的高级分析工程师,她是一个典型的客户倡导者,利用她的过程工程经验来帮助获取新客户、用例开发和企业采用。在她目前的职位上,她乐于监控化工行业数字化转型的快速变化趋势,并将其转化为Seeq的产品需求。