数据采集、数据收集

数据分析和大数据的软件准备

拓展产业数据访问和使用的工具,比如消息队列遥测传输(MQTT),它可以帮助制造商实现工业4.0的利益得到更多的出来。

特拉维斯考克斯 2020年3月10日
礼貌:归纳自动化

工业4.0的一个主要方面是大数据采集和分析,将数据转化为可操作的信息,并使系统能够自行做出决策。尽管有了新技术,大多数组织仍然使用剪贴板和纸张来收集数据和信息。在许多情况下,高达90%的数据最终滞留在筒仓或孤岛中。这给实现工业4.0的好处带来了挑战。

好消息是,新的技术可以帮助,并有用户可以采取的数字化改造做准备,其中包括几个简单的步骤:

  • 获取更多数据
  • 边缘计算
  • 数据清理
  • 中将数据
  • 标准化通用数据结构。

旅程从获取更多数据开始——这是工业4.0的一个重要组成部分。操作世界是复杂的,涉及数百种不同的协议、通信媒介和遗留设备知识。数字化转型的现实是必须自下而上地实施,首先使用操作技术(OT)。它需要一种保持系统开放、互操作和安全的新心态。第一步是以一种有效的方式访问所有数据——能够在需要时从任何来源轻松地访问数据。

一个数据访问的最大障碍是传统的软件授权模式每标签或使用费。这些模型并没有形成规模,禁止发展。此外,工业应用已被关闭,所有和有限的功能和连接。今天,我们需要新的模式,从根本上无限的和开放的。这些新车型可以解锁扩张和更大的可扩展新的机遇。

另一个挑战是平衡新的智能传感器和设备与现有的传统设备的融合。重要的是要有一个能够支持两者的基础设施。它可以归结为一个关键的概念:架构更改。我们需要停止用协议将遗留设备连接到应用程序,而是将设备连接到基础设施。此外,我们还需要提供一种即插即用、可靠且可扩展的OT解决方案,以满足运营商的需求。

新架构

这种新结构的用途消息排队遥测传输(MQTT),发布/订阅协议,使面向消息的中间件架构。这不是在信息技术(IT)领域的新概念;企业服务总线(ESB)一直被用于在类似总线的基础设施应用的集成。与MQTT,设备数据由异常发布到MQTT服务器,或者在该处或在云中。应用程序订阅MQTT服务器获取数据,这意味着没有必要连接到终端设备本身。

MQTT提供了几个好处:

  • 开放标准/可互操作(OASIS标准和Eclipse开放标准(TAHU))
  • 解耦应用设备
  • 由异常报告
  • 不需要多少带宽
  • 运输层安全性(TLS)
  • 远程发起的连接(出站只;无入站防火墙规则)
  • 有状态的意识
  • 单一真理来源
  • 自动发现的标签
  • 数据缓冲(存储和转发)
  • 即插即用功能。

要进入一个新的架构,答案是边缘计算和协议转换。比方说,有10个连接到监控与数据采集(SCADA)系统Modbus设备。用户可以部署具有支持Modbus和MQTT的一个边缘网关推轮询接近可编程逻辑控制器(PLC)。用户可以查询更多信息,有可能以更快的速率,并且,因为他们改变到一个中央服务器MQTT发布的值。该SCADA也可以改变连接并订阅MQTT服务器来获得,而不是连接到终端设备中的数据。

这是面向未来的SCADA系统的一个重要步骤。作为用户获取传感器或升级设备,支持MQTT中,SCADA将获得访问数据,而不必了解终端设备。

MQTT的发布/订阅功能,简化沟通并有助于推动轮询到网络边缘。礼貌:归纳自动化

MQTT的发布/订阅功能,简化沟通并有助于推动轮询到网络边缘。礼貌:归纳自动化

帮助系统理解数据

用户不仅需要访问数据,而且还需要确保数据是有效的、具有上下文并且是公共结构(如果适用的话)的一部分。这是使用分析和机器学习之前的一个重要步骤。这些系统需要理解数据,以便正确地使用它。通常,新的传感器和设备已经具备这些设施。然而,对于传统设备来说,情况并非如此。有数百种不同的轮询协议需要映射和扩展。大多数plc的寻址方案不是人类可读的。这些映射通常存在于SCADA中,但仍然缺乏上下文,或者可能包含无效数据,或者不是标准数据结构的一部分。

处理这一步的最佳位置是在连接到PLC的边缘网关。它要求在地方干净数据,添加上下文和支持数据结构功能的软件。

让我们从清理数据开始。假设有一个传感器连接到PLC,信号有时会掉下来。当信号退出时,PLC中的值降为0。但是,当最后一个值是50时,这个值可能等于0。在本例中,重要的是查看delta,以确定是否应该忽略当前值。用该逻辑设置一个计算标签可以解决这个问题。在与其他系统一起使用数据之前,确保数据在最接近源的地方是有效的,这一点很重要。

另一个关键步骤是为数据提供上下文。例如,用户可以有一个Modbus PLC,标签编号为40001。在SCADA中,我们将其映射到标签名称,如“Ambient Temperature”。如果这是我们唯一的数据,我们不知道温度是摄氏还是华氏,以及高低范围是什么。分析和机器学习模型将在没有适当上下文的情况下提供不正确的数据。

使用能够提供名称、缩放、工程单元、工程高低、文档和工具提示的边缘网关,将为其他系统提供关键信息,以更好地理解底层数据。

增加对企业的价值

最后一步是在整个企业中标准化通用数据结构。这个步骤经常被跳过,因为每个站点的数据可能不同,而且很难找到通用的数据模型。分析包和机器学习模型要求普通对象的数据处于相同的结构中。用户不希望为每个站点创建不同的分析或机器学习模型。这不仅仅是一个单独的数据点,而是一个已知对象的数据点集合。

对每个站点进行调查以找到一个公共模型并使用支持用户定义类型(udt)的边缘网关是很重要的。这意味着调整每个站点的数据以适应模型,包括缩放、计算标签、转换等等。因此,数据在表面上看起来是相同的结构,而在幕后隐藏了复杂性。

旅程从操作性基础设施开始,并解决将数据导入基础设施的问题。用户只有接触到数据才能接触到分析和机器学习。该数据需要是有效的,并具有可理解的上下文。用户可以通过采用这种新的思维方式和架构来实现这些技术的潜在好处。

特拉维斯考克斯销售工程副主任在吗归纳自动化.由CFE Media and Technology, Control Engineering,副主编Chris Vavra编辑,cvavra@cfemedia.com

更多的答案

关键词:消息队列遥测传输,大数据,MQTT

大数据采集将数据转化为可操作的信息的分析是工业4.0的一个主要方面。

当前的体系结构我们使用消息队列遥测传输(MQTT)来帮助理解数据。

用户需要经常访问正在生成的数据,它需要有一个有效的上下文。

考虑一下这个

你是什么这样做,以简化数据采集,以便更好地为工业4.0准备?


特拉维斯考克斯
作者简介:感应自动化销售工程副总监。