设备诊断与资产管理

随着现场设备和网络变得越来越智能,我们在如何使用它们并将这些信息用于工作方面是否变得更加聪明?一位自动化顾问回顾了他的经验,制造业的状态,以及工厂如何更好地利用这些信息。

赫尔曼·斯托里,赫尔曼·斯托里咨询公司 2011年1月27日

有效的资产管理本质上是一个技术问题,还是一个人员流程?“资产管理”中的第二个词可能是更大的问题。我在壳牌全球解决方案公司工作的几年里,通过与各种技术组织的联系,我一直担心,尽管设计良好的程序可以带来好处,但有效使用这些工具的公司似乎相对较少。

毫无疑问,现场设备已经变得越来越智能。在过去的几年里,流量计或阀门执行器所能传达的信息量突飞猛进。但是简单地将这些诊断功能添加到硬件上并不能形成有效的管理程序。其中一个原因是,在大多数行业中,对于作为资产管理计划的一部分,管理层应该做什么或负责什么,没有标准或期望。一些严格监管的行业(如运输部门)提供了例外,但它们不一定为流程世界的其他部分提供有用的示例。

机会

在资产管理计划的更大背景下有效地使用设备中的自动诊断功能可以在许多层面上为制造业提供巨大的好处。第一个也是最明显的效果是提高了维护活动的效率和效果。这里有一个典型的情况:仪器维护活动中最常见的响应之一是“没有发现问题”。这通常是发生了几件事之后的结果:
•派遣一名维修人员带着测试设备前往现场;
•机组人员花费了大量时间和成本进行故障排除;
•他们可能经历了一些故障排除活动的风险;而且
•该活动充其量只是延迟了原始问题的解决。

有效的诊断工具可以使这些活动从中央控制设施甚至远程位置快速轻松地执行。将数据交给专家,而不是让专家去解决问题,这是一个强大而未被充分利用的概念,但它取决于一组良好的诊断工具和有效的工作流程的适当实施。

自动化诊断的第二个潜在的更大的好处是能够在故障产生重大影响之前检测和修复故障。在这种情况下,“repair”有两个含义。一种含义是通过控制系统配置自动处理故障。这是一种被广泛使用的技术,但远非通用。第二种含义涉及人工干预,以实时处理早期故障。第二种意思是可能的和实际的,但很少实现。在一些糟糕的事情发生之前修复早期故障需要新的工作实践,这对大多数维护组织来说是陌生的。实现在操作受到影响之前进行修复的能力,可以以最小的物理基础设施投资,在盈利能力、安全性和环境性能方面提供显著改善。

障碍概述

考虑到资产管理的巨大激励和低资金成本,这项技术似乎将得到广泛应用。但现实远非如此。让我们来看看这些障碍,并提出一些可能的解决方案。

第一个障碍是技术障碍。可用于资产管理的工具传统上是不完整的、难以使用的、集成不良的(多个重叠的工具)、快速发展的,并且供应商的支持很差。通常情况下,用户没有必要的工程资源来克服这些障碍,并集成一个对现场组织来说实用和可用的解决方案。好消息是,这些工具正在改进,用户已经能够演示使用它们的有效方法。坏消息是,有效使用有效部署所需的工具和工程技能的情况很少。

资产管理的第二个问题是管理。所有的技术问题都有解决方案,并给予管理层支持。然而,管理层的支持并不是必然的。管理层要支持可持续资产管理计划,就必须为此获得奖励。如果管理层的唯一回报是季度回报,维护活动将被推迟,直到资产不可持续。延迟维护的短期影响通常是没有的。无限期延期的长期影响总是对资产不利的。

资产管理的管理奖励需要良好的度量标准、良好的报告和有效的审计。有效的奖励必须有一个有效的记分卡。对于许多操作来说,这个记分卡不一定存在。

在缺乏良好的管理体系的情况下,表现不佳往往被视为技术问题,或者只是正常的状态。谁应该对诊断信息采取行动?维护吗?在大多数组织中,让维护人员查看大量无法理解的未优先级的诊断数据,并根据这些信息决定应该做什么是非常困难或不可能的。正确实现的系统可以提供顺序和优先级,使数据对工程和维护组织有用。

早点出发

实施资产管理计划本身就是一个项目。它可以是现有设施的独立项目,也可以是新建筑或控制系统现代化的附加项目。对于现有设施,智能现场设备通常没有连接到智能系统,因此存在许多搁浅(无法使用)的诊断。在现有设施中实施系统工具的成本可能是一个问题,但它是可控的。对于新建筑来说,资产管理工具的额外成本几乎可以忽略不计。但这只是硬件方面。无论哪种方式,工作流程、培训、度量标准和管理流程都必须同样地实现。

任何项目的第一阶段都被称为前端设计(FED)或类似的名称,这是业主决定他想做什么以及如何做的阶段。资产管理的实施需要在项目的这个阶段进行规划。灾难的秘诀是购买一些资产管理软件,在其原始状态下使用它进行调试,并将其作为故障排除工具移交给维护。一旦项目人员带着处于这种状态的工具离开工厂,它很可能永远不会再被使用。

资产管理计划的首要活动之一是为每一件主要设备和每一件设备创建一个关键等级。这通常是一个痛苦的过程,但如果你没有一个好的系统,那么一切都将被列为关键。这是因为人们知道,如果某个东西没有被列为关键,它就不会得到修复。您需要知道影响的严重性和问题的可能性,以便进行良好的临界性排名。当然,当你真正收到设备警报时,你只对影响感兴趣,因为可能性是1。它就这样发生了。影响是您当时唯一感兴趣的东西,这将设置失败警报的优先级配置。

您将在整个设计过程中使用此关键信息,同时实施其他维护活动和计划。但许多人在FED期间并不这样做,通常是等到系统构建、安装和运行完成后才这样做。然后他们想,“我们现在需要做维护,所以让我们做一些临界排名吧。”如果你想要一个有效的项目,这必须在设计阶段完成。

您还需要在FED期间管理您的供应商列表。您需要合格的供应商,而不仅仅是公开投标。你选择的那些需要设置大量的模板,因为带有诊断功能的智能设备有无数的默认设置。有很多数据库工作必须在早期开始,以便您可以导入所有这些模板,并直接进入您的设计和构建过程。

如果你尽早开始并系统地进行工作,工厂的建设和启动过程将会更快、更顺利。在设计和工厂验收测试期间,您需要进行构建、创建工具并培训人员。在安装、调试和循环检查期间,您希望在这些阶段使用所有这些诊断。通常情况下,系统会在那里为自己买单。在工厂启动之前,你已经收回了投资。历史告诉我们,在大多数我们这样做过的工厂里,我们把系统调试好,启动工厂,重新检查和验证一切,纠正所有错误,然后我们把系统关掉,再也不去看它。尽管该系统在建造和调试期间实现了自我补偿,但设施所有者在工厂运行期间却错过了巨大的回报。

一旦工厂开始运转,忽略系统并不一定是正常的事件链。不幸的是,实际情况是,如果项目组织没有实现资产管理系统,工程和维护人员通常没有资源来创建资产管理系统。

哺育黑洞

在讨论这个话题时,我所做的陈述之一是,大多数诊断信息都进入了“黑洞”。这通常会导致一些震惊的表情。这并不是因为缺乏可用的数据;而是似乎没有人知道如何处理被收集的东西。搁浅的诊断信息并不是唯一的问题。是工具和工作过程。将调制解调器与有线HART连接起来并不难。这些电线到家里,你可以把调制解调器连接到这些电线上,比你添加无线HART通信器便宜。但这不是问题所在。问题是现在你已经把数据带进了房子,下一步是什么? What kind of system are you going to use to manage the data, generate reports, do the alerting, and keep the configuration properly hosted and up to date? You can move the data stream into the house, but it’s just going to go into the bit bucket unless you do something with it. If all you do is put in wireless THUMS, you’re feeding the black hole. It’s not a technical issue—it’s a system problem and a management problem. That’s what makes this whole discussion so complex and challenging.

建立这些工作流程是创建可行系统的关键步骤,而系统供应商并不总是能提供帮助。他们的工具可能不适合特定用户的工作流程。虽然情况正在改善,但用户不得不在内部创建资产管理系统工具和工作流程,因为他们无法在商业上找到他们想要的东西。有些供应商为预测性程序提供了详细的程序和工作流程,在这些程序中,您可以根据历史、故障率、临界性等进行优化的定期维护,但没有任何程序将诊断用作工作流程。您需要覆盖所有的系统节点、网络和模块,但是资产管理系统通常集中在现场设备上。你不能把节点和网络当作系统的一部分。我们需要在一个系统中管理整个资产。

重要的是要理解黑洞不仅吞噬诊断信息,还吞噬设备配置。除非仔细管理,否则配置精度是不稳定的。解决方案是使用系统范围的配置数据库,该数据库始终与现场设备保持同步。这种级别的配置精度可以出现在精心集成的系统中,但不会出现在手持便携式配置工具中。

管理优先级

传统的维护技术采用可靠性矩阵来管理维护优先级。我们已经做了风险评估,我们已经确定这个设备是中低优先级的。我们看着我们必须做的事情的清单,以及今天有多少重要的事情在盘子里,所有低优先级的事情都被推迟了,有时甚至永远推迟了。所有的一切。由于预算的原因,它甚至可能在周转期间得不到解决。所以低优先级的东西会累积失败。这很好,只要你没有太多的失败。足够低优先级的故障可能导致更大规模的系统故障,因为操作人员无法判断发生了什么。没有足够的尺寸。没有足够的控制。 You can’t run the plant. System failures have greater impact than low priority device failures, but treating devices individually can lead to system effects that are not modeled or managed by the simple decision matrix.

通常在重大故障或操作灾难之后,调查发现有许多日益严重的问题的迹象,但没有人能够看到它们或正确地解释他们所看到的。现场设备诊断试图警告一个日益严重的问题,但没有人能把这些点联系起来。它通常是一些小事情的累积,直到它们达到一个临界质量。如今,小问题(低优先级)的累积在运营公司中很常见。如果你看灾难分析,你会发现问题的积累。他们让这个小事情失败了,这个小事情失败了,这个小事情失败了,没有人举起旗帜,因为他们都是小事情。一段时间后,足够多的小事情串联起来,成为一件大事情。如果你把瑞士奶酪上所有的洞排成一行,就会发现有一个洞贯穿整个奶酪。这是另一个管理失败。

这也是技术上的不足,因为我们没有办法对失败的集合进行建模。当你看我们的安全系统模型时,你看到的是单个的故障,模型假设除了这一个故障,其他一切都是正常的。在基本的过程控制领域,你不能做这样的假设。您通常可以假设在同一时间有很多故障没有得到修复,并且随着时间的推移,它们正在慢慢累积。对工厂的检查经常发现这种失控的情况。这些设施通常处于亏损的边缘,业主无法决定是否应该关闭它们。你可以改变这样的植物,但它不会发生在维护中——它会作为一个项目发生。

将数据发送到正确的位置

一旦有了适当的数据收集系统,并且开始设置工作流程,就需要确定数据流的去向。传统的问题是,它是要交给维护人员还是运营商。如果你遵循一些简单的原则,这并不是一个困难的过程:如果需要操作员立即采取行动,则向操作员发送警报并进行维护。操作人员的警惕理念是,当个别事件出现时,你要处理它们。您需要有限数量的警报,以便操作员可以实时采取一些独特的操作。

在维护方面,您不希望处理单个事件。您希望记录发生的每一件小事,然后您希望使用报告对所有这些记录的事件进行排序,并从中获得一些意义。你要查看历史记录,分析发生过一次、多次的情况,优先级有多高,以及是否发生在多台设备上。如果您只关注单个事件,您可以从报告中看到丢失的趋势。空气系统的一个问题每天都可能导致数百个事件。您需要一种报告格式,可以将所有这些放在一起,并确定一个共同的来源。显然,使用智能设备诊断的有效资产管理程序可以带来重大收益。

什么时候烤?

这真的很容易分辨。如果在工厂发生意外关闭后,您经常使用诊断方法来查找某些东西是如何失败的,那么您还没有完成工作。如果您有一个保存的大型数据库,其中使用了诊断来防止计划外的工厂关闭,那么您就在正确的轨道上。

赫尔曼·斯托里(Herman Storey)是他是Herman Storey咨询公司的顾问,经常就资产管理项目和其他主题发表演讲。联络他的地址是herman.storey@live.com