通过有效的报警管理减少停机时间和风险

更智能的设计能够在正确的时间提供正确的警报,这对于减少停机时间和运营商的风险至关重要。

通过理查德Slaugenhaupt 2021年12月1日
提供:Maverick Technologies,一家罗克韦尔自动化公司

学习目标

  • 不当的警报管理会导致生产损失,并可能导致重大工业事故。
  • 用户需要简化报警系统,并确定哪些报警需要立即响应,哪些不需要。
  • 还可能需要在警报管理方面进行广泛的内部培训和教育。

不当的警报管理会导致生产损失,在计划外停机时给工业设施造成数百万美元的损失,更不用说可能会引发重大工业事故。当运营商在设备故障期间面临数十个警报时,几乎不可能快速区分重要警报和不重要警报,从而在问题升级之前降低了解决问题的响应时间。

通常情况下,这些“警报泛滥”问题源于不合理的报警系统,其优先级较差,报警点设置不当,无效的通知,模糊或令人困惑的图形和/或人机界面(HMI)上的警报定义。遇到这些真实警报问题的设施可以从与工厂自动化系统整体集成的正常运行的警报管理系统中获益良多。

许多自动化供应商已经开发了工具来帮助解决报警问题,并减少操作员必须响应的报警数量和频率。然而,减少数量只能解决部分问题。

最终目标是将操作人员的注意力集中到与问题相关的最关键信息上。这需要更智能的设计,能够在正确的时间向正确的操作员发送正确的警报,并具有适当的重要性、背景和指导,以便他们能够纠正或迅速缓解情况。

报警最佳实践和哲学

ANSI / isa - 18.2 - 2016过程工业报警系统管理标准关注基于分布式控制系统(DCS)、监控和数据采集(SCADA)或可编程逻辑控制器(PLC)平台的现代过程自动化解决方案中的报警。虽然它通常应用于连续过程工业,但它的范围也适用于其他制造过程,如批量、离散和混合过程,因此它的适用性是普遍的。

该标准为管理报警系统的生命周期提供了指导原则和定义良好的流程。它阐明了警报哲学和合理化过程,作为一个整体的生命周期方法,从创建的想法开始过程和安全考虑需要的警报.同时也为告警的选择和实现设定了更高的标准。

该标准强调最佳实践,重点是为当前情况定义正确的警报数量,而不是为总数定义任何特定的最小或最大值。相反,重点放在报警率上。一个流程可能同时以多种方式偏离规范,当有太多非托管告警时,这是一个真正值得关注的问题。当这种情况发生时,操作人员可能会不知所措,很难将真正重要的警报与重复或不相关的警报分开。因此,作业人员的态势感知能力会受到影响,作业人员最终会做出糟糕的作业决策,甚至会使问题升级。

像许多ISA标准一样,ANSI/ISA-18.2被认为是公认和接受的良好工程实践(RAGAGEP),因此它的应用被许多安全监管机构视为制造商的操作要求。该应用程序的一个基本方面是创建警报理念文档,该文档定义了对警报的严重性、紧迫性和响应进行评级的标准。简单地说,告警管理理念是一套有效管理告警的指导原则,是告警管理系统正常运行的基础。有了它,设施可以标准化、设计、开发、实施、修改、管理、维护和持续改进警报。警报响应程序还可以开发,并与HMI集成,以帮助操作员有效地响应,以减轻异常情况。

在建立了报警理念标准之后,报警合理化流程有助于最大限度地减少所需的报警数量,以保持操作条件的高效和安全。告警合理化团队根据告警哲学标准审查、证明、验证和记录每个告警。合理化的主要目标是评估告警,确定根本原因和确定操作员需要哪些警报并且应该包含在有用的警报池中。

报警的危险性,以帮助流程操作员了解

为了进一步说明这个过程,让我们考虑一个压缩机停机并同时影响多个进程。这一事件可能会导致操作员的屏幕亮起大量警报。在这种情况下,操作员真正需要知道什么?压缩机坏了,这是紧急警报。其他无数的警告模糊了现实。关闭的原因可能与温度、压力、电气跳闸或其他因素有关——所有这些都是与原因条件相关的有价值的信息。由关机事件引起的警报使情况混淆。

一旦确定了事件的重要性和影响,有针对性的分析可以帮助将潜在的相关警报分为根本原因、触发事件以及由初始事件导致的所有其他条件和事件。每一种类型的警报都应该区别对待。因果警报的配置方式应使操作员能够得到足够的预警,以便及时做出反应,防止发生关键事件。如果该事件确实发生,应抑制由此产生的警报,以免影响操作员的态势感知。

合理化警报:将信息与行动分开

上述评估是控制关键事件发生时操作员可能遇到的警报数量的良好第一步,但检查每个警报以确保其满足基本要求(操作员是否必须)也非常重要行为闹钟响了。告警合理化过程是清除不符合此要求的所谓“告警”的关键,这些“告警”应归为单独的仅信息事件组。该过程还有助于确定必要的操作员响应时间,以及不及时采取行动的后果。

在上面的压缩机场景中,一些限定问题应该是,“操作员必须对警报采取行动吗?”如果“是”,那么合理化过程应确定在后果发生(如压力下降或压缩机完全停止)之前,操作人员需要多长时间采取行动。同样重要的是确定什么都不做的严重程度,这有助于分离出严重警报。这就引起了人们对意外停机、人员安全或环境破坏的关注,从而导致停机成本甚至人员受伤。

由于必须考虑的警报数量之多,合理化工作是一项重大的努力——但这种努力是值得的。这个过程强调了一个重要的认识,即许多“警报”根本不是警报。即使是这样,它们也并不总是有用或必要的。关键是将警报通知减少到最需要的时候,并在不需要的时候抑制。

智能设计可以在正确的时间将正确的警报传递给正确的操作员,并具有适当的重要性、背景和指导,以纠正或快速缓解情况。这些指标在Maverick Technologies展台的2021年自动化博览会上显示出警报状态。提供:Maverick Technologies,一家罗克韦尔自动化公司

智能设计可以在正确的时间将正确的警报传递给正确的操作员,并具有适当的重要性、背景和指导,以纠正或快速缓解情况。这些指标在Maverick Technologies展台的2021年自动化博览会上显示出警报状态。提供:Maverick Technologies,一家罗克韦尔自动化公司

抑制告警:动态和静态三种方式

如前所述,在无用时抑制警报是管理大量潜在警报的一个关键方面。事实上,很多时候这是将报警率降低到可管理水平的最佳方法。为此,ANSI/ISA-18.2定义了以下三种形式的告警抑制:

  • 搁置-操作员手动暂时抑制告警。
  • 设计——过程自动化系统根据一组特定的条件抑制警报。
  • 退出服务-由于部分设备因维护或其他原因关闭,警报已被抑制。

三者中最有趣和最具挑战性的是设计抑制,它进一步分为两类——动态和静态。动态抑制是这两种方法中最具挑战性的,因为它需要创建系统用来确定警报重要性的规则。它为自动化系统提供了足够的智能,以确定最重要的警报,确保它们被宣布,并抑制不必要和不相关的警报。正是这种智能帮助你在心烦意乱或其他复杂情况下避免警报泛滥。

静电抑制是根据工艺和设备的状态而定的。在定义的过程或条件中启用或抑制特定的告警。例如,某些告警可能只在单元启动期间启用。在这两种抑制类型中,这种技术更简单,实现也更普遍。

合格人员:培训定义、流程

如上所述,应识别并记录关键警报,并在警报理念文档中定义其处理方法。告警管理程序将此文档与合理的告警系统结合在一起,使操作人员能够识别根本原因并解决问题。这个过程将是漫长而乏味的,合理化团队可能每天必须处理超过100个警报,对于一个大型工厂来说,警报数量可能超过10,000个或更多。出于这个原因,管理意识和买进是必要的,以看到整个过程完成。

可能还需要对内部人员进行培训,以适当地制定警报清单,并设计、部署和维护警报清单,但很少有公司有足够的人员具有足够的带宽或深度技能和经验来执行这项工作。在这些情况下,应咨询有经验的第三方合作伙伴——他们可以创建和维护警报管理程序,并具有广泛的经验,可以在实施过程中提供指导和协助。结合上述基于标准的报警管理程序,虽然资源密集型,但考虑到人员的潜在安全风险和潜在的巨大生产损失成本,这种努力是非常值得的。

理查德Slaugenhaupt特立独行的技术是CFE Media的内容合作伙伴。由网页内容经理克里斯·瓦夫拉编辑,控制工程CFE媒体与技术,cvavra@cfemedia.com

更多的答案

关键词:报警管理,过程安全

考虑一下这个

你好吗管理你的闹钟,让这个过程更有效率?


作者简介:Richard Slaugenhaupt (Richard.Slaugenhaupt@mavtechglobal.com)是罗克韦尔自动化公司Maverick Technologies的顾问。他拥有38年的多学科制造经验,其中18年担任工厂工程师,其余时间担任行业顾问。