管理警报

技术是好的,所以技术越多越好。对吧?错了。更多并不总是更好。微处理器的出现和现代分布式控制系统(DCS)的普及使得警报某些东西——实际上是所有东西——变得很容易,而且成本很低,甚至没有成本。因此,今天的许多设施每天都有大量的通知,导致令人沮丧的错误。

通过珍妮Katzel 二七年二月一日
栏:
“正常”告警信息的属性
网上资源:
标准、基准、最佳实践

技术是好的,所以技术越多越好。对吧?

错了。更多并不总是更好。微处理器的出现和现代分布式控制系统(DCS)的普及使得警报某些东西——实际上是所有东西——变得很容易,而且成本很低,甚至没有成本。因此,今天的许多设施每天都有大量的通知,导致令人沮丧,有时令人困惑,有时甚至是悲惨的情况。

“每个人都知道警报管理很重要,但不知何故,它似乎很少重要到足以证明工厂的项目,”西门子能源与自动化PCS7市场经理托德·斯托弗(Todd Stauffer)说。然而,最近的事件暴露了警报管理不善的后果,其中包括2005年3月英国石油公司在德克萨斯城的炼油厂发生爆炸,造成15人死亡,170人受伤,这可能会改变这种态度。(请访问美国化学品安全与危害调查委员会网站上的视频室,查看有关该事件的报道,部分原因是警报没有完全发挥作用,www.csb.gov.)

这一事件和其他此类事件促使许多工厂的人员重新思考警报管理程序,并研究是什么导致了大量的警报,学习并采用最佳实践,并促进标准的制定。重新燃起的兴趣促使公司考虑并纳入诸如工程设备和材料用户协会(EEMUA) 191号出版物等基准;“报警系统:设计、管理和采购指南”,许多专家称之为事实上的告警管理标准。Iconics营销总监Tim Donaldson指出,“警报分布、标签频率/抖动、交叉相关性、操作员响应时间和操作员间隔变化都是EEMUA的报告指标,这些指标为改善工厂运营提供了有价值的信息。”此外,终端用户和供应商都支持ISA的SP-18.02《过程工业报警系统管理》等标准的开发。(有关这些指导方针的更多信息,请参阅相关章节“标准、基准和最佳实践”。)

开始

大多数行业遇到的警报远远超过了人们认为的良好做法。EEMUA数据是191号出版物(1999)“报警系统:设计、管理和采购指南”中的推荐基准。

关于警报管理,最明显的问题是为什么会有这么多?Stauffer是这样解释的:“在模拟时代,警报是硬连接的。它们必须经过精心设计和安装。每一次警报都有实际的成本——大约1000美元——所以他们做得很谨慎。在现代DCS系统中,警报基本上是免费的,所以工厂往往会尽可能地启用每一个警报。”

事实上,如今的运营商经常面临几乎持续不断的警报。EEMUA的191号出版物建议,平均每10分钟应该有1个,或者每天不超过144个。大多数行业报告的警报级别明显更高,范围为每10分钟5-9个(见对比图)。英维思过程系统公司(Invensys Process Systems)警报管理服务总监戴维•盖尔特纳(David Gaertner)回忆说,在一个工厂里,五名操作员在六个月的启动期经历了大约500万次警报。“一台设备发出了55万次警报。持续了好几个月仍然没有人会疯到去关闭它。”

过去的做法是,不管你是否确定它是必要的,都要设置一个警报。然而,警报设计的最新范例是,只有在需要操作人员操作时才配置警报。这一理念反映了系统设计实践和操作员交互方面的根本性变化,被纳入ISA SP18草案中。它将警报定义为“向操作员指示设备故障、工艺偏差或需要响应的异常情况的声音和/或可见手段。”遵循“只有在需要采取行动时才配置”的做法,让操作员知道当警报响起或闪烁时,他需要采取行动。

以牙还牙

如果有一条管理警报的建议比其他任何建议都更常见,那就是:“除非你有工具(通常是软件)来衡量,否则不要做任何事情。”来自ISA SP-18.00.02报警管理标准委员会联合主席、杜邦化学解决方案企业过程控制技术经理Nick Sands的这番话强调了监控的必要性。“监控系统必须告诉我们警报处于什么状态,”Sands解释道。“有多少在维修?”有多少是最高优先级的?有多少与安全有关?它还需要告诉您系统的运行情况。是实现你的目标,还是遵循你的哲学?”

一个好的报警系统需要一个指导性文件作为它的基础。ISA的SP-18.02,过程工业报警系统管理,提出了一种基于生命周期模型的整体方法,其中包括定义理念、培训、监控和审计。

Wonderware可视化产品高级产品经理Keith Jones补充说:“许多行业,如制药和食品饮料,已经被要求维护材料或成分的数据库。这些信息也可以用于告警分析。我们可以实现一系列实时组件,以可视化可能出现警报问题的位置。例如,可以绘制简单的报警频率直方图。可以创建各种级别的警报报告,为经理和执行人员提供数据。”

英维思的加特纳表示,每个警报管理程序都应该有两个基本部分:“一个好的分析工具,可以识别哪些设备发出的警报最多;并通过良好的工作流程,将人员和资源结合起来,根除这些问题。分析工具帮助您了解问题在哪里。它可以帮助确定最频繁的警报,抖音警报,骚扰警报。它帮助我们了解警报发生的地点和时间,这样我们就可以进行根本原因分析,了解为什么会有洪水,并重新确定警报的优先级。很多工厂都把所有的警报设置为高优先级。这是不可接受的。分布通常应该将所有告警的5%限制在优先级#1,15%限制在优先级#2,80%限制在优先级#3。然后,运营商可以对那些真正重要的问题做出回应。”

然而,Matrikon的警报管理解决方案和全球培训总监Mark McTavish警告说:“记住,软件只是你使用的工具,而不是解决方案。警报应该是例外,突出显示超出边界的内容。成功的警报管理程序可以帮助工厂达到这一目标。它们帮助工程师日常管理工厂,实现更严格的质量控制和更高的生产率,因为它们减少了计划外停机。”

一个“以操作员为中心”的函数

然而,即使有良好的报警系统和监测和分析其性能的机制也是不够的。ISA SP18联合主席Sands强调,他们需要一种理念,一份形成整个报警系统基础的指导性文件。在制定标准时,“我们不仅关注警报的合理化,”Sands说,“而且关注警报的整个生命周期,包括培训、修改、基准测试、针对现有流程的定期监控。我们想采取一种全面的报警管理方法,在某些方面模仿ISA 84.00.01,功能安全:过程工业部门的安全仪表系统.(参见告警管理生命周期模型图。)

这种方法包括需要考虑操作符。Matrikon的麦克塔维什指出,大多数人低估了操作员参与的重要性。“告警管理是以操作员为中心的。“工程师们发现很难理解操作员的问题,除非他们真的坐在操作员的椅子上,体验过警报管理。他们自以为知道运营商需要什么,但往往并非如此。”

通过HMI将信息正确地呈现给操作员是告警管理的一个关键方面。Wonderware公司的琼斯说:“警报需要经过过滤,只有正确的警报才能到达操作员那里。软件提供了他们轻松配置这些参数所需的工具,但响应的一致性和确认也很重要。”

通知操作员警报的消息必须明确需要什么。例如,西门子的Stauffer说:“当过程控制工程师配置一个系统时,他可能会根据ISA标签ID或环路ID标记物理设备:LIC-120可能是一个警报。但操作员通常不是这样称呼那台设备的。他将其视为“XYZ坦克的关卡控制器”。如果消息向操作员传递了错误的信息,就会产生问题。操作员是目标受众,而不是过程工程师。接线员是做出反应的人。讯息必须是他能立刻明白的!”

PAS的创始人兼首席执行官Eddie Habibi补充道:“操作员的效率对工厂的可靠性和盈利能力有显著影响,远远超出了改善报警管理系统的范围。对操作员的投资与对先进过程控制的投资同样重要。没有适当的人为因素,就不可能有有效的经营者。一个称职的操作员知道这个过程;良好的人际交往和沟通能力;通过养成良好的生活习惯,在工作中保持警觉。在DCS出现之前,”他接着说,“操作人员有一个过程的物理布局,一目了然地显示所有管道和仪器仪表。随着基于计算机的监测的引入,数百个p&id被复制到计算机系统中,而很少考虑操作界面的设计。当我们从模拟系统和控制板的物理布局转向带有屏幕接口的数字系统时,作业者失去了大局。”

Habibi强调说,操作员还需要了解这个过程。“我们经常忽视培训。泵或压缩机的工作原理是什么?航空公司的飞行员要接受无数小时的训练。在他被允许为这么多人的生命负责之前,他必须有丰富的经验。一个化工厂的操作员可能有同样多甚至更多的生命,但他通常会接受几个月的培训,然后在工作中学习。我们需要更加注意提高工厂操作员的能力。”

付出代价

好的警报管理需要花费时间和金钱。但警报管理不善也会造成生产损失,危及生命安全。尽管启动警报管理程序,或审查和改进一个程序可能令人生畏,但有大量信息可以帮助建立和实现警报管理目标。

最重要的因素是设定目标并采取行动。Matrikon公司的McTavish表示,系统应该提供及时、无重复的相关警报,以帮助运营商诊断问题并确定成功的行动方案。“我们的目标是让工厂处于安全可靠的工作状态,从而生产出高质量的产品。”最终,我们的目标是获得经济上的利润。如果一种植物不能做到这一点,那么它的存在就有问题了。”

警报管理是一个过程,而不是一个项目,英维思的Gaertner总结道。“这就像工厂里的安全一样。它正在进行中。你永远不会结束。我们已经知道低性能的高成本,而工厂不愿意再付钱了。代价太高了。”

作者信息
珍宁·卡泽尔是《控制工程》杂志的高级编辑。与她联络:jkatzel@reedbusiness.com

“正常”告警信息的属性

EEMUA基准测试文档鼓励的最佳实践之一是在警报消息中清晰、一致地表示信息。每个显示屏应:

清楚地识别发生的情况;

使用操作人员熟悉的术语;

使用一致的缩略语从一个标准的网站词典缩略语;

具有一致的消息结构;

不依赖于学习标签名称或数字;而且

工厂运行期间是否检查过可用性

信息来自EEMUA出版物191(1999),“报警系统:设计、管理和采购指南”。

网上资源:

异常情况管理联盟;

警报管理手册,Bill Hollifield和Eddie Habibi的综合指南,PAS (ISBN 0-9778969-0-0);

化学品安全委员会;

工程设备和材料用户协会,EEMUA出版物191,“报警系统:设计、管理和采购指南”

仪器仪表、系统和自动化协会标准;

标准、基准、最佳实践

警报管理的最佳实践很少。目前行业内主要是EEMUA 191号出版物(1999)。报警系统:设计、管理和采购指南它为开发报警系统的理念、系统设计和功能、优化现有系统的操作以及指定新系统提供指导。该文件是由行业从业者与美国异常情况管理协会(ASM)联合开发和撰写的,ASM是霍尼韦尔领导的研发集团。

有关这些最佳实践的更多细节,请访问EEMUA和ASM联盟网站

ISA的标准制定机构,仪器仪表、系统和自动化学会(

委员会联合主席尼克·桑兹(Nick Sands)说,目标是制定一个共识标准,也将成为ANSI标准。桑兹说:“2003年10月,标准的工作正式开始。“我们的委员会中有来自S84(功能安全:过程工业部门的安全仪表系统)和SP101(人机界面)的两名成员,以确保我们所做的工作与这些标准一致。在这一点上,我们已经完成了第二稿,但仍然需要做一些修改。我们希望在2007年夏天之前有一份草案供投票。”他补充说,一个乐观的目标是,该标准将在今年年底前到位。

如果您有兴趣参与ISA标准的开发或有什么建议,请给联合主席Nick Sands (nicholas.p.sands@usa.dupont.com)或Donald Dunn (donald.dunn@aramcoservices.com)发电子邮件。有关标准的更多信息,请访问ISA网站