炼油厂网络切换导致停机

一家炼油厂试图在计划的维护窗口期间升级一个单元的过程控制网络(PCN)开关,但这导致了几个小时的停机时间。

通过约翰Cusimano 2019年10月24日

一家炼油厂试图在计划的维护窗口期间升级其一个装置中近10年历史的过程控制网络(PCN)交换机。新交换机是由与旧交换机相同的制造商生产的更新型号。

工人们把配置文件搬过来,仔细检查了一遍又一遍,安装了新的开关,设备又恢复了正常运行。不幸的是,整个炼油厂的其他6个工艺单元也出现了故障,失去了控制。

停机时间总计7个小时。

工作人员试图解决这个问题,但最终决定回滚到以前的状态并重新安装遗留交换机。虽然这恢复了网络和运营,但这意味着该设施无法升级传统交换机。他们必须接受这样的操作风险:如果这些开关中的任何一个发生故障,他们将无法更换它们,因为在确定根本原因之前,它将导致同样的中断。

在升级尝试失败后,PCN网络专家进行了进一步分析并确定了根本原因。制定了一项详细的计划来纠正这些发现。更新是在维护窗口期间进行的。整个切换到新开关的过程持续了不到五分钟。在进行补救措施期间,工厂的操作没有对控制系统造成影响。炼油厂PCN现已全面投入运营,其表现比以往几年都要好。

这家炼油厂的故事并不罕见。在过去的几十年里,工业应用中的大多数网络都得到了扩展、扩展和改造,以支持日益增长的业务需求。在这个演变过程中,网络积累了错误配置和漏洞,最终可能导致代价高昂的计划外停机事件。

此外,由于这项工作通常是在很长一段时间内零星完成的,因此不太可能有人对网络进行全面评估,以寻找漏洞、错误配置和其他可能影响网络性能、可靠性和安全性的问题。

事情本不必这样的。让专家来找出问题并应用行业最佳实践可以避免事件并提高网络性能。

本内容最初出现在ISSSource.com。ISSSource是CFE Media的内容合作伙伴。Chris Vavra编辑,CFE Media制作编辑,cvavra@cfemedia.com

原创内容可在isssource.com


作者简介:John Cusimano是aessolutions工业网络安全副总裁。