保证工业以太网的性能、可靠性

可靠性、带宽和确定性仍然是工业以太网用户关注的关键性能问题。

通过Nick Sandoval和Mike Werning, Moxa Americas Inc。 2012年12月19日

在过去的10年里,互联网和联网设备的激增超出了任何人的想象,各种迹象表明,未来几年的增长将继续强劲(参见图1)。据彭博社报道预计2012年互联网流量将增长42%,到2016年将达到1.3泽字节,即1.3万亿千兆字节。虽然这一增长主要是由消费者和商业用途推动的,但自动化和控制行业将不可避免地参与到这一转变中来。

随着技术和可靠性的提高,适应以太网用于工业网络的早期挑战已经得到了解决,从而导致工业以太网的使用持续强劲增长。本文探讨了构建足够可靠的网络以满足自动化和控制中的严格要求的需求,并作为当今可用技术的指南,以及确保工业以太网中最高可靠性和性能的最佳实践。

定义以太网性能

一般来说,自动化工程师在使用工业以太网时最关心的三个主要性能领域是可靠性、带宽和确定性。可靠性是指网络和设备的正常运行时间,通常是自动化和控制网络中最关键的性能因素。对高可靠性的需求也是自动化和控制领域在采用新技术方面落后于消费领域的主要原因。业务用户通常可以承受电子邮件或网络通信中的短暂故障,并且在采用最新的、节省时间的技术时,他们看到了更直接的好处。工业用户的情况则不同,操作或通信中断可能导致立即的重大损失。因此,工业用户不太可能采用新的通信技术,直到它能够保证在实际操作条件下异常稳定可靠的性能而不中断。

另一个性能度量是带宽,它指的是可以支持的网络流量。带宽正在成为许多工业用户的一个重要问题,并受到以下几个趋势的推动:连接到网络的设备数量的增加,无线和蜂窝技术的日益使用,以及IP视频在监控和监视中的作用日益增强。尽管仍有许多应用需要10/ 100mbps的带宽来处理预期的网络负载,但千兆甚至10GbE网络正迅速成为工业网络规划的标准要求。

最后,对于许多自动化和控制应用程序,工业以太网实现一定程度的确定性是很重要的,在这种确定性中,数据可以在可预测的时间范围内可靠地交付。在过去,这对以太网来说是一个固有的问题,因为它在设计上允许数据包传递时间有很大的可变性。然而,对于需要高度精确定时和协调的应用程序,例如机器控制,不能容忍包传递时间的不确定性。幸运的是,以太网技术和标准的发展已经使许多工业用户所需的确定性水平得以实现。

硬件可靠性,设备故障

确保工业用户的以太网正常运行时间的任务始于硬件的坚固性。在自动化控制空间中,以太网设备所面临的环境条件通常比在商业和商业环境中所面临的条件要恶劣得多。安装在室外机柜或工厂车间的以太网设备可能不得不应对振动、电磁干扰、热量和空气中的颗粒物。如果设备加固或保护不到位,可能会导致以太网设备故障频繁,数据传输不可靠。

强制空气冷却是制造商通常使用的防止设备过热的方法。风扇驱动网络设备内部的空气循环,以吸入冷空气并排出热空气(见图2)。当设备保持在清洁和温度控制的房间中时,例如在商业设施中的IT壁橱中,这是一种适当的措施。然而,对于许多自动化控制应用来说,商业级的方法往往是不够的,在这些应用中,环境控制室根本不可用或不可行的。在许多工业场所,环境颗粒的普遍存在会对强制空气冷却产生负面影响,因为颗粒物质会积聚在空气过滤器或设备内部。此外,风机本身比其他部件更容易发生故障,因此必须将定期维护和停机时间考虑到网络的成本和规划中。

因此,无风扇操作已成为确保工业以太网设备高硬件可靠性的一个引人注目的功能。由于没有活动部件,被动冷却硬件可以实现更高的平均故障间隔时间,并且可以很好地用于工业用途。开发可靠的无风扇以太网交换机所需的工程量意味着初始购买成本将明显高于商业级风扇冷却交换机。然而,在设备的使用寿命中,当考虑到减少维护、网络停机时间和设备更换成本时,无风扇交换机通常显示出更高的投资回报。

电源、介质冗余

电源和介质冗余可以帮助最小化网络停机的发生和影响。工业网络通常部署在旋转机械附近,如感应电机或发电机、焊机或其他大功率机械。这使以太网设备暴露在电能质量波动的环境中,这在商业应用中是不常见的。由于这个和其他原因,基本的控制系统冗余要求通信网络的每个部分都有一个冗余的备用电源,以防电源中断或停电。当系统断电时,备用电源可以接管系统,最大限度地降低因系统关闭而造成重要数据损坏或丢失的可能性。为了满足自动化和控制系统的需要,硬件应兼容无规直流,并具有反向电源保护和冗余电源输入隔离。

媒体冗余也是自动化网络的一个常见需求,涉及在部分网络不可用时建立备份通信路径。由于以太网上的冗余路径会产生网络环路,因此在正常运行时必须使用一种方法或协议来阻塞该冗余路径。IEEE 802.1D生成树协议STP (Spanning Tree Protocol)是IT领域为解决网络冗余路径问题而开发的。在IEEE 802.1D中,网络上的一台交换机被指定为网络的“根交换机”,并自动阻止数据包通过网络的任何冗余路径。当网络中的某条路径与网络中的其他路径断开时,STP会自动重新调整网络,使用冗余路径。

IEEE 802.1D STP的主要限制是与每个网络收敛相关的高性能成本,这是指参与交换机在根桥和端口/网络路径上达成一致的过程。当一个网段出现故障时,STP网络将重新收敛,除了收敛操作本身使用的控制消息外,所有网络流量将暂停。这种服务暂停可以持续长达50秒,这可能会导致工业自动化领域的重大和不可接受的损失。

IEEE 802.1W快速生成树协议RSTP (Rapid Spanning Tree Protocol)是为了克服IEEE 802.1D的局限性而引入的,它大大提高了性能,大大缩短了收敛时间(小于5秒),并纠正了RSTP网桥中的错误排序和重复行为。收敛时间的改进是通过将端口状态的数量从5个减少到3个,并允许端口被指定为“边缘”设备,这些设备可以上电或下电,而不需要网络重新收敛(因为它们不向另一台交换机传递帧)。这些增强使实现具有更高性能的媒体冗余成为可能,尽管在RSTP与STP互操作时失去了一些优势。

尽管RSTP比STP有了很大的改进,但许多控制应用程序需要更好的网络恢复时间。许多以太网设备制造商已经开发了基于802.1W的专有冗余协议,并且能够实现近乎即时的网络恢复时间。专有协议可以使250个交换机的网络在20毫秒内从故障的网段中恢复。需要注意的是,网络恢复时间可能会受到网络负载和连接的交换机数量的影响,因此实际测试和验证是确保所需网络性能的额外且重要的步骤。

除了环和链等面向协议的冗余之外,还开发了许多硬件措施,以帮助最大限度地减少工业网络的停机时间。在线性拓扑中,中继旁路端口可以作为一种局部网络中断的方法。在这种线性拓扑中,单个交换机的故障可能会使网络的大部分离线(见图3)。即使在电源故障的情况下,中继旁路端口也会在相邻交换机之间转发流量,从而确保尽可能多的网络保持在线。热插拔以太网模块是另一种可以帮助最小化网络停机时间和局部中断的方法。当模块出现故障时,可以在不关闭整个交换机电源的情况下更换模块。

管理设备,网络

对于工业自动化来说,具有强大冗余和备份机制的强大硬件是确保以太网性能的基本出发点。下一个主要因素是以太网流量本身的管理。简单的非管理型交换机可以用于网络分段和消除网络冲突,但管理型交换机提供了更大的灵活性和能力来影响整个网络的性能。例如,管理交换机可以实现冗余拓扑、服务质量(QoS)、IGMP snooping、数据日志和其他功能,从而确保高效、安全、可靠地处理网络流量。

受管理的网络基础设施还使管理员能够预测和处理不可预测的和潜在的破坏性事件。用户出于无知或恶意,可能会将未经授权的设备连接到网络,从而严重影响性能,例如携带病毒的计算机。例如,如果用户将路由器添加到使用动态路由的网络中,则有可能将网络上的所有流量路由到该路由器,从而造成拥塞并允许中间人攻击。其他可能对网络造成不利影响的不可预知事件包括设备突然故障和意外断线。

工业网络规划者还需要确保在不同网络之间传输的流量得到适当的管理。在过去,这只能由专用路由器来处理,并且由于处理开销而在网络性能上做出相应的权衡。工业以太网领域的发展之一是高性能第三层交换机的使用,它可以以比传统路由器更高的速度和灵活性处理基本路由功能,同时为以太网连接提供更多选择(见图4)。制造商也在努力使传统工业路由器本身具有更好的性能。例如,在专用安全路由器上,运行频率为500 MHz的双核64位处理器被成功地用于实现500 Mbps的吞吐量。

确保网络性能和安全性需要持续了解实际的网络流量和行为。查看和分析网络数据日志是实现这一目标的最基本方法,可以使用syslog服务器将网络上每个交换机的日志上传到单个位置,以便于访问。简单网络管理协议(Simple Network Management Protocol, SNMP)也被广泛用于监控和管理网络设备,并且可以很容易地集成到专用的网络管理软件中(见图5)。这使得用户可以很容易地使用SNMP获取任何网络设备的实时数据,例如任何链路上的当前流量水平以及哪些设备处于上下状态。此外,如果满足警报触发器(例如,如果端口故障或设备故障),可以通过电子邮件或SMS发送自动警报。这为网络管理员提供了解决网络上的性能或安全问题的知识和工具,既可以先发制人,也可以在问题发生时解决问题。

以太网网络中的许多其他发展已被证明有助于为工业用户提供更好的性能。网络管理软件现在可与内置的OPC服务器,使其易于集成到SCADA系统。数字输入和输出连接被内置到工业管理开关中,允许与PLC轻松集成。工业管理交换机还包括对现场协议的支持,如Modbus、以太网/IP和PROFINET,因此SCADA服务器可以在现场直接与它们通信。每个供应商对各种功能和协议提供不同程度的支持,但通常支持端口状态等基本功能。这些功能和其他功能使以太网设备和工业系统之间的互操作更加紧密,并且更容易根据应用程序的具体和直接需求定制网络管理工作。

带宽管理

适当的网络工程意味着为给定的应用程序进行构建,并评估网络需要展示的性能水平和类型。抖动——而不是延迟——是确定性网络的敌人。如果延迟是可预测的,那么可以对其进行解释,并且网络仍然是确定的。通过适当的带宽管理,以太网可以实现工业网络应用程序通常需要的确定性。

过度配置是用于实现所需质量参数的最简单和最经济有效的方法之一。这意味着网络设计有足够的剩余带宽,以防止网络拥塞。除了简单地升级到千兆和10Gb交换机外,还可以通过使用更快的互连来最大化带宽。在1gbps或10gbps端口上的交换机到交换机链路将减少延迟并提供更高的吞吐量。链路聚合控制协议(Link Aggregation Control Protocol)也是一种有效的方法,可以通过分组物理链路来扩大带宽,使它们作为单个链路来增加吞吐量。缺点是,随着网络需求的增加,网络带宽也必须增加,因此设备可能必须定期升级。

在商业领域,70/30规则用于提供网络容量,其中网络的设计使70%的可用带宽能够容纳所有已知的流量负载。剩下的30%留给未知流量,这些流量没有被计算在内,并提供了一个安全边际。在控制和自动化领域,安全性和未来增长所需的空间远远大于商业应用。在这些环境中使用10%的规则是非常典型的,这足以过度配置网络以确保确定性行为并允许未来的增长。使用具有更高安全裕度的网络并不罕见,在这种情况下,只配置了5%的网络。

确定性网络也可以通过使用专门的基于以太网的现场总线协议(如EtherCAT或PROFINET)来实现。IEEE 1588v2精确时间协议也可用于在整个网络的亚毫秒范围内实现高精度同步。这些技术已被证明在满足特定应用程序或系统对高度确定性行为的需求方面是有效的。

服务质量

QoS不是单一的协议或方法。QoS涉及对网络流量的分类评估,以确保在网络拥塞条件下的适当性能。以太网交换机和路由器以先进先出的方式处理网络数据,其中数据按接收到的顺序传输。如果传入的数据比传出带宽所能支持的数据多,那么网络设备就会被迫缓冲数据,从而导致网络拥塞。QoS管理这种网络拥塞,使优先级最高的流优先传输或保留带宽。

在基于流的QoS中,具有相同质量要求的数据包或帧流被分组成一个流。不幸的是,由于高开销需求和固有的可伸缩性限制,基于流的QoS从未得到广泛采用。基于类的质量与基于流的质量采取了不同的方法,并已成为许多部门选择的QoS方法。在基于类的质量中,具有相似质量要求的数据包聚在一起。每个集群的优先级不同,对网络资源的访问级别也不同。高优先级的流量将被放置在一个队列中,该队列将更容易发送出流量。较低优先级的流量将被放置到一个队列中,在那里它将被迫等待较高优先级的流量。

基于类的质量要求对网络流量进行标记,以便网络设备可以在该流量上定义和执行优先级规则。差分服务、服务类型和服务类别是使用基于类的质量的最广泛使用的协议。这些协议中的每一个都使用标记或标签来确定优先级,并可用于满足特定的QoS要求。

多播

工业以太网应用程序中的许多设备和协议使用多播,它允许一个设备或协议使用单个数据流到达许多终端设备或应用程序。这比为每个接收设备创建单独的单播数据流更有效地利用带宽。组播是通过使用Internet Group Multicast Protocol (IGMP)来实现的,IGMP是一种依赖于IP的第三层协议。在二层交换机中,无论接收端设备是否需要,所有端口都将转发组播流量。

在工业控制系统中,特别是plc中大量使用多播流量会导致网络拥塞。为了解决这个问题,组播监听应运而生。通过组播snooping,第二层交换机监控每个端口上第三层设备发送的IGMP查询和加入/离开报告。然后,交换机可以决定哪些端口有需要流量的连接设备。组播流量只发送到这些端口,大大减少了交换机的负载,并为不需要组播流量的端口释放了网络带宽。因此,IGMP窥探已成为确保工业以太网网络最佳性能的基本功能。

结论

自动化和控制网络的性能需求和特性与以太网技术起源的商业世界有着根本的不同。可靠性、带宽和确定性仍然是工业用户关注的关键性能问题,许多技术、标准和实践已经证明可以有效地满足这些需求。随着工业以太网制造商和用户不断发展更多的经验和专业知识,毫无疑问,性能将达到更高的高度。

桑多瓦尔是一名现场应用工程师Moxa美洲公司他在加州布雷亚(Brea)工作了五年。他是该公司美国总部的第一位现场应用工程师,并帮助推出了该公司的专业工业网络服务。他拥有加州理工大学(California Polytechnic University)的电气和计算机工程学士学位以及电气工程硕士学位。Sandoval是Cisco认证网络助理,并拥有Linux专业协会一级认证。

Werning是Moxa的现场应用工程师,在嵌入式通信和计算领域拥有16年的经验。他还拥有控制系统工程方面的经验。他拥有威斯康星大学普拉特维尔分校(University of Wisconsin-Platteville)的计算机科学学士学位,辅修电子技术。