通过以太网网络冗余应用网络最佳实践

在工业网络中实现冗余并选择合适的应用方法可以确保持续的可靠性和运营成功。

通过Ken Austin,我是美国凤凰联络公司 2016年8月2日

在规划工业以太网时,最相关(但却被忽视)的问题是使用适当的冗余机制。考虑到生产网络中的通信故障可能导致昂贵的停机时间,导致重要的公司数据丢失,甚至导致生产设备严重损坏,或者更糟:人员受伤。冗余物理层网络结构通过确保通信的可用性,即使发生错误,也可以防止生产停机。

以下问题应该提出并认真讨论。是否需要冗余?如果是,哪种冗余方法最适合应用程序?通常,网络规划者和最终用户认为冗余选项非常昂贵,或者是一种难以部署的技术。在网络中具有冗余连接的决定确实需要管理交换机的更高成本,以及主配置和持续管理的额外时间和精力。然而,额外的设备成本和资源可以被持续的系统正常运行时间经验、优越的网络监控/管理功能以及通过扩展诊断减少的故障排除措施所抵消(参见图1)。

网络冗余涉及到硬件和软件的集成。这确保了在发生单点故障时,网络的可用性仍保持最佳状态。通信系统——工业网络——是每一个现代自动化项目的核心。为了处理网络错误,可以从各种选项中选择协议,并将其集成到基础结构元素中。冗余方法可以分为四组:IEEE开源、专有的亚秒级、标准化的高可用性网络冗余协议和零中断(无扰动)冗余(参见“冗余方法和示例”)。这些类别的特征在许多冗余方法中是可区分的,并且特别适合于某些应用程序和要求(参见“表:下面的冗余方法和选择”)。

在规划阶段,如果确定工业网络必须具有弹性,并且能够在第1层故障时自动恢复,则绝对必须采用冗余机制。在作出决定之后,注意力必须转向选择适当的冗余机制。如果网络支持的进程在网络重新聚合发生时能够承受几秒钟的延迟,那么就可以使用可靠的快速生成树协议(RSTP),而不需要进一步研究。

相反,当拓扑对长时间中断的容错性较差,且几秒的通信间隔可能导致系统告警或输入/输出(I/O)故障时,则应该部署高速机制。通常,这些都是专有的,但可以为用户提供亚秒级的恢复时间,优于基于IEEE标准的冗余,并且可以在单个或多个环中容纳数百个开关。

生成树协议(STP)

具有冗余数据路径的以太网网络将形成具有不允许环路的网状拓扑结构。由于这些循环,数据包可以在网络中无限循环,也可以复制。中描述了STP是一种开放协议IEEE 802.1D-2004: IEEE局域网和城域网标准-媒体访问控制(MAC)网桥.这是一个开放系统互连(OSI)第二层协议,保证一个封闭、无环的局域网(LAN)。它是基于著名软件设计师和网络工程师Radia Perlman在数字设备公司工作时开发的算法。STP使扩展网络成为可能,从而集成冗余链路。通过这种方式,在活动链路由于某种原因退出时提供了一个自动备份路径,而不会在网络中创建闭环。

为了应用该协议并获得最大的效益,与其他冗余方式一样,所使用的交换机必须支持该协议。在一个段中断之后,很容易需要30到50秒的时间才能找到可用的替代路径。这种基于定时器的延迟对于控件来说是不可接受的,30秒对于任何监控应用程序来说都是非常长的。一般来说,标准STP执行恢复的延迟时间太长,在工业应用中无法接受。不幸的是,STP的优点使它天生不适合冗余环结构。

允许STP支持各种拓扑的复杂性限制了它在相对简单的冗余环中的性能。因此,当一个环发生故障时,显而易见的解决方案是将断开的环视为两个独立的网段,直到链路层断裂得到补救。假设一个环中只有一个故障恢复解决方案,那么标准STP收集故障数据和处理消息以创建故障分析所需的典型时间可能是不可接受的。

RSTP

为了解决STP的缺点,IEEE于2001年建立了RSTP。RSTP是一种标准化的、开放的冗余方法(IEEE 802.1D-2004),受到各种受管理交换机的支持,无论其制造商如何。该协议支持环形和树形拓扑结构,以及网状网络,并且可以在任何托管网络中轻松启用。该协议最初在IEEE 802.1w-2001生成树快速重构.然后,在2004年的标准修订中,原始STP在IEEE 802.1d标准中被指出是多余的,并建议尽可能使用RSTP而不是原始STP。因此IEEE 802.1w被包含在802.1w标准中。

通过RSTP算法计算出网络树结构,因此有一台交换机被配置为根交换机(如图2所示)。在网络中可以创建不同的冗余物理连接。如果没有冗余机制的存在,这将导致不可接受的循环的发生,从而迅速使整个网络拥塞,从而导致故障。RSTP将这种拓扑结构转换为树状结构(尽管是反向的),通过关闭一些被算法认为路径较小的端口。这将创建必要的、合乎逻辑的、无循环的环境。通过将基础设施设备配置为网络根,并从该根创建逻辑块,可以通过一条路径到达所有其他交换机。如果确实发生了网络错误,例如电缆损坏或断开,则会自动创建一个新的活动路径。

RSTP经历的恢复时间明显低于原始生成树(因此得名),具体为1秒到几秒,而不是原始迭代的30到50秒。根据应用程序的不同,RSTP的恢复时间可能已经足够快,以确保可靠性。

RSTP作为许多IT和工业网络安装的冗余选择已经有相当长的历史。尽管在随后的几年中已经开发了更快的冗余方案,但今天,RSTP实际上仍然是普通应用程序的一个可行选择,特别是在设备成本可能是一个问题的情况下。

私有冗余—RSTP的扩展

为了满足日益增长的自动化网络快速恢复的需求,许多制造商已经开发了专有的冗余机制,以实现小于1秒的恢复时间。专有冗余方案通常作为RSTP的扩展开发,在恢复速度和设置复杂性方面有所不同。它们采用各种概念,例如通过根桥接器快速轮询来测量环的健康状况,并启动网络的最快潜在恢复。在一些专有技术中,用于将交换机连接到环上的环端口(以及执行环的互连或耦合)是自动建立的。

在其他情况下,这些端口必须在连接交换机以形成环形之前特别选择和配置。举个操作的例子,上电后,开关会自动选择环中的最后一个开关。作为最后一个交换机,该设备将最后一个上电,然后继续阻塞一个环口,最后发送数据包,初步确定环的健康状况。在运行过程中,环内的每台交换机都将独立监控其环内端口的状态,当环内链路故障时,相邻交换机将在环外发送链路断开消息给最后一台交换机,从而解除之前阻塞的端口。

无论选择何种冗余,当网络连接或交换机断开时,可以实现15 ~ 500毫秒的恢复时间。恢复时间不超过500毫秒,即使是在广泛的自动化网络中,流量负载很大,交换机的媒体访问控制(MAC)表中有相当数量的地址条目。与其他技术一样,观察到的恢复时间是可伸缩的,并且在网络中安装更少的终端(更小的MAC表)时可以短得多。但是,对于这些场景中的任何一种,都可以实现次秒级的恢复,从而可以在构建冗余自动化网络的过程中保持服务质量。

设备级环(DLR)

设备级环(DLR)冗余协议是协议的一部分以太网/ IP标准。DLR实现了不到3毫秒的恢复时间,因此提供了几乎无颠簸的切换(见图3)。目前许多EtherNet/IP现场设备都支持DLR,例如I/O模块或可编程控制器,它们可以通过集成的双端口开关功能使用DLR在环形拓扑中联网。使用本机支持DLR的交换机可以同时集成DLR上的多个设备,而DLR的整体系统诊断允许快速识别和纠正故障和错误。

DLR协议支持单环拓扑结构;不允许有多个环或重叠环。不过,当使用合适的开关时,可以连接冗余环或操作多个受限环。因此,DLR协议信息不会离开单个环,也不会出现在其他环中。在图4中,拓扑显示了两个DLR环,每个环组成单独的段。这些段通过RSTP冗余连接在一起。因此,单独的段分别与其他段分开,因此没有协议信息可以离开单独的环。

DLR不需要专门绑定到以太网/IP。在许多非以太网/IP拓扑中,例如风力涡轮机的组网,需要一种冗余机制,以便在发生错误时尽可能快地切换,以防止系统报警。在这些情况下,DLR冗余机制也可以保证传输路径的切换在不到3毫秒的时间内完成。

媒体冗余协议(MRP)

媒体冗余协议(MRP)是用于环形安装的,是协议的一部分IEC 62439-3工业通信网络.在环形拓扑中断的情况下,MRP保证最大恢复时间为200毫秒,最多有50个MRP节点设备。MRP由Profinet交换机和许多Profinet现场设备,以直接在机器网络的设备级实现更高的可靠性。集成的错误诊断允许错误被快速删除。

如前所述,MRP是Profinet标准的一部分。因此,在MRP的情况下,环形管理器阻塞一个端口以获得活动线路结构。当网络发生错误时,网络会分裂为网络中的两条隔离线路,在错误解决、阻塞端口释放后,这两条线路又会重新连接在一起。一般来说,恢复时间通常小于100毫秒。

并行冗余协议(PRP)

与其他技术相比,在发生网络错误时,PRP不需要计划活动拓扑的更改。PRP协议在两个并行网络和并行冗余传输中起作用。根据IEC 62439-3,所有数据电报都通过两个自治网络传输两次。这意味着即使其中一个网络出现故障,也可以实现不间断或无颠簸的通信。假设每个数据帧都通过两个网络发送,接收节点处理先到达的消息,并在接收到次要消息时拒绝它。PRP协议确保复制、转发以及最终拒绝重复消息,所有这些都在第2层进行。在这样做的过程中,PRP还使双网络对通信堆栈中的高层不可见。

PRP部署在关键应用领域并不罕见,如能源开关设备系统、化工制造和废水处理系统。由于PRP不需要任何重新配置的时间,它的使用特别适合于关键的基础设施部门,这些部门的系统和网络被认为是如此重要,以至于它们的瘫痪可能会对国家安全、经济和/或公共卫生和安全产生破坏性影响。

应用最佳实践

最后,工业通信网络的分析和设计阶段将需要提出各种各样的问题,并将涉及几种潜在的技术选择。无论是考虑项目,如网络传输速度(以太网、快速以太网、千兆比特等)和媒体类型(铜或光纤),还是实现高端功能,如基于端口动态主机配置协议、链路聚合或RADIUS (remote authentication dial-in user service)认证每一项选择都是重要的。决定是否在工业网络中实现冗余机制,然后为应用选择最合适的方法,对于网络的持续可靠性和操作的整体成功至关重要(参见图5)。

冗余方法和实例

冗余方法可以分为四组:IEEE开源、专有的亚秒级、标准化的高可用性网络冗余协议和零中断(无扰动)冗余。下面的组包括解释和例子。

IEEE开源冗余:这种方法的故障恢复时间最慢,但成本最低,实现和维护的冗余性最简单。这种冗余可以应用于任何拓扑选择,包括网格,包括STP和RSTP。

专有的亚秒冗余:一般来说,与RSTP相比,在设备或时间上几乎没有成本差异。只有环结构是可能的,但它允许各种环配置的灵活性,如多个环、双冗余环和大容量环。它还包括环耦合和双寻的连接概念。与IEEE开放冗余不同,专有冗余技术的选择将网络(或至少是该环段)锁定到交换机制造商的技术和设备上。由于产品操作的变化,一个环内的开关互操作性是不可行的。该方法包括扩展环冗余和快速环检测。

标准化的高可用网络冗余协议:通常,仅对于环形拓扑,这些机制是基于信标的,并维护具有环形管理器或管理器以及能够处理消息的参与环形节点的层次结构。该方法包括MRP和DLR。

零中断(无颠簸)冗余:该方法可用于线型或环形拓扑结构,在一定条件下可部署在网状结构中。然而,速度是要付出代价的,因为它需要额外的硬件——要么集成到交换基础设施中,要么集成到终端设备中。该方法包括高可用性、无缝冗余和PRP。

肯·奥斯丁他是美国凤凰接触公司以太网的首席产品营销专家。

本文发表于应用自动化补充的控制工程
而且设备工程

-请参阅下面补充的其他文章。