组织严重依赖业务关键型网络及其基础基础架构来提供无缝服务。除了部署在网络上的硬件外,他们还拥有大量软件定义的网络组件,如数据库、应用程序、防火墙、控制器等。
随着对这些数字资产的依赖日益增加,这些资源持续可用至关重要。组织无法承受这些资源的重大故障或停机时间,因为如果这些资源停机,相关服务在故障修复之前仍然不可用,这给组织造成沉重的代价。
解决这个问题的一个方法是使用高可用性系统。高可用性是一个旨在实现高水平可靠性或操作性能(在本例中为可用性)的概念,并且具有容错性,以保持网络基础架构运行而不出现停机时间。
了解更多关于如何在OpManager中配置设备进行高可用性监控的信息。
尽管使用了高弹性的网络组件,但没有系统是100%防故障的。故障可能由于任何意外原因而发生,包括过载、停电、网络断开、计划外维护等。高可用性的目标是确保最小或零停机时间,这样这些故障就不会影响业务运营的底线,这将导致数据和货币损失。
IT管理员利用高可用性以及平均维修时间(MTTR)和平均故障间隙时间(MTBF)等故障解决指标,以尽量减少停机时间并保持高整体网络可用性。
要设计和构建持续可用的系统,您必须考虑以下关键原则:
持续监控和管理业务关键型网络组件对于实现和维持高可用性至关重要。ManageEngine OpManager是一个集成的网络监控工具,可帮助您部署和监控高可用性系统,并提供广泛的其他网络监控功能。OpManager中的高可用性系统可以使用主动-主动模式或主动-被动模式进行配置。
使用最新版本的OpManager,您可以毫不费力地配置、监控和管理以下类别的高可用性设备:
OpManager使用可用性监控协议来检查网络组件和配置为高可用性的设备的可用性。使用ICMP对设备进行轮询,OpManager根据收到的响应跟踪这些设备的正常运行时间。对于主动-主动配置,两个设备分别轮询,并相互独立地监控可用性和性能。然而,在主动-被动的情况下,辅助设备只被监控可用性,因为它处于待机状态。
能够在故障发生时识别故障对IT管理员来说至关重要。这有助于他们在造成重大损害之前采取必要措施来纠正故障。OpManager的基于告警的故障指示通过在任何设备停机时发出告警,让您深入了解配置为高可用性的设备的可用性。告警生成的架构因用于设置设备的配置模式而异。
主动-主动设置中的告警
在主动-主动配置中,两个设备都会轮询可用性,如果任一设备未能响应ping,则会发出告警。每次ping失败,都会发出另一个告警,其严重程度越来越高,通知管理员相应设备不可用。
主动-被动设置中的告警
与主动-主动配置相反,在主动被动设置中,一个节点始终处于活动状态,而次要节点始终处于待机状态。在这种情况下,如果辅助节点停机,主节点将没有备份;因此,将向主设备发出告警,以通知管理员辅助设备不可用。
同样,如果主IP停机,将发出告警,通知管理员设备不可用,并通过配置的辅助IP恢复轮询。然而,如果主设备和次设备都停机,则会发出告警,告警会越来越严重,直到其中一个设备可以提供服务。
借助OpManager的最新更新,您可以配置通知配置文件来帮助高可用性监控。通知配置文件是一种高级告警系统,允许您选择引发的告警类型,并预先定义在通知配置文件触发时要执行的操作。有了此功能,高可用性集群可以与基于电子邮件和短信的通知系统集成,该系统在发生故障时会提醒用户。这有助于您保持真正的高可用性和最小的停机时间。
注意:在配置通知配置文件期间,您必须同时添加主设备和次要设备来监控主动-主动设置。对于主动-被动设置,只需添加主设备就足够了。
尝试OpManager的演示,亲自查看其高可用性监控功能,或下载30天的免费试用版,以探索这款顶级网络监控软件的其他功能。