OpManager中的高可用性监控

组织严重依赖业务关键型网络及其基础基础架构来提供无缝服务。除了部署在网络上的硬件外,他们还拥有大量软件定义的网络组件,如数据库、应用程序、防火墙、控制器等。

随着对这些数字资产的依赖日益增加,这些资源持续可用至关重要。组织无法承受这些资源的重大故障或停机时间,因为如果这些资源停机,相关服务在故障修复之前仍然不可用,这给组织造成沉重的代价。

解决这个问题的一个方法是使用高可用性系统。高可用性是一个旨在实现高水平可靠性或操作性能(在本例中为可用性)的概念,并且具有容错性,以保持网络基础架构运行而不出现停机时间。

了解更多关于如何在OpManager中配置设备进行高可用性监控的信息。

为什么高可用性?

尽管使用了高弹性的网络组件,但没有系统是100%防故障的。故障可能由于任何意外原因而发生,包括过载、停电、网络断开、计划外维护等。高可用性的目标是确保最小或零停机时间,这样这些故障就不会影响业务运营的底线,这将导致数据和货币损失。

IT管理员利用高可用性以及平均维修时间(MTTR)和平均故障间隙时间(MTBF)等故障解决指标,以尽量减少停机时间并保持高整体网络可用性。

高可用性原则

要设计和构建持续可用的系统,您必须考虑以下关键原则:

  1. 消除单点故障:单点故障是一个组件,如果该组件出现故障,可能会导致整个网络或系统(如数据库服务器、防火墙、交换机等)出现故障。高可用性实现通过消除单点故障来建立冗余,进而消除大量停机时间。这样做时,每当网络组件出现故障时,故障组件的另一个实例都会接管,提供不间断的服务交付。
  2. 确保交叉可靠性:在节点故障的情况下,备份节点必须从主节点接管,而不丢失数据,也不影响网络的运行性能。换句话说,冗余系统之间应该有可靠的交叉配置。
  3. 实现故障检测:最重要的是,每当高可用性集群的任何组件出现故障时,管理员需要立即知道。组织使用的网络监控系统必须能够提供基于告警的故障指示,以帮助管理团队在问题影响整体网络性能之前修复它们。

OpManager中的高可用性监控

持续监控和管理业务关键型网络组件对于实现和维持高可用性至关重要。ManageEngine OpManager是一个集成的网络监控工具,可帮助您部署监控高可用性系统,并提供广泛的其他网络监控功能。OpManager中的高可用性系统可以使用主动-主动模式或主动-被动模式进行配置。

  • 主动-主动配置:主动-主动系统是由两个实例组成的,这些实例同时提供相同类型的服务。如果出现故障,针对故障节点的流量将被重定向到另一个节点。
  • 主动-被动配置:在这个系统中,顾名思义,并非所有实例都是一直处于活动状态。主动-被动配置由主节点的完全重复的闲置实例组成。这个次要(被动)节点保持待机状态,只有在关联的主(主动)节点出现故障时才会上线。

使用最新版本的OpManager,您可以毫不费力地配置、监控和管理以下类别的高可用性设备:

  • 服务器(和派生类别)
  • 虚拟机服务器
  • 域控制器
  • 防火墙
  • 路由器
  • 开关
  • 统一计算系统(UCS)
  • 负载平衡器
  • 广域网加速器
  • 无线局域网控制器

OpManager使用可用性监控协议来检查网络组件和配置为高可用性的设备的可用性。使用ICMP对设备进行轮询,OpManager根据收到的响应跟踪这些设备的正常运行时间。对于主动-主动配置,两个设备分别轮询,并相互独立地监控可用性和性能。然而,在主动-被动的情况下,辅助设备只被监控可用性,因为它处于待机状态。

基于告警的高可用性故障检测

能够在故障发生时识别故障对IT管理员来说至关重要。这有助于他们在造成重大损害之前采取必要措施来纠正故障。OpManager的基于告警的故障指示通过在任何设备停机时发出告警,让您深入了解配置为高可用性的设备的可用性。告警生成的架构因用于设置设备的配置模式而异。

主动-主动设置中的告警

在主动-主动配置中,两个设备都会轮询可用性,如果任一设备未能响应ping,则会发出告警。每次ping失败,都会发出另一个告警,其严重程度越来越高,通知管理员相应设备不可用。

高可用性的OpManager主动告警 

 

主动-被动设置中的告警

与主动-主动配置相反,在主动被动设置中,一个节点始终处于活动状态,而次要节点始终处于待机状态。在这种情况下,如果辅助节点停机,主节点将没有备份;因此,将向主设备发出告警,以通知管理员辅助设备不可用。

同样,如果主IP停机,将发出告警,通知管理员设备不可用,并通过配置的辅助IP恢复轮询。然而,如果主设备和次设备都停机,则会发出告警,告警会越来越严重,直到其中一个设备可以提供服务。

高可用性的OpManager主动-被动告警 

高可用性通知配置文件

借助OpManager的最新更新,您可以配置通知配置文件来帮助高可用性监控。通知配置文件是一种高级告警系统,允许您选择引发的告警类型,并预先定义在通知配置文件触发时要执行的操作。有了此功能,高可用性集群可以与基于电子邮件和短信的通知系统集成,该系统在发生故障时会提醒用户。这有助于您保持真正的高可用性和最小的停机时间。

高可用性监控的通知配置文件 

注意:在配置通知配置文件期间,您必须同时添加主设备和次要设备来监控主动-主动设置。对于主动-被动设置,只需添加主设备就足够了。

 

尝试OpManager的演示,亲自查看其高可用性监控功能,或下载30天的免费试用版,以探索这款顶级网络监控软件的其他功能。

我们的客户