OpManager的故障转移或冗余支持是 实现不间断服务所必需的。如果OpManger数据库崩溃或失去网络连接并且不监控您的网络,这将变得很有问题的。虽然定期备份可以帮助您从数据库崩溃中恢复,但OpManger恢复其服务需要时间。但是,与此同时,您的网络将不被监控,其他一些关键设备(如路由器、邮件服务器等)可能会出现故障并影响您的业务。实施冗余系统有助于克服此类故障。
故障转移支持要求您配置OpManager辅助服务器或备用服务器,并继续监控OpManager主服务器。如果主服务器出现故障,备用服务器将自动开始监视网络。过渡非常快速和顺利,最终用户不会感觉到主服务器故障或后续备用服务器接管的影响。同时,备用服务器会触发有关主服务器故障的电子邮件告警(在邮件服务器设置中配置的电子邮件 ID)。主服务器恢复运行后,备用服务器将自动返回到备用模式。
注意:此页面与OpManager构建版本125139及更早版本相关。对于较新的版本(从内部版本 125140 开始),请参阅此页面。
工作机制
主服务器以 BEFailover 表中的符号计数以指定的时间间隔(称为HEART_BEAT_INTERVAL)更新其状态。每次更新时,计数都会增加。此计数称为 LASTCOUNT。同样,备用服务器也通过更新 BEFailover 表中的 LASTCOUNT 来更新其状态。
当主服务器发生故障时,它无法更新 LASTCOUNT。备用服务器以指定的周期间隔(称为 FAIL_OVER_INTERVAL)监视主服务器的 LASTCOUNT。默认情况下,FAIL_OVER_INTERVAL值为 60 秒。如果需要,您可以在Failover.xml文件(<OpManager_Standby_home>\conf)中对其进行修改。假设您已将FAIL_OVER_INTERVAL指定为 50 秒,备用数据库将每 50 秒监控一次主数据库的 LASTCOUNT。每次,当备用服务器查找 LASTCOUNT 时,它都会比较以前和现在的计数。当主服务器无法更新 LASTCOUNT 时,连续计数将相同,备用服务器假定主服务器发生故障并开始监视网络。
安装主服务器
在主服务器上安装OpManger时,在安装向导中选择作为主服务器并完成安装过程。启动主服务器。
安装备用服务器
在备用服务器上安装OpManager时,
注意:主数据库和备用数据库的日期和时间设置应相同。 |
配置故障转移
在运行OpManager时,将MSSQL作为后端数据库,实现集群。集群是指存储数据并具有单个虚拟 IP 的数据库数组。如果集群环境中的任何数据库发生故障,则其他数据库将拥有数据,从而提供数据的高可用性。主服务器将其所有数据发送到虚拟 IP,数据存储在多个位置。备用服务器在主服务器发生故障时控制网络,然后备用服务器也会将数据发送到同一虚拟 IP。
如果要在主服务器和备用服务器之间同步特定文件,可以在Failover.xml文件(OpManager\conf\OpManager\Failover.xml)中添加所需的目录。
要配置MSSQL服务器集群,请访问以下由Microsoft发布的链接。
https://technet.microsoft.com/en-us/library/hh231721(v=sql.110).aspx
安装完成后,可以启动备用OpManager服务器,前提是您已经为主服务器配置了MSSQL集群。
一旦主服务器发生故障,备用服务器将假定自己为主服务器并开始监视网络。主服务器启动后,备用服务器将返回到其待机模式并监视主服务器。
升级故障转移设置:在升级OpManager服务时,必须将PPM应用于主设置和辅助设置。单击此处了解有关故障转移服务器升级的先决条件的详细信息。