OpManager对网络中的设备和接口进行监控,当网络出现响应慢、连通性丢失、丢包等异常时,通过告警方式通知用户。也就是说,当任何设备或接口没有达到最佳状态时,都会立即产生告警。
OpManager上报的告警列表可以在界面的“告警”页签下查看。“告警”页面提供了所有告警的完整列表。告警,也被进一步分类,包括活动告警、Syslog告警等不同类型,便于访问。
在添加设备时,OpManager自动关联监视器指标(例如:CPU利用率)到该设备基于默认设备模板,并开始监控设备的性能和可用性。
默认状态下,OpManager按照配置的轮询时间间隔定期对监控的设备进行发送回显信息,当设备响应失败或响应时间过长时,OpManager会向用户发送告警通知。
可以为与设备关联的监视器配置阈值,当设备违反指定的阈值时,OpManager将发出告警以通知管理员。OpManager支持三种基于严重性的阈值级别:需要关注的、故障、严重。用户可以自定义每个级别的阈值。
每个严重性都有一个唯一的颜色代码,发出的告警将指示违反阈值级别的颜色。
用户可以访问告警的快照页面深入了解产生告警的网络问题。(点击告警列表中的某条告警所打开的页面称为“告警快照页面”。)此页面提供了问题的详细信息、严重性和发出告警的时间。
此外,您可以从告警快照页面执行各种操作(例如:执行工作流)。
OpManager有三种处理告警详情的方法:
告警的主要目的是立即通知相关问题,以便用户可以采取纠正措施以快速解决问题。用户可以通过配置通知配置文件来选择接收的通知类型。OpManager中支持的一些通知类型有:
除此之外,还可以使用通知配置文件执行其他操作,例如运行程序,运行系统命令,在桌面应用程序(如ServiceDesk Plus, Jira和ServiceNow)中记录工单。
有时,如果告警长时间无人处理,这可能会导致严重的后果,特别是严重告警。
用户可以通过配置告警升级规则,将告警升级到高级负责人或备份IT管理员,确保问题在升级为网络/设备故障之前得到解决。可以配置告警的级别和上报的最大持续时间。
例如,对于60分钟后仍未清除的严重告警,可以配置升级告警。
某些设备处于维护状态时可能无法正常使用。可以配置告警抑制规则,防止OpManager对此类设备不可用告警产生告警。确保OpManager在指定时间内不会对选中的设备产生告警。
注意:本页概述了功能的概述。要获得使用功能的分步说明,请访问本页中指定位置提供的链接。