网络故障管理

在任何网络中,故障都是不可避免的,如果没有适当的机制来处理故障,可能会导致意想不到的严重中断。这就是为什么IT管理团队依赖于具有故障解决功能的监视工具。

一个强大的网络故障管理工具可以帮助您:

  • 能够分析网络性能趋势并接收告警以主动解决问题;
  • 精确地定位网络瓶颈;
  • 加快了故障解决的过程,最大限度地减少了整体平均修复时间(MTTR);
  • 网络故障时通过邮件/短信发送即时通知。

OpManager是一种强大的网络故障监控解决方案,以强大的故障排除能力保持理想的网络性能。

OpManager故障排除

通过在综合性网络管理软件 OpManager中配置网络发现文件, 可以一次完成网络中设备的添加和审批。设备列表将在资源清单页面上显示以进一步深入了解快照页面(导航到资源清单->设备,然后单击设备以查看其快照页面)。

为了保证网络的正常运行, OpManager通过发送回显信息检测设备可用性(轮询间隔可由用户定义),当设备检测失败时发出告警通知网络管理员。如果设备多次发送回显信息都没有响应,告警级别会上升。有4个基于严重程度的阈值级别:需要关注的、有问题的、危急和重整。

此外,对于与设备关联的每个监视器(例如:CPU Utilization),您可以配置阈值级别。所以无论何时,值超过给定阈值水平的指定值, OpManager都会发出告警。例如,当设备违反需要关注的阈值级别时, OpManager会发出注意级别的告警,您可以在设备达到下一个级别之前采取纠正措施。

在问题成为潜在威胁之前主动修复问题。阈值违规引发的告警可用于:

  • 配置通知配置文件以获得即时通知
  • 配置告警上报规则,将无人值守的告警上报
  • 设计并执行一个工作流来自动纠正问题

告警配置

配置通知配置文件是处理发出的告警的一种方法。可以根据用户偏好配置接收选定告警的详细信息。它主要用于通过短信或电子邮件向it管理员/管理团队发送告警的详细信息,也可用于运行程序/记录工单并执行其他操作。

OpManager的移动平台适用于android和iOS用户,能够监控手机上的整个IT基础设施。该应用程序允许用户在设备故障和其他性能下降问题上获得即时推送通知。还可以配置自定义推送通知来获取关键服务器的状态,避免在远程时错过任何网络更新。

告警升级

界面中的告警 页签提供了完整的告警列表,用户可以深入了解每条告警的详细信息。具体操作包括:确认、取消确认、删除和清除。

当告警长时间无人处理时,可以通过告警上报规则对告警进行上报,配置告警上报的条件。这确保避免了由于人为错误而导致的严重违规影响您的网络性能。

告警抑制

当某些设备处于维护状态时, OpManager可能会发出警告认为这些设备不可用。可以配置告警抑制规则以避免这些情况,该规则允许系统在指定的时间段内不触发告警。

通过工作流自动解决网络故障

OpManager中的工作流大大缩短了平均修复时间,加快了故障解决速度。

工作流是无代码的,可以执行某些常规操作,简化了解决方案,可以自动执行某些常规操作。用户可以简单地设计一个工作流,以便在错误识别或阈值违反和任何其他重复任务之后执行纠正操作。

例如,用户可以设计一个工作流来删除超过30天的文件,以释放计算机中的空间。工作流可以计划每月执行一次,这将在满足标准(30天以前)时自动删除过程。

还可以在ServiceDesk Plus中配置将某些故障作为工单发出告警。因此,问题升级到技术团队并将在更短的时间内得到解决。工作流也可以远程监控故障,因为即使IT管理团队不在现场,也可以自动执行操作。

注意: OpManager与其他ITSM工具如SDP OP, SDP Cloud, ServiceNow, Jira ServiceDesk, AlarmsOne等无缝集成。 OpManager还支持webhooks,并支持与第三方应用程序(如Telegram)的集成。了解更多关于 OpManager中可用的集成。