监控CPU利用率骤增、服务器宕机等常见问题非常简单。对于逐渐恶化的性能问题,即渐变性问题,采用传统的监控软件,无法有效监测。例如,若服务器负荷在一段时间内不断增加,响应时间越来越长,严重影响客户。Applications Manager能够快速定位和修复渐变性性能问题,避免影响最终用户。
异常检测通过为性能参数定义异常检测配置文件来帮助你发现性能的逐渐下降。通过定义异常检测文件,你可以定义使用当前数据和最好历史数据进行比较的规则。
异常检查配置文件的设置方式:
如果当前值与基线周期内的值不符的时候产生异常。当前的属性值和以前的某一周(基线周)值进行对比。选择系统运行状态很好的一周(或者告警数量很少)作为参考/基线的日期范围。 选择周作基线对比后,然后每天的数据和作为基线那周相应的每天进行比较。例如,如果你选择了八月的第一周作为基线周,那么每星期一的数据就会和八月第一周的星期一进行比较。
当发现关联到属性的配置文件及属性的历史值违反关联的异常检测配置文件时,即基于配置触发告警。例如:你可以创建一个规则,当短期最后一个小时平均值大于6小时的移动平均值的两倍的时候产生异常。相应地可以设置严重和警告告警。
创建的异常配置文件bixuu与相关的性能属性相关联,还需要关联告警动作,如发送Email。
异常仪表盘: 这个仪表板可以方便地查看所有的性能参数。帮助用户直观方便地在数以百计的性能参数中找到你想要的。
它允许我们跟踪关键指标,如响应时间、资源利用率、错误率和交易性能。实时监控告警会及时通知我们任何问题或异常,使我们能够立即采取行动。
审稿人角色:研究与开发
Lexmark技术支持经理