管理 VMware 告警

OpManager的动态告警和阈值功能是主动监控方法的核心。OpManager从每个vCenter/ESX主机无缝获取事件,类似于SNMP陷阱。目前,支持重要事件列表,并且此列表在每个版本中都会更新。除了这些事件之外,OpManager还监控关键性能指标的阈值并发出告警。

要根据您的要求定制此系统,并更改每个性能监视器的预设阈值,请转到主机/虚拟机/数据存储的快照页面下的监视器部分。

Vm alert monitors

要查看 VMware 监视器的完整列表,请执行以下操作:

  • 转到 VMware 主机快照页面中的监控选项卡。导航到资源清单 -> 设备,然后单击设备以查看其快照页面。
  • 性能监视器选项卡下,单击“操作”,然后单击“添加性能监视器”。这将显示OpManager中所有可用的性能监视器的列表。
  • 要仅查看 VMware 主机的性能监视器列表,请向下滚动到 VMware 主机监视器部分。
  • 要查看虚拟机的性能监视器列表,请向下滚动到VMware - 虚拟机监控器”部分。
  • 要查看数据存储的性能监视器列表,请向下滚动到 VMWare - 数据存储监视器部分。
  • 您还可以通过单击主机/虚拟机相应设备模板下的添加监视器来查看和添加主机/虚拟机的性能监视器。

表1:OpManager支持的与主机、数据存储和虚拟机相关的关键性能指标的几个阈值监视器列表

 

编号 阈值监视器 虚拟设备类型 资源
1. 主机网络接收的数据包 主机 网络
2. 主机网络传输的数据包 主机 网络
3. 主机网络使用情况(平均) 主机 网络
4. 主机 CPU 使用率(平均) 主机 中央处理器
5. 主机内存利用率(平均) 主机 内存
6. 主机磁盘读取延迟 主机 磁盘
7. 主机磁盘写入延迟 主机 磁盘
8. 数据存储空闲空间 主机 网络
9. 收到的虚拟机网络数据包 虚拟机 网络
10. 传输的虚拟机网络数据包 虚拟机 网络
11. 虚拟机网络使用情况(平均) 虚拟机 网络
12. 虚拟机 CPU 使用率 (平均) 虚拟机 中央处理器
13. 虚拟机内存使用情况(平均) 虚拟机 内存

 

表2:OpManager支持的VCenter / ESX主机事件很少

编号 事件 虚拟设备类型 严重级别
1. VmFailedToPowerOffEvent 虚拟机 危急
2. VmPoweredOffEvent 虚拟机 需要关注的
3. VmPowerOffOnIsolationEvent 虚拟机 正常
4. VmFailedToPowerOnEvent 虚拟机 危急
5. VmPoweredOnEvent 虚拟机 需要关注的
6. VmFailedToSuspendEvent 虚拟机 危急
7. VmSuspendedEvent 虚拟机 需要关注的
8. VmFailedToRebootGuestEvent 虚拟机 危急
9. VmGuestRebootEvent 虚拟机 正常
10. VmFailoverFailed 虚拟机 有问题的
11 VmPrimaryFailoverEvent 虚拟机 危急
12. VmUpgradeFailedEvent 虚拟机 危急
13. VmUpgradeCompleteEvent 虚拟机 正常
14. VmDisconnectedEvent 虚拟机 需要关注的
15. VmConnectedEvent 虚拟机 需要关注的
16. VmDiskFailedEvent 虚拟机 危急
17. VmRelocatedEvent 虚拟机 需要关注的
18. VmRelocateFailedEvent 虚拟机 危急

您可以在VMware Events的设置→监视器下查看OpManager支持的ESX主机/vCenter事件的完整列表。

注意: OpManager仅根据VMware事件触发告警,一旦处理完问题/通知,就必须手动清除告警。

除此之外,您还可以在OpManager中为VMware父设备启用基于物理网卡/主机总线适配器的告警。这些告警可以在发现该父设备期间启用,也可以通过启用引发物理网卡和主机总线适配器的告警选项从“更新清单”页面启用。这些是OpManager及其NIC/HBA等效项中的可用状态消息:

物理网卡状态消息:

编号 OpManager状态消息 相应的 NIC 状态
1 正常 连接
2 危急 断开

主机总线适配器状态消息:

编号 OpManager状态消息 相应的 HBA 状态
1 正常 在线
2 需要关注的 未绑定(或脱机)
3 有问题的 故障

要深入了解OpManager的VMware监控实践,请浏览以下帮助文档。