SNMP陷阱监控

SNMP 定义

简单网络管理协议 (SNMP) 是一种广泛使用的网络监控协议,可帮助您监控通过 SNMP 连接的远程设备。

SNMP的体系结构包括三个组件:SNMP管理器、被管设备和SNMP代理。

  • SNMP管理器是负责发送请求和收集监控数据的监控服务器。
  • 被管设备是被监控的设备。例如:打印机、服务器、路由器、交换机。
  • SNMP 代理安装在被管设备上,并将所需的响应发送到管理器。

什么是SNMP陷阱

陷阱是当设备发生故障/网络问题时,从被监控设备上的代理发送到 SNMP 管理器的神秘消息。SNMP管理器(监控服务器)反过来将陷阱转换为告警以通知用户。简而言之,当被监控设备出现问题时,会立即发送陷阱。

例如,让我们考虑一台打印机,它由OpManager(SNMP管理器)使用其SNMP监控功能进行远程监控。当发生错误时,例如卡纸问题,打印机会立即生成一个陷阱并发送到OpManager,OpManager又将其转换为告警以通知用户。

我们为什么要处理trap

陷阱中的数据采用对象标识符 (OID) 值对的形式,每个值对都作为变量绑定 (varbind) 调用。接收到的陷阱是非人类可读的格式,我们处理陷阱以将这些信息转换为有意义和人类可读的数据。

与每个陷阱关联的 OID 值是唯一的。这意味着监控的每个指标(例如:卡纸、开门)将具有不同的 OID,以区分陷阱。

如何在OpManager中将陷阱转换为告警

在OpManager的SNMP陷阱监视器中收到的故障/网络问题/阈值违规陷阱将被转换为告警,以通知IT管理员。

添加陷阱处理器时,用户可以定义匹配条件。匹配条件定义 varbind 值,如果这些值与流入陷阱 OID 中的数据匹配,则将发出告警。这种告警通常称为陷阱告警

定义“重置”条件以清除告警。当流入陷阱 OID 的 varbind 值与重整条件匹配时,告警将被清除。

导航到 告警 --> Trap 告警 以查看设备的 Trap 告警列表。

先决条件

为了在OpManager中接收和处理陷阱,用户应将OpManager安装的服务器配置为被监控设备中的陷阱目标。

处理trap的基本配置

在处理陷阱之前,用户应在OpManager中启用陷阱处理并完成基本配置。

  • 导航到设置 --> 监控 --> SNMP 陷阱处理器
  • 单击陷阱设置
  • 启用陷阱处理。(默认情况下,陷阱处理处于禁用状态。
  • 输入相应的陷阱端口。(注意:此端口将接收陷阱,因此请确保端口未被阻塞)
  • 输入“按故障组件限制SNMP陷阱”的值。此选项使您能够根据告警实体限制陷阱。
  • 输入“按设备限制陷阱”的值。此选项使您能够根据设备限制陷阱。
  • 选择类别以筛选出应应用此配置的设备集。
  • 现在从“可用设备”中选择设备,然后将它们传输到“所选设备”列。
  • 最后,单击保存进行更新。

注意:“按故障组件限制SNMP陷阱”和“按设备限制陷阱”的最大值为5000

OpManager中的陷阱处理

用户可以使用OpManager从终端设备接收陷阱,并以3种不同的方式处理它们。

  1. 使用Trap Viewer实时查看流入的陷阱。您可以为所有接收到的陷阱添加陷阱处理器,也可以仅为要发出告警的陷阱添加陷阱处理器。
  2. 您可以直接访问管理信息库 (MIB) 并将收到的陷阱 OID 转换为可读形式
  3. 如果您知道 OID 和 trap 参数,则可以直接为陷阱添加陷阱处理器,如以下步骤所述。

从 MIB 加载陷阱解析器

以下是从各种 MIB 加载陷阱的步骤:

  • 转到设置→监控→SNMP陷阱处理器。此处列出了所有已配置的处理器。
  • 将光标悬停在动作菜单上,然后单击 从 Mibs加载trap库
  • 从 MIB 列表中,选择要从中加载的 MIB。列出了该 MIB 中的陷阱。
  • 选择所需的陷阱变量,然后单击添加

将添加所选陷阱的处理器,并将列出。

如何添加陷阱处理器?

1. 导航到设置 -->监控 -->SNMP 陷阱处理器。将光标悬停在操作选项卡上,然后单击添加

2. 选择SNMP版本 - SNMP v1/ SNMP v2c/v3,然后输入名称和描述。

注意:当您使用 SNMP v3 监控设备并接收陷阱时,请确保使用相同的凭据进行设备监控和陷阱。

3. 如果选择 SNMP v1,请从下拉列表中选择通用类型。OpManager支持SNMP v1的以下类型的陷阱。

  • coldStart:代理重新初始化,并更改其配置。
  • warmStart:代理将重新初始化,其配置保持不变。
  • 衔接:当代理上的网络接口卡 (NIC) 正在运行时。
  • 链接:当代理上的网络接口卡发生故障时。
  • 身份验证失败:当 SNMP 代理收到来自无法识别的团体名称的请求时,会发生这种情况。
  • egpNeighborloss:代理无法与其 EGP(外部网关协议)对等方通信。
  • Enterprise specific它因供应商而异,并指定与特定供应商相关的特定错误条件和错误代码。

4. 输入陷阱 OID(监控参数)和该陷阱的告警严重性

5. 输入故障组件的详细信息。故障组件表示在源设备中监视的指标,用于限制陷阱处理器的数量。例如,OpManager监控远程设备的CPU利用率和风扇状态,设备上的代理发送一个CPU利用率高的陷阱和另一个陷阱来通知风扇故障状态。由于这两个陷阱来自同一个源设备,OpManager将把这两个陷阱组合在一起,并将它们视为一个实体,以限制陷阱处理器的数量。

6. 输入,即接收陷阱的设备。陷阱告警将映射到此设备。

7. 输入消息。“消息”字段中的内容包含已创建陷阱告警的说明。

8. 选择匹配条件协议 - AND/OR。然后选择 Varbind 的数量并输入相应的匹配值。仅当此值与流入陷阱匹配时,才会生成告警。以同样的方式输入重置条件详细信息。当接收到的陷阱的 varbind 值与为 Rearm Criteria 配置的 varbind 值匹配时,将为陷阱发出的告警将被清除。

 

注意:为了避免性能下降,建议仅从选定的设备配置和接收陷阱。

处理trap告警

您可以在为陷阱发出告警的情况下执行以下操作。

  • 配置通知配置文件
  • 执行工作流
  • 升级告警

通知配置文件

OpManager中的通知配置文件提供了多种选项来处理告警。虽然它主要用于通过电子邮件/短信向 IT 管理员发送告警详细信息,但它可用于执行其他操作,例如记录工单或运行程序。这有助于 IT 管理员远程监控设备并接收有关网络问题的通知。

OpManager的移动应用程序进一步简化了远程网络监控,该应用程序可供iOS和Android用户使用。使用该应用程序,您可以获得有关设备停机状态、故障和其他性能下降问题的即时推送通知,这样您就不会错过任何告警。

执行工作流

您可以在陷阱告警上执行已保存的工作流。例如,您可以在 ServiceDesk Plus 或 ServiceNow 等桌面应用程序中以工单形式发出严重陷阱告警,以快速纠正故障。

升级告警

对于引发的每个告警,您可以执行以下操作:确认、取消确认、正常和删除。

但是,当 IT 管理员长时间无法参加告警时,可以通过配置告警升级规则来升级更新,并且可以通过短信和电子邮件将无人值守的告警详细信息发送给相关团队成员。