CISCO UCS 监控


概述

思科统一计算系统(CISCO UCS)是下一代数据中心平台,它将计算,网络,存储访问和虚拟化结合到一个统一的系统中,旨在降低总拥有成本(TCO)和提高业务敏捷性。

Applications Manager提供了对Cisco UCS环境的监控,您可以在其中监控和跟踪应用程序和系统的各种KPI。它收集实时Cisco UCS数据,以易于理解的仪表板形式显示,并帮助您确定系统偏离理想性能的原因。

创建一个新的监视器

请按照以下给出的步骤创建新的Cisco UCS监视器:

  1. 单击新建监视器 链接。在融合基础结构 类别下,选择Cisco UCS
  2. 指定显示名称
  3. 输入运行Cisco UCS Manager服务器的主机名/IP地址
  4. 指定运行Cisco UCS Manager的端口。默认端口是80。
  5. 如果要通过SSL端口访问Cisco UCS Manager,请选择启用SSL 选项。
  6. 输入凭证详细信息,例如Cisco UCS Manager的用户名密码 以进行身份验证,或在启用从凭证中选择列表 选项后,从凭证管理 列表中选择所需的凭证。
  7. 以秒为单位指定 超时值。
  8. 以分钟为单位指定 轮询间隔
  9. 从组合框中选择要将Cisco UCS Manager与之关联的业务组。(可选) 您可以选择多个组来关联您的监视器。
  10. 单击添加监视器。这将从网络发现Cisco UCS Manager并开始对其进行监控。

监控的参数

通过单击监视器选项卡,转到监视器类别视图。单击 聚合基础结构 表下的Cisco UCS。显示的是Cisco UCS批量配置视图,分布在三个选项卡中:

  • 可用性 选项卡提供了过去24小时或30天的可用性历史记录。
  • 性能 选项卡提供了过去24小时或30天的健康状况和事件。
  • 列表视图 使您可以执行批量管理配置。

从列表中单击监视器后,将转到Cisco UCS监视器仪表板。它有9个标签 -

概述

此选项卡提供有关UCS系统中所有组件总数的详细信息。

参数 描述
服务器响应时间:
Response time Cisco UCS Manager的响应时间。(毫秒)
组件:
Total number of Chassis Servers UCS系统中机箱服务器的总数。
Total number of Rack Mount Servers UCS系统中Rack Mount服务器的总数。
Total number of Fabric Extenders UCS系统中fabric extenders的总数。
Total number of Fabric Interconnects UCS系统中的Fabric Interconnect总数。
Total number of Processor Units UCS系统中的处理器单元总数。
Total number of Adaptor Units UCS系统中适配器单元的总数。
Total number of I/O Modules UCS系统中输入输出模块的总数。

机箱

此选项卡提供有关UCS系统中可用的各种机箱性能指标的详细信息。

参数 描述
机箱:
Chassis Name 机箱的名称。
Chassis Server Count 机箱中存在的机箱服务器数量。
I/O Module Count 机箱中输入输出模块的数量。
Fan Count 机箱中可用的风扇数量。
Power Unit Count 机箱可用的电源单元(PSU)的数量。
Chassis Operational Status 机箱的运行状态。(可操作/已降级)
机箱服务器:
Name 刀锋服务器的名称。
Chassis Name 机箱的名称。
Model 刀锋服务器的型号名称。
Operablility 表示刀锋服务器的可操作性条件。
Power 刀锋服务器的电源状态。(开/关)
Adaptor count 可用适配器的数量。
Network Interface Cards 存在的网络接口卡的数量。
内存和CPU:
Name 刀锋服务器的名称。
Chassis NameChassis Name 机箱的名称。
Core count 可用的CPU内核数。
Core Enabled 启用的CPU内核数。
CPU count 可用的CPU数量。
Thread count CPU中可用的线程总数。
Available Memory 服务器中可用的内存量。(GB)
Total Memory 分配给服务器的内存总量。(GB)
Available Memory % 服务器中可用的内存量。(%)
Utilized Memory % 服务器使用的内存量。(%)
主板电源:
Name 刀锋服务器的名称。
Chassis Name 机箱的名称。
Power Consumed 主板当前消耗的功率。(瓦)
Max Power Consumed 主板消耗的最大功率。(瓦)
Min Power Consumed 主板消耗的最低功率。(瓦)
Input Current 当前流入主板的输入电流量。(安培)
Max Input Current 主板接收的最大输入电流。(安培)
Min Input Current 主板接收的最小输入电流。(安培)
Input Voltage 当前输送到主板的输入电压量。(伏特)
Max Input Voltage 主板接收到的最大电压。(伏特)
Min Input Voltage 主板接收到的最小电压。(伏特)
主板温度:
Name 刀锋服务器的名称。
Chassis Name 机箱的名称。
Front Temperature 前面板温度传感器指示的温度值。(摄氏度)
Rear Temperature 后面板温度传感器指示的温度值。(摄氏度)
Rear Temperature Left 左后面板温度传感器指示的温度值。(摄氏度)

Rack Mount

此选项卡提供有关UCS系统中可用的各种机架式服务器性能指标的详细信息。

参数 描述
Rack Mount服务器:
Name 刀锋服务器的名称。
Model 机架服务器的型号名称。
Operability 表示刀锋服务器的健康状况。
Power 刀锋服务器的电源状态。(开/关)
Adaptor count 可用适配器的数量。
Network Interface Cards 可用的网络接口卡的数量。
内存和CPU:
Name 机架服务器的名称。
Core Count 可用的CPU内核数。
Core Enabled 已启用的CPU内核数。
CPU Count 可用的CPU数量。
Thread Count CPU中可用的线程总数。
Available Memory 服务器中可用的内存量。(GB)
Total Memory 分配给服务器的内存总量。(GB)
Available Memory % 服务器中可用的内存量。(%)
Utilized Memory % 服务器使用的内存量。(%)
主板电源:
Name 机架服务器的名称。
Power Consumed 主板当前消耗的功率。(瓦)
Max Power Consumed 主板消耗的最大功率。(瓦)
Min Power Consumed 主板消耗的最低功率。(瓦)
Input Current 当前流入主板的输入电流量。(安培)
Max Input Current 主板接收的最大输入电流。(安培)
Min Input Current 主板接收的最小输入电流。(安培)
Input Voltage 当前输送到主板的输入电压量。(伏特)
Max Input Voltage 主板接收到的最大电压。(伏特)
Min Input Voltage 主板接收到的最小电压。(伏特)
主板温度:
Name 机架服务器的名称。
Front Temperature 前面板温度传感器指示的温度值。(摄氏度)
Rear Temperature 后面板温度传感器指示的温度值。(摄氏度)
Ambient Temperature 主板的环境温度值。(摄氏度)
IO Hub1 Temperature Right I/O Hub1的温度值。(摄氏度)
IO Hub2 Temperature Right I/O Hub2的温度值。(摄氏度)

Fabric Interconnect

此选项卡提供有关UCS系统中可用的各种结构互联的性能指标的详细信息。

参数 描述
Fabric Interconnect:
Name 结构互联(FI)的名称。
Fan 与FI相关的风扇数。
Power Supply Unit Count FI中可用的电源设备(PSU)的数量。
结构互联软件:
Name 结构互联的名称(FI)
Available Memory 服务器中可用的内存量。(GB)
Total Memory 分配给服务器的内存总量。(GB)
Cached Memory 服务器的缓存内存量。(GB)
Available Memory % 服务器中可用的内存量。(%)
CPU utilization % 服务器当前的CPU使用率。(%)
结构互联电源单位 (PSU):
Name PSU的名称。
Fabric Interconnect Fabric Interconnect的名称(FI)。
Power Consumed PSU当前消耗的功率。(瓦)
Max Power Consumed PSU消耗的最大功率。(瓦)
Min Power Consumed PSU消耗的最小功率。(瓦)
Input Current 当前流入PSU的输入电流量。(安培)
Max Input Current PSU接收的最大输入电流量。(安培)
Min Input Current PSU接收的最小输入电流。(安培)
Input Voltage 当前输送到PSU的输入电压量。(伏特)
Max Input Voltage PSU接收的最大电压量。(伏特)
Min Input Voltage PSU接收的最小电压。(伏特)
Fabric Extender:
Name Fabric Extender(FEX)的名称。
Fan 与FEX相关的风扇数。
I/O Module FEX中存在的I/O模块数。
Power Supply Unit Count FEX中存在的电源设备(PSU)的数量。

处理器

此选项卡提供有关UCS系统中可用的各种处理器性能指标的详细信息。

参数 描述
处理器
Name 处理器的名称。
Equipment 处理器所在的设备。
Model 处理器的型号名称。
Speed 处理器的速度。
Core Count 可用的内核数。
Core Enabled 已启用的内核数。
Thread Count 可用线程数。
CPU Temperature CPU的当前温度值。
CPU Input current CPU的当前输入当前值。

风扇

此选项卡提供有关UCS系统中可用的各种风扇的性能指标的详细信息。

参数 描述
风扇模块:
Name 风扇模块的名称。
Equipment 风扇模块所在的设备。
Fans 模块中可用的风扇数。
Thermal Condition 风扇模块的热状况。
Fan Module Power 风扇模块的电源状态。(开/关)
Fan Module Operability 表示风扇模块的可操作性。
风扇:
Name 风扇的名称。
Fan Module 风扇模块的名称。
Equipment 风扇模块所在的设备。
Model 风扇的型号名称。
Thermal Condition 风扇的热状况。
Fan Power 风扇的电源状态。(开/关)
Fan Operability 表示风扇的可操作性。
Drive Percentage 风扇的驱动性能。(%)
Speed 风扇的速度。(RPM)
Max Speed 风扇的最大速度。(RPM)
Min Speed 风扇的最小速度。(RPM)

I/O模块

此选项卡提供有关UCS系统中可用的各种I/O模块的性能指标的详细信息。

参数 描述
I/O模块:
Name I/O模块的名称。
Equipment I/O模块所在的设备。
Model I/O模块的型号名称。
Thermal Condition I/O模块的热状况。
Operability 表示I/O模块的可操作性。

端口

此选项卡提供有关UCS系统中可用的各个端口的性能指标的详细信息。

参数 描述
以太网端口:
Name 以太网端口的名称。
Equipment 以太网端口所在的设备。
Mac Address 以太网端口的MAC地址。
Interface Role 以太网端口的接口角色。
Interface Type 以太网端口的接口类型。
Ethernet port status 以太网端口的运行状态。
Ethernet Admin State 以太网端口的管理员状态。
Slot ID 与以太网端口关联的插槽ID。
Operational Speed 以太网端口的运行速度。
背板端口:
Name 背板端口的名称。
Equipment 背板端口所在的设备。
Slot ID 与背板端口关联的插槽ID。
Mac Address 背板端口的MAC地址。
Interface Role 背板端口的接口角色。
Interface Type 背板端口的接口类型。
BackPlane Port status 背板端口的可操作状态。
BackPlane Admin State 背板端口的管理员状态。
Fabric端口:
Name Fabric端口的名称。
Equipment Fabric端口所在的设备。
Slot ID 与Fabric端口关联的插槽ID。
Mac Address Fabric端口的MAC地址。
Interface Role Fabric端口的接口角色。
Interface Type Fabric端口的接口类型。
Fabric Port status Fabric端口的可操作性状态。
Fabric Admin State Fabric端口的管理员状态。

故障

此选项卡提供有关UCS系统中可用故障的详细信息。

参数 描述
故障统计:
Critical Faults 严重程度为 严重 的故障数。
Major Faults 严重程度为 重大 的故障数。
Minor Faults 严重程度为 次要 故障数。
Warning Faults 严重程度为 告警 故障数。
连续轮询之间的故障:
Fault Code 描述故障的故障代码。
Fault Id 发生故障的ID。
Type 故障的严重性类型。(严重/重大/次要/警告)
Fault Affected object 受故障影响的硬件对象。  
Fault Cause 发生故障的原因。
Fault Created Time 故障产生的时间。
Last transition Time 故障状态改变的时间。
Fault Description 发生故障的描述。
Show All Faults 显示系统中当前存在的所有故障。