Linux性能监视器


总览

ManageEngine Applications Manager提供了现成的 Linux服务器性能监控功能。通过监控CPU使用率,内存使用率,进程,磁盘使用率,磁盘I/O统计信息,它可以帮助运营团队确保服务器正常运行(ping)并以最高性能运行。

在此帮助文档中,您将学习如何开始使用Linux性能监控以及通过Applications Manager的Linux监控工具监控的参数列表 。

创建一个新的Linux监视器

监控Linux服务器性能指标的先决条件: 点击此处

使用REST API添加新的Linux服务器监视器: 点击此处

请按照以下给出的步骤创建新的Linux服务器监视器:

  1. 选择监控模式(Telnet,SSHSNMP)。对于IBM AIX,HP Unix,Tru64 Unix,仅  支持Telnet 和 SSH。对于Novell,仅支持SNMP。
  2. 如果是Telnet,请提供服务器的端口号(默认为23)以及用户名和密码信息。
  3. 如果为SSH,请提供服务器的端口号(默认为22)以及用户名和密码信息。您可以选择提供公钥身份验证(用户名和私钥)。如果私钥受密码保护,您也可以提供密码短语。

    注意:要标识公钥/私钥,请转到命令提示符,输入 cd.SSH /, 然后从列表中打开文件< id_dsa.pub > / < id_rsa.pub > [Public]或< id_dsa > / < id_rsa > [私有]获取密钥。

  4. 如果是SNMP,请提供运行它的端口(默认为161)和SNMP团体字符串(默认为'public')。这不需要用户名和密码信息。
  5. 对于Telnet / SSH监控方式,请指定命令提示符值,该值是命令提示符中的最后一个字符。默认值为$,可能的值为>,#等。

    注意:在尝试通过SSH进行监控的服务器中,应将PasswordAuthentication变量设置为' yes ',以进行数据收集。为此,请访问文件/ etc / ssh / sshd_config并验证PasswordAuthentication变量的值。如果将其设置为 no ,请将其修改为 yes ,然后使用命令/etc/rc.d/sshd restart重启SSH守护进程。
  6. 从您要与监视器关联的组合框中选择业务组(可选)。
  7. 点击添加监视器。这将从网络中发现主机或服务器,并开始监控它们。

监控参数

Applications Manager的Linux性能监控监控Linux服务器的关键性能指标,以检测任何性能问题。这些指示器包括CPU,内存,磁盘等。

  • 可用性 选项卡显示了过去24小时或30天内Linux服务器的可用性历史记录。
  • 性能 选项卡显示了Linux服务器的一些关键性能指标,例如物理内存利用率,CPU利用率,响应时间和交换内存利用率以及  这些属性的热图。此选项卡还显示过去24小时或30天的健康状态和事件。
  • 列表视图选项卡列出了由Applications Manager监控的所有Linux服务器以及它们的整体可用性和健康状况。它使您能够执行 批量管理配置

点击列出的各个监视器以查看详细的Linux服务器性能指标。性能指标已分为6个不同的标签:

*仅监控以SNMP模式添加的Linux监视器的网络接口详细信息。

概览

该选项卡提供了Linux服务器的健康状况和性能的高级概述,以及与系统上运行的进程有关的信息。

参数 描述
监控信息
Name Linux服务器监视器的名称。
System Health 表示Linux服务器的健康状态(正常,严重,警告)。
Type 表示您正在监控的类型。
Host name Linux系统的主机名。
Host OS 系统上安装的主操作系统。
Last Polled at 指定执行上次轮询的时间。
Next Poll at 指定计划下一次轮询的时间。
Today's Availability 显示当天服务器的整体可用性状态。您还可以查看7/30报告和服务器的当前可用性状态。

 

参数 描述
Thread count Linux机器上运行的线程数
Process Count 进程数。太多的开放进程会导致服务器性能下降。及时提醒进程数会增加,因此用户可以在问题出现之前进行补救。
Zombie Process Count 僵尸进程数。僵尸进程可以不受控制地保持端口打开。有助于查看何时生成了僵尸进程,以便在出现任何问题之前可以进行相应处理

您可以使用  监视器信息部分中的自定义字段选项为监视器配置其他字段。

  • 概述选项卡显示刻度盘为CPU,内存和磁盘利用率。您可以点击这些刻度盘以查看这些属性的详细图形和图表。可用的图形是历史记录报告,小时数报告,星期几报告和热图。可以为实时和历史数据生成这些图。
  • CPU和内存使用率-最近六个小时 图显示了最近六个小时的内存使用率和CPU使用率值。此处显示的属性是交换内存利用率,物理内存利用率(%和MB)和CPU利用率(%)。
  • CPU使用率 分解图提供了对整个系统处理器的性能指标的分解,包含诸如运行队列,阻塞的进程,用户时间(%),系统时间(%),I/O等待(%),空闲时间等属性(%),窃取时间(%)和中断/秒。
  • 该 系统负载 图提供你的工作,系统执行的量的概念。最近一分钟,五分钟和十五分钟期间的系统负载由参数表示,例如分钟内的作业,5分钟内的作业和15分钟内的作业。
  • 该 进程详细信息 有关Linux服务器上运行的进程一节中显示的信息。您可以使用添加新进程选项来添加用于监控的 进程。您还可以删除不需要的进程,并启用/禁用特定进程的报告。点击列出的任何属性以查看更多详细信息。
  • 此系统中的监视器 部分显示了在此服务器中配置的监视器的可用性和健康状况。要添加新的监视器以进行监控,请使用 添加监视器 选项。

CPU

该选项卡提供Linux服务器的CPU使用率统计信息。该选项卡包含两个图形-一个显示CPU总 CPU利用率 ,另一个显示CPU利用率-按CPU内核。 您可以通过点击 分解CPU利用率细分-按CPU内核部分中显示的图形来查看其他报告 。这些报告包括CPU使用率分解(%)Vs时间,用户时间(%)Vs时间,系统时间(%)Vs时间,I/O等待时间(%)Vs时间,空闲时间(%)Vs时间,Steal Time (%)与时间,所有CPU内核的CPU使用率(%)VS时间和中断/秒Vs时间。

CPU选项卡还显示以下性能指标:

参数 描述 监控模式
Telnet/SSH SNMP
Core CPU内核名称    
User Time(%) 处理器花费在用户模式操作上的时间百分比。这通常意味着应用程序代码。
System Time(%) 正在使用的CPU内核进程的百分比。
I/O Wait Time(%) 处理器等待I/O完成所花费的时间。
Idle Time(%) CPU空闲(未被任何程序使用)的时间
Steal Time(%) 当管理程序为另一个虚拟处理器提供服务时,虚拟CPU等待实际CPU的时间。
CPU Utilization(%) 指定系统使用的总CPU。
Interrupts/sec CPU每秒处理来自应用程序或硬件的中断的速率。如果中断/秒的值在持续的时间内很高,则可能存在硬件问题。

您还可以通过选择必要的CPU内核,然后选择适当的属性来查看这些属性的图形。

磁盘

该选项卡显示Linux服务器的磁盘使用情况和磁盘I/O统计信息。

参数 描述
磁盘利用率
Disk 磁盘驱动器的名称。
Used (%) 表示实际已使用了总磁盘空间中的多少磁盘空间(以百分比为单位)
Used (MB) 使用的磁盘空间(以兆字节为单位)。
Free (%) 磁盘上可用总可用空间的百分比。
Free (MB) 磁盘上未分配的空间(以兆字节为单位)。
磁盘I/O统计信息
Transfers/sec 每秒在磁盘上进行的读/写操作的数量。
Writes/sec 磁盘驱动器忙于处理写请求所花费的时间百分比。
Reads/sec 磁盘驱动器忙于处理读取请求所花费的时间百分比。
% Busy Time 磁盘繁忙时间的百分比。
Average Queue Length 在采样间隔内排队等待磁盘的读写请求的平均数量。
索引节点使用
Inode 索引节点的名称。
Total 该特定磁盘中可用的Inode总数。
Used 磁盘驱动器忙于处理读取请求所花费的时间百分比。
Free 该特定磁盘中可用的Inode剩余数量。
Used (%) 该特定磁盘中使用的Inode数(以百分比表示)。
Free (%) 特定磁盘中可用的Inode剩余数量(以百分比表示)。

您还可以使用删除孤立磁盘 选项删除已物理 删除的磁盘

注意:可以从管理→性能轮询→服务器选项卡下的磁盘I/O统计信息监控Inode监控选项启用磁盘I/O统计信息和Inode统计信息的数据收集。

Cron Job

Cron作业用于计划Linux中的备份,电子邮件,状态检查等任务,并且会对Web服务器和应用程序的性能产生重大影响。通过持续监控应用程序,Applications Manager使其变得容易,并帮助您深入了解后端系统中重要作业的执行情况。

添加Cron作业监视器

先决条件: 点击这里

  1. 转到Cron Job选项卡,然后点击添加Cron Job
  2. 输入以下详细信息:
    • 显示名称-易于识别的用户名。
    • Cron表达式-用于计划cron作业的表达式。
    • 时区-通过从下拉列表中进行选择,在远程Linux计算机中配置的适当时区。
    • 作业脚本路径-需要在cron作业中执行的完整脚本路径。
    • Cron Job Period-作业应运行的时间(以分钟为单位)。如果超过配置的时间,则状态将更新为EXCEEDJOBTIME
  3. 添加了cron作业监视器之后,您的cron作业的 curl详细信息将显示在下面。通过点击复制显示的 curl详细信息,然后关闭 curl详细信息窗口。现在,您将自动重定向到Applications Manager的Cron Job选项卡。
  4. 在远程Linux计算机上,打开命令提示符并执行命令crontab -e。这将在编辑模式下打开crontab。粘贴先前复制的cron详细信息,然后保存并关闭crontab。

下表包含有关Linux服务器中运行的Cron作业详细信息的信息。

参数 描述
Cronjob详细信息:
Cron Name Cron作业的名称。
Cron Expression 相应Cron作业的Cron表达式。
Job Start Time Cron作业开始的时间和日期。
Job End Time Cron作业结束的时间和日期。
Next Run Time 下一个Cron作业计划运行的时间和日期。
Elapsed Time 自Cron作业开始以来消耗的时间(以分钟为单位)。
Exit Code 表示Cron作业的退出代码。
Missed Runs Cron作业在计划的时间失败/错过启动的次数。
Status Cron作业的状态。可能的值为:
  • 通过-作业已成功运行,退出代码等于0。
  • 正在运行-作业当前正在运行。
  • 失败-作业失败,退出代码大于0。
  • EXCEEDJOBTIME-作业的运行时间超过了配置的作业时间。

注意:添加Cron作业后,它将处于发现状态,直到我们从远程服务器收到第一个响应。

更新cron作业

要更新Cron作业,

  1. 点击所需的cron作业的编辑图标。
  2. 输入所需的显示名称和该cron作业Cron作业周期
  3. 点击更新

删除Cron作业

要删除Cron作业,

  1. 选择需要删除的cron作业。
  2. 点击删除Cron作业。这将从Applications Manager中删除cron作业。
  3. 最后,确保使用crontab -e命令删除附加到远程服务器中cron作业的curl 。

注意:只有管​​理员用户才能在托管服务器中添加,更新和删除Cron作业。

网络(仅适用于SNMP模式)

网络接口

参数 描述
网络接口
Name Windows系统中存在的网络接口的名称。
Speed(Mbps) 当前带宽的估计(以Mbps为单位)
Input Traffic(Kbps) 接口上接收数据包的速率,以每秒千字节为单位。
Output Traffic(Kbps) 接口上发送数据包的速率,以每秒千字节为单位。
Errors 无法发送或接收的数据包数。
 
注意:
  • 仅监控以SNMP模式添加的Linux监视器的网络接口详细信息。
  • 您也可以使用Delete Orphaned Interface选项删除已物理删除的接口

配置

此选项卡包含有关系统配置属性的信息。

参数 描述
系统信息
Host name 系统名称。
Domain 系统所属域的名称。
操作系统信息
OS Name 操作系统实例的名称。
OS Version 操作系统的版本号。
OS Release Linux发行版
内存详情
Total Physical Memory (MB) 操作系统可用的物理内存总量。
Total Swap Memory (MB) 可用交换内存总量。
处理器信息
Id 系统上处理器的唯一标识符
Model 处理器型号类型
Implementation 处理器系列类型。
Manufacturer 处理器制造商名称
Speed(MHz) 当前处理器速度
Cache (KB) 处理器缓存的大小。高速缓存是外部存储器区域,其访问时间比主存储器快。
网络接口设置
Name 网络适​​配器的名称。
IP Address 为此网络接口配置的IP地址
MTU 使用的网络介质。
Type 网络适​​配器的类型。
Mac Address 此网络适配器的媒体访问控制地址。MAC地址是制造商分配给网络适配器的唯一48位数字。它唯一地标识此网络适配器,并用于映射TCP / IP网络通信。
Status 网络适​​配器的当前状态。
Broadcast Address 消息广播到的IP地址。
打印机设定
Name 打印机名称。
Device 控制打印机的服务器的名称。
Default 指示打印机是否为默认打印机。值为True或False。
Status 打印机的当前状态。

注意:配置选项卡中显示的数据不会在每次轮询期间更新。因此,如果您对服务器配置进行了任何更改,则需要重新启动Applications Manager,以使这些更改反映在配置选项卡中。

硬件指标

以下是与Dell和HP服务器的硬件有关的指标:

类别 属性 描述 DELL HP
SNMP模式 WMI模式 SNMP模式 WMI模式
Temperature Sensor 温度传感器的名称。
Temperature Reading (deg C) 当前/当前温度读数。
Status 温度状态-严重,警告,正常
Fan Sensor 风扇传感器的名称。
Fan Speed (RPM) RPM中显示的风扇速度值。
Status 风扇状态-严重,警告,正常
Power Sensor 电源名称。
Reading (Watts) 电源读数值以瓦特显示。
Status 电源状态-严重,警告,正常
Voltages Sensor 电源名称。
Reading (Volts) 电压读数值以伏特显示。
Status 电压状态-严重,警告,正常
Battery Sensor 电池传感器的名称
Status 电池状态-严重,警告,正常
Memory Sensor 内存传感器的名称。
Memory Device Type 存储设备的类型
Size (MB) 当前安装的内存量,以MB为单位。
Status 内存状态-严重,警告,正常
Disk Sensor 标识磁盘的标签
Device Name 为磁盘配置的设备名称
Size (MB) 分配的大小(MB)
Status 磁盘状态-严重,警告,正常。
Array Sensor 阵列磁盘的名称
Bus protocol 阵列磁盘的总线类型
Size (MB) 阵列磁盘上已使用空间的大小(MB)。
Status 阵列状态-严重,警告,正常
Chassis Sensor 用户分配的机箱名称。
Model 该机箱的系统型号类型
Status 机箱状态-严重,警告,正常
Processor Sensor 处理器设备状态探针的位置名称
Processor Brand 处理器设备的品牌
Processor Current Speed 处理器设备的当前速度(MHz)
Processor Core Count 为处理器设备检测到的处理器内核数。
Status 处理器状态-严重,警告,正常
  • 如果组件正常运行,则状态指示灯为绿色。
  • 如果系统组件违反性能阈值或无法正常运行,则状态指示灯将变为橙色或红色。通常,橙色指示灯表示性能下降。
  • 红色指示灯表示组件已停止运行或超过最高阈值。
  • 如果状态为空,则健康状况监控服务无法确定组件的状态。

注意:当前,SNMP和WMI监控模式支持硬件性能监控。

硬件设备级配置

在详细信息页面右侧的主机详细信息下提供了硬件配置选项,可让您选择要监控的各种硬件组件。也可以使用管理 选项卡 下的性能轮询选项来完成此操作 ,该 选项将全局配置硬件统计信息。

高级设置

通过点击 详细信息页面右侧主机详细信息下可用的高级设置选项,可以转到服务器的 性能数据收集页面。

在这里,您可以使用硬件健康状况监控 选项来启用或禁用服务器中的硬件监控。您还可以通过检查给定的选项来选择要监控的各种硬件组件(例如电源,风扇,磁盘等)。这将全局配置硬件监控状态。您还可以通过在相应的文本框中定义值来配置健康状况:

  • 严重级别: 如果状态与严重级别文本框中定义的任何值匹配,则Applications Manager会将硬件设备的状态显示为严重。默认情况下定义的值是fail,error,failure,nonRecoverable,criticalUpper,criticalLower,nonRecoverableLowercritical
  • 警告严重性: 如果状态与警告严重性文本框中定义的任何值匹配,则Applications Manager会将硬件设备的状态显示为警告。默认情况下定义的值是degraded, warning, nonCritical, nonCriticalUpper, nonRecoverableUppernonCriticalLower
  • 正常严重性:如果状态与正常严重性文本框中定义的任何值匹配,则Applications Manager将硬件设备的状态显示为正常。默认情况下定义的值为 ok 。

    注意:如果设备的状态与严重性文本框中定义的任何值都不匹配,则设备状态将显示为未知。在严重性文本框中定义的状态值以逗号分隔且不区分大小写。