服务器监控


总览

在网络级别的管理中,维护网络的状态和连通性是非常重要的。尤其是要了解网络中机器的状态,它们的负载(或过载)状态以及如何有效地利用(或过度使用)这些机器,以便对识别出的过载/性能不佳的设备执行必要的纠正性管理功能。服务器管理是涉及许多手动干预,人力资源和要执行的管理任务。Applications Manager提供了服务器级别的监控功能,以实现这些目标并简化主机的配置管理过程。

支持的操作系统

  1. Windows
  2. Linux
  3. Sun Solaris
  4. IBM AIX (页面空间详细信息
  5. IBM AS400/iSeries
  6. HP Unix
  7. Tru64 Unix
  8. FreeBSD
  9. Mac OS
  10. Novell

创建一个新的服务器监视器

要创建上述任何服务器监视器,请遵循以下步骤:

  1. 转到新监视器,然后点击添加新监视器。在服务器部分下选择所需的服务器。
  2. 输入主机IP地址或主机名
  3. 输入网络的子网掩码
  4. 选择监控方式。(WMI / SNMP / SSH / TELNET
  5. 输入凭证详细信息(例如用于身份验证的用户名密码),或通过启用从凭证列表中选择选项从凭证管理列表中选择所需的凭证。
  6. 输入轮询间隔时间(以分钟为单位)。
  7. 如果要从Admin Server添加新监视器,请 选择被管服务器
  8. 提供监视器特定的身份验证信息:选择操作系统类型Windows((2000、2003、2003 R2、2008、2008 R2、2012、2012 R2,XP,NT,Vista,7、8和10),Linux,Sun OS,IBM AIX,IBM AS400 / iSeries,HP Unix,Tru64 Unix,FreeBSD,Mac OS,Novell,Windows Clusters 2008、2008 R2)。根据操作系统的类型,监控模式信息会更改。
  9. 选择业务组从要的服务器监视器(可选)关联的组合框。您可以选择多个组来关联您的监视器。
  10. 点击添加监视器。这将从网络中发现所需的服务器并开始监控它们。
注意:

您可以诊断每当错误输入任何输入详细信息时添加服务器监视器时发生的问题。通过点击诊断问题链接,您将能够查看与服务器相关联的各种信息,例如Ping测试,主机详细信息,监控模式以及包含同一主机的错误条目的表的列表。但是,这不适用于WMI监控模式。

监控参数

  • 可用性标签提供了过去24小时或30天的可用性历史记录。
  • 性能选项卡提供了过去24小时或30天的健康状态和事件。
  • 列表视图使您可以执行 批量管理配置

点击列出的各个监视器以查看以下信息。

参数 描述
System Load 指定系统在1/5/15分钟内的峰值和当前值以及当前状态所处理的作业数。
Disk Utilization 指定系统使用的硬盘空间,并使用磁盘分区参数的峰值和当前值以及当前状态进行更新。(该参数包括Windows的C,D,E,F驱动器,Linux中的/home等)
Memory Utilization
  • 交换内存使用率:指定系统使用的交换空间或虚拟内存,以及峰值和当前值以及参数的当前状态。
  • 物理内存利用率:指定系统使用的物理内存量,包括峰值和当前值以及参数的当前状态。
Disk I/O Stats 指定每个设备的每秒读/写,每秒传输。
CPU Utilization 指定系统使用的总CPU及其峰值和当前值以及当前状态。

 

注意:提供的选项可忽略对服务器中特定磁盘驱动器的监控。在<AppManager home/comf中打开<AMServer.properties>文件,然后将不想监控的驱动器添加到<am.disks.ignore>。例如

#将不会在服务器监视器中监控以下字符开头的驱动器。
am.disks.ignore = C:

在此,不会监控C:驱动器。同样,您可以添加其他以逗号分隔的磁盘(C; D:/ home)

The following table briefs the parameters monitored & the mode of monitoring ( - yes).

 
注意:如果以Telnet和SSH模式添加服务器监视器,则可以通过点击今天的可用性饼图下方的在此服务器上执行命令链接来选择直接访问Telnet客户端。默认情况下禁用此选项。

要启用它,需要授予管理员或操作员使用此telnet客户端的权限。可以从管理选项卡->用户管理->权限链接中授予权限

 

操作系统

Telnet SSH SNMP WMI
Windows     (仅当Windows计算机上安装了Applications Manager时)
Linux  
Solaris  
HP-UX/Tru64 Unix    
FreeBSD  
Mac OS  
IBM AIX    
Novell      
属性        
CPU Utilization (all types except Windows NT)
Disk Utilization (all types)
Physical Memory Utilization (IBM AIX -only for the root user, Windows - WMI mode, all other types)
Swap Memory Utilization (IBM AIX - only for the root user, FreeBSD, Linux, Solaris, Windows, Novell)
Network Interface (all types)     available available[状态属性数据不可用]
Process Monitoring (all types)
Process Monitoring - Memory Utilization (all types)
Process Monitoring - CPU Utilization (IBM AIX - FreeBSD, Linux, Mac OS, Solaris, HP Unix/Tru64)  
Service Monitoring (only for Windows )      
Event log (only for Windows )      
System Load ( IBM AIX, FreeBSD, Linux, Mac OS, HP-Unix, Solaris, Novell )  
Disk I/O Stats (only for IBM AIX, Linux, Solaris, Novell)    
Hardware monitoring ( Dell & HP)      
Server Uptime ( IBM AIX, FreeBSD, Linux, Mac OS, HP-Unix, Solaris, Novell, Windows )
Firewall monitoring ( Only for Windows )      
注意:要了解有关发现主机资源时所需的配置详细信息的更多信息,请点击 此处

不支持AIX的磁盘平均I/O统计信息中的队列长度

在选择监控服务器的模式时,建议使用 Telnet/SSH。

AIX服务器中的页面空间:

要获得有关AIX服务器中页面空间的详细信息,可以使用以下命令lsps -a

命令lspa -a原样列出调页空间逻辑卷的位置。

通常,当系统中运行的进程使用了​​整个分配的内存并且用完了内存空间时,将使用页面空间。然后,它使用系统中的页面空间将正在运行的进程当前未引用的代码/数据段移动到页面空间区域,以便当再次由代码库再次引用时,可以将其移回主存储器。当前正在运行的进程。

尝试监控AIX服务器时,如果页面空间显示没有可用数据,则可以按照以下步骤进行故障排除:

首先,您只需要通过TELNETSSH模式建立连接。

其次,检查命令lsps -a是否存在于系统中,然后执行它。

注意:平均不支持AIX的磁盘I/O统计信息中的队列长度

显示分页空间特征

lsps命令显示调页空间的特征,例如调页空间名称,物理卷名称,卷组名称,大小,已使用的调页空间的百分比,活动的空间还是非活动的空间以及是否设置了调页空间自动。调页空间参数指定要显示其特征的调页空间。

以下示例显示了使用带有各种标志的lsps命令来获取调页空间信息。-c标志将以冒号格式显示信息,并在物理分区中显示调页空间大小。

# lsps -a

页面空间 物理卷 卷组 大小 %已用 活跃的 自动 类型
paging00 hdisk1 rootvg 80MB 1 yes yes lv
hd6 hdisk1 rootvg 256MB 1 yes yes lv

添加和激活分页空间

要使调页空间可用于操作系统,必须添加调页空间,然后使其可用。系统可用于调页的总空间是所有活动调页空间逻辑卷大小的总和。

注意:不应将调页空间添加到便携式磁盘上的卷组,因为删除包含活动调页空间的磁盘将导致系统崩溃。

您可以在此处获取有关命令的更多详细信息: https://www.ibm.com/support/knowledgecenter/en/ssw_aix_72/devicemanagement/pscpag_space_config.html

除上述参数外,您还可以监控以下内容:

监控服务器中的进程

  1. 在服务器监视器页面的进程详细信息下,点击添加新进程。
  2. 将显示所有正在运行的进程以及CPU和内存利用率统计信息。(仅显示Windows和SNMP监控模式的内存统计信息)
  3. 选择您要监控的进程。

配置进程后,它们将在服务器监视器页面的进程详细信息部分下列出。通过点击该过程,可以查看其可用性图。您还可以为特定进程配置告警。

您可以通过点击编辑进程图标来编辑特定进程的显示名称,进程名称,命令和参数。

监控Windows服务

  1. 在 Windows监视器页面的服务详细信息下,点击添加新服务。
  2. 将显示所有正在运行的服务以及服务名称和状态。
  3. 选择您要监控的服务。

配置服务后,它们将列在Windows监视器页面的服务详细信息部分下。通过点击服务,您可以查看其可用性图。您还可以为特定服务的可用性配置告警。

除了监控服务的可用性之外,您还可以使用startstoprestart选项来管理服务。服务关闭时,您可以配置操作重新启动服务以及其他操作。

注意:Windows Services监控只能在WMI监控模式下进行

监控网络接口

在服务器监视器页面的网络接口下,将列出所有网络接口。可以监控的各种属性是:

  • 接口流量-输入流量(接收的位),输出流量(发送的位)。您可以为这些属性设置告警阈值。
  • 接口利用率-输入利用率%,输出利用率%。您可以为这些属性设置告警阈值。
  • 收到的数据-每秒收到的数据包
  • 传输的数据-每秒传输的数据包
  • 错误数据包-接收到数据包后每秒错误的数据包数
  • 丢弃的报文-收到报文后每秒丢弃的报文数
  • 健康状况-接口的基于属性的健康状况
  • 状态-接口是打开还是关闭(仅在SNMP监控模式下显示)
注意:仅在SNMPWMI监控模式下才可以进行网络接口监控

将脚本和URL关联到主机资源

通过将脚本或URL与主机资源相关联,它们的属性成为主机的其他属性之一,并且其数据也显示在主机详细信息本身下。主机资源的健康状况也取决于脚本和URL的健康状况。

例如,如果您希望监控ASP.NET应用程序的RequestExecutionTime,RequestsCurrent,RequestsDisconnected,则可以使用WMI脚本获取统计信息(使用Applications Manager时此信息不可用)。您可以编写自己的脚本来获取这些详细信息,然后将该脚本配置到Applications Manager。在将此脚本配置到Applications Manager之后,您可以将此脚本关联到主机监视器本身。然后,脚本的属性将表现为与主机监视器的其他属性一样。因此,您可以通过以下方式进行配置:脚本的健康状况直接影响主机的健康状况。

同样,如果您希望以某种方式监控系统中托管的网站,则只要该网站的健康状况发生变化,服务器的健康状况就应该反映出该变化。在这种情况下,您可以配置URL监视器,然后将该URL与主机关联。因此,如果网站关闭,则主机资源的健康状况会受到影响。

  • 关联/删除脚本:点击主机详细信息中的关联/删除脚本链接。将列出与主机相关联且不与主机相关联的脚本。因此,您可以选择要关联或删除的脚本。
  • 关联/删除URL:点击主机详细信息中的关联/删除URL链接。将列出与主机关联的URL和不与主机关联的URL。因此,您可以选择要关联或删除的URL。

监控模式-SSH / Telnet与SNMP

我们建议使用Telnet或SSH模式进行监控,因为以下属性无法通过SNMP使用:

  • 磁盘I/O统计信息
  • 进程监控-CPU利用率
  • 交换内存利用率

请检查此链接以获取更多详细信息。

系统管理员通常更喜欢使用命令检查系统资源,并且更喜欢将其与SSH / telnet模式输出进行比较,而不是运行SNMP walk进行比较。另外,通过SSH与Linux机器建立连接将使您更容易为脚本监视器或执行程序操作(如果需要)进行配置。

用于服务器监控的命令

这是Applications Manager针对Windows,Linux和Unix服务器使用的命令列表:

Windows:

参数 命令
Disk Utilization disk.vbs
Win Physical Disk Stats "diskio.vbs"
Network Interface "NetworkInterface.vbs"
Network Adapter "NetworkAdapter.vbs"
Memory Utilization "memory.vbs"
CPU Utilization "cpu.vbs"
CPU Core Utilization "cpucore.vbs"
Services "services.vbs"
Process "PhyMemCpuImportProduct.vbs"
Server Uptime "uptime.vbs"

Linux:

参数 命令
Memory Utilization "free -b"
System reboot "date +%s;/bin/cat /proc/uptime | cut -d &#34;.&#34; -f1"
ThreadCount "ps -eo nlwp | awk '{ threadcount += $1 } END { print threadcount }'"
Disk Utilization "/bin/df -Pm |awk '{print $(NF-3) &quot; &quot; $(NF-2) &quot; &quot; $(NF-1) &quot; &quot; $NF}'"
Disk IO Stats "LANG=C iostat -d;echo '-----DISK_EXTENDED_STATS-----';iostat -d -x 1 3"
System Load "uptime"
CPU Utilization "/usr/bin/vmstat 1 3"
CPU Core Utilization "mpstat -P ALL 1 3"
Server Uptime "uptime|cut -d ',' -f1,2|tr -s ' ' '^'|cut -d '^' -f 2-"

Unix:

参数 命令
Memory Utilization "export UNIX95;top -d 1 -n 2"
Disk Utilization "/bin/df -m"
System Load "uptime"
CPU Utilization "/usr/bin/vmstat 1 3"
CPU Core Utilization "/usr/bin/vmstat -n 0 -P 1 3"
Server Uptime "uptime|cut -d ',' -f1,2|tr -s ' ' '^'|cut -d '^' -f 2-"

 

注意:
1.)对于以管理员身份执行Windows Open命令提示符,请在App Manager主页/ working / conf / Applications / scripts目录下执行命令,并以以下格式执行cscript命令主机名域\用户名密码
将命令分别替换为上面指定的命令,将主机名替换为服务器的实际主机名,并将用户名和密码替换为凭证。

2.)同样,仅Windows 2008和Windows 2000的CPU利用率命令分别更改为 cpu_2008.vbs和 cpu_2000.vbs