自我监控


自我监控功能可帮助您检测Applications Manager服务的所有组件中的问题,并确保其健康状况和性能以提供不间断的监控支持。将为您提供有关所发生问题的重要信息,以帮助您深入分析根本原因,从而防止可能的服务中断。

当前,Applications Manager对以下组件的健康状况进行定期检查:

诊断详细信息配置

用户可以如下修改每个属性的轮询间隔,连续轮询计数和阈值:

  • 管理选项卡下,点击工具下的自我监控  。
  • 将显示诊断详细信息表,其中包含诊断说明。
  • 您可以通过点击编辑图标 ()来配置轮询间隔,连续轮询和阈值 。

诊断告警

诊断告警及其当前状态显示在Applications Manager窗口顶部的区域中。您还可以在告警选项卡下查看告警列表-点击诊断告警按钮以查看诊断告警,其状态,生成时间和描述的列表。点击告警消息以查看消息历史记录并添加注释。

  • 只要出现问题并正常/忽略,所有包含ADMIN角色的用户都将收到邮件通知。
  • 当检测到问题时,它以错误状态[红色]显示。
  • 手动或自动采取纠正措施后,错误状态将[自动或手动]移至正常状态[绿色]。

支持的属性列表分类和描述如下:

服务器监控

属性名称 描述
CPU使用率 这将监控Applications Manager服务器的CPU使用率。默认情况下,当排名前10个进程消耗更多的CPU时,如果在过去15分钟内CPU使用率超过阈值90%(轮询间隔5分钟和连续轮询计数3),我们将向用户发出告警。
内存使用情况 这将监控正在运行的APM服务器的内存利用率。默认情况下,当排名前10个进程消耗的内存更多时,在过去15分钟内(内存间隔5分钟和连续轮询计数3)内存使用量超过阈值90%时,我们将向用户发出告警。
磁盘使用情况 这将监控正在运行APM的服务器的磁盘(已安装APM的磁盘)的利用率。默认情况下,当磁盘使用率在最近60分钟内超过阈值90%(轮询间隔60分钟和连续轮询计数1)时,我们将向用户发出告警。
磁盘I/O使用情况 这将监控物理磁盘(安装了APM的磁盘)的磁盘繁忙时间。默认情况下,当磁盘繁忙时间在最近15分钟内超过阈值90%(轮询间隔5分钟和连续轮询计数3)时,我们将向用户发出告警。

数据库监控(当前仅支持MSSQL)

属性名称 描述
数据库状态 这将监控数据库连接。
  • 对于数据库连接,由于数据库连接本身丢失,因此无法发出告警。诊断消息将出现在日志(/logs/diagnostics/selfdiagnostics.txt)中。
  • 该属性将不会显示在诊断配置详细信息页面中。
  • 默认设置为,如果数据库关闭2分钟。日志生成实体。
数据库文件大小 这将监控数据库文件的大小。默认情况下,如果文件大小超过总大小的90%,则会发出告警。
数据库日志大小 这将监控数据库

注意:如果在MSSQL v12及更高版本中,数据库文件和日志的总大小是无限的,则会考虑数据库安装磁盘的总大小,如果已使用的磁盘大小超过阈值(默认为90%),则会发出告警。

JVM监控

属性名称 描述
JVM内存使用情况 这将监控JVM内存使用情况。默认情况下,当JVM内存使用率在最近15分钟内超过阈值90%(轮询间隔为5分钟且连续轮询计数为3)时,我们将向用户发出告警。
JVM线程被阻止 这将监控 JVM线程已阻止详细信息。默认情况下,当JVM线程块在最近15分钟内超过阈值50%(轮询间隔为5分钟,并且连续轮询计数为3)时,我们将向用户发出告警。

特定负载的性能属性

属性名称 描述
轮询延迟 这基于负载系数计算。我们将使用排名前50个服务器监视器,这将花费更多时间进行数据收集,然后根据轮询间隔找到最近1小时的轮询值。如果该轮询的值小于70%,则我们警告该特定监视器的轮询间隔存在一些延迟。持续1小时后,就会发生这种情况。
轮询停止 当特定监视器在过去1小时内停止轮询时,这将发出告警。持续1小时后,将进行此检查。
同步延迟 默认情况下,当特定被管服务器在过去30分钟内未同步数据时,我们将在中心服务器中发出告警。

diagnosticconfig.properties - 此属性文件用于在AM_DIAGNOSTICS_CONF表中添加诊断条目。