Amazon RDS监控


Amazon RDS - 概览

Amazon Relational Database Service (或者Amazon RDS)是由AmazonWebServices(AWS)提供的分布式关系数据库服务。它是 "在云中" 运行的Web服务,为了简化用于应用程序的关系数据库的设置、操作和缩放。Amazon RDS支持一系列数据库引擎来存储和组织数据,并帮助执行数据库管理任务,如迁移、备份、恢复和修补。

Amazon RDS可以在几种数据库实例类型上使用-优化内存、性能或I/O-并为您提供六个熟悉的数据库引擎供选择,包括Amazon Aurora、PostgreSQL、MySQL、Maria数据库、Oracle数据库和SQL服务器。

创建一个新的Amazon RDS监视器

设置Amazon监控的先决条件:点击此处

使用REST API添加一个新的Amazon RDS监视器:点击此处

要创建一个新的Amazon RDS监视器,请遵循下面给出的步骤:

  1. 点击新监视器 的链接。
  2. Cloud Apps 类别下选择Amazon
  3. 指定Amazon服务器的显示名称
  4. Amazon服务下拉菜单中选择RDS
  5. 输入AWS的访问密钥Id,以便通过API访问AWS。访问密钥有20个字母数字字符。
  6. 输入AWS的秘密访问密钥。秘钥应该是40个字母数字字符长。
  7. 选择帐户类型。添加新的Amazon监视器时的默认帐户类型AWS全局。选择AWS China 作为帐户类型 来监控AWS中国地区的服务。
  8. 以分钟为单位指定轮询间隔
  9. 如果您正在从管理服务器添加新的监视器,请选择管理服务器。
  10. 从组合框(可选)中选择要与Amazon监视器关联的业务组。您可以选择多个组来关联您的监视器。
  11. 点击添加监视器。这会开始从网络中发现Amazon服务器并开始监控它。

Applications Manager自动发现所有EC2和RDS实例,以及Amazon帐户下的S3 buckets。您可以根据您的需求启用对这些实例和buckets的监控。

监控的参数

Amazon RDS实例是根据下面列出的参数或属性来监控的。这些属性提供有关RDS实例的功能信息。您还可以根据这些细节将阈值配置为数字,并在违反阈值时得到通知。

点击监视器选项卡,到监视器类别视图。点击Cloud Apps 表下的Amazon监视器RDS实例。显示的是分布在三个选项卡中的Amazon RDS批量配置视图:

  • 可用性选项卡 显示过去24小时或30天的RDS实例的可用性历史。
  • 性能选项卡显示RDS实例的健康状态和关键性能指标,如CPU利用率、空闲存储空间、数据库连接和写入吞吐量以及过去24小时或30天这些属性的热图表。
  • 列表视图显示Amazon帐户中存在的所有RDS实例,以及它们的可用性和健康状态的总体情况。列表视图还允许您执行 批量管理配置

为了便于理解,监控的指标被分为两个选项卡。下面是对这两种选项卡显示指标的解释:

注意:* 标记的指标是使用Amazon的Cloudwatch收集的

监视器信息

参数 描述
监视器信息
Name RDS实例的名称。
Region 当前RDS实例正在运行的AWS区域的ID。
Region Name RDS实例正在运行的区域名称。
Instance Type 表明实例的类型
Created Time 创建实例的时间。
State 实例当前的状态。值包括:
  • running
  • stopped
  • shutdown
  • terminated
DB Engine Name 与此实例关联的数据库引擎的名称
Last Polled at 指定执行上一次轮询的时间。
Next Poll at 指定执行下一次轮询的预计时间。
Associated Groups 与监视器相关联的组。

概览

此选项卡提供了RDS实例及其资源利用率的高级概述。

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
CPU Utilization(%) * CPU利用率的百分比。
Database Connections * 使用中的数据库连接数。
Free Memory(GB)  
Free Storage Space(%) * 可用存储空间的数量。
Free Local Storage(GB) 在Aurora实例上空余的本地存储量。
Swap Usage(MB) 数据库实例上使用的交换空间数量。

磁盘 I/O

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
Read Latency(Seconds) * 每个磁盘读取I/O操作所需的平均时间(以秒为单位)。
Read Ops(Ops/Sec) * 每秒磁盘读取I/O操作的平均数量。
Read Throughput(Bytes/Sec) * 每秒从磁盘读取的平均字节数。
Write Latency(Seconds) * 每个磁盘写入I/O操作所需的平均时间。
Write Ops(Ops/Sec)* 每秒磁盘写入I/O操作的平均数量。
Write Throughput(Bytes/Sec) * 每秒写入磁盘的平均字节数。
Used Volume(GB) Aurora数据库使用的字节存储量。
Volume Read IOPs(Ops/Sec) 从集群卷读取I/O操作的计费次数,每隔5分钟报告一次。
Volume Write IOPs(Ops/Sec) 写入磁盘I/O操作到集群卷的平均次数,每隔5分钟报告一次。

网络

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
Incoming traffic(kB/s) 数据库实例上的传入(接收)网络流量。
Outgoing traffic(kB/s) 数据库实例上的传出(传输)网络流量。

Aurora数据库

Amazon Aurora是来自Amazon Web Services的关系数据库引擎,作为Amazon关系数据库服务(RDS)的一部分提供。Amazon Aurora是My SQL和Postgre SQL兼容并为云构建的,它以开源数据库简单的提供了安全性、可用性和可靠性。

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
Active Transactions 在数据库实例上执行当前事务的平均速率。
Blocked Transactions 数据库中被阻塞事务的平均速率。
Bin Logs Disk Usage(MB) 主机二进制日志占用磁盘空间的数量。
Transaction Logs Disk Usage(MB) 事务日志占用磁盘空间的数量。
Buffer Cache Hit Ratio(%) 缓冲区缓存服务的请求百分比。
ResultSet Cache Hit Ratio(%) 由Resultset缓存服务请求的百分比。
Deadlocks 数据库中每秒的平均死锁数。
Aurora ReplicaLag(ms) 从主实例复制更新时的平均滞后。这个指标将只为Aurora集群 'Reader' 填充,类似地'ReplicaLag最小值和最大值'将只为Aurora集群'Writer'角色实例填充。
ReplicaLag Maximum(ms) 主实例和数据库集群中每个Aurora实例之间的最大滞后量。
ReplicaLag Minimum(ms) 主实例和数据库集群中每个Aurora实例之间的最小滞后量。

注意:Aurora Replica Lag指标将只为Aurora集群 'Reader' 填充。ReplicaLag 最小值/最大值 将只为Aurora集群的 'Writer' 角色实例填充。

数据库操作

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
Commit Latency(ms) 提交事务的延迟量。
Commit Throughput(Ops/Sec) 提交事务的平均比率。
DDL Latency(ms) DDL请求的延迟量(创建/修改/停止)。
DDL Throughput(Ops/Sec) 每秒DDL请求的平均速率。
Delete Latency(ms) 删除查询的平均延迟。
Delete Throughput(Ops/Sec) 删除查询的平均速率。
Insert Latency(ms) 插入查询的延迟量。
Insert Throughput(Ops/Sec) 插入查询的平均速率。
Number of Queries(Queries/sec) 每秒执行查询的平均速率。
Select Latency(ms) 选择查询的平均延迟。
Select Throughput(Ops/Sec) 选择查询的平均速率。
Update Latency(ms) 更新查询的平均延迟。
Update Throughput(Ops/Sec) 更新查询的平均速率。

复制

只有当RDS实例在配置详细信息中包含源DB实例标识符时,才会显示此选项卡。

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
Replication lag 读取副本数据库实例滞后于源数据库实例的时间。应用于MySQL、Maria数据库和PostgreSQL读取副本。
Replication Source 源数据库实例。
Source Region 创建加密读取副本的AWS区域。
Source ARN 源的Amazon源名称。
Replication Status Type  
Replication Status  

配置

此选项卡提供RDS实例的配置详细信息。

指标
描述
支持的引擎
Aurora PgSQL
Aurora MySQL
其他引擎类型
配置详细信息
Instance ID 识别实例的唯一关键。
DBInstance ARN 源数据库实例的Amazon源名称。
DB Engine Name 用于此实例的数据库引擎的名称。
Engine Version 数据库引擎版本。
Created Time 创建实例的时间。
DB Name 创建实例时创建的初始数据库名称。
Master User Name 实例的主用户名。
License Model 数据库实例的许可模型信息。
实例详细信息
Instance Type 实例的类型。
Storage Type 要与数据库实例关联的存储类型。
Allocated Storage (GB) 最初分配给此实例的存储空间,GB为单位。
Storage Encrypted 指定数据库实例的加密状态。
State 实例的当前状态。有效值包括可用的、备份、创建、删除的、删除、失败的、修改、重新启动和重置-主-凭证。
Multi(A-Z) Deployment 指明这是否是多AZ数据库实例。
Region Name 当前Dynamo数据库表所在的AWS区域的名称。
安全与网络
Availability Zone 实例的可用性区域。
Publicly Accessible 指定数据库实例是否被标记为可公开访问的。
Endpoint Address 数据库实例的DNS地址。
Endpoint Port 用于连接数据库实例的端口。
维护详细信息
Preferred Maintenance Window 将执行修补和实例修改的期间。
Latest Restorable Time 使用点内恢复可以恢复数据库的最新时间。
Backup Retention Period 删除前保留自动备份的天数。
Preferred Backup Window 创建自动备份的日常时间。
集群配置
Aurora Cluster Name RDS实例所属的Aurora集群的名称。
Cluster ARN 数据库集群的Amazon源名称(ARN)。
Cluster Endpoint Aurora 数据库集群的端点连接到该数据库集群的当前主数据库实例。
Cluster Reader Endpoint Aurora 数据库集群的端点连接到该DB集群的可用Aurora Replicas之一。
Cluster Created Time 创建数据库集群的时间
Cluster Instance Role 与数据库实例关联的角色。[读取者/ 写入者]
Cluster Group status 此数据库集群组的当前状态。