监控PAM360的高可用性
注意:目前PAM360 仅支持后台是PostgreSQL 数据库的高可用性监控,后台数据库采用MSSQL的高可用性监控将在后续版本中支持。
概述
对于关键的服务,一个主要的需求就是对密码的持续访问。PAM360提供的“高可用性”就是来满足这个需求的。 通常,高可用性 (HA) 是指如果主服务器发生故障,让备用服务器接管服务的操作。 PAM360 支持监控服务器的可用性以预测故障,从而避免停机。
主题:
3.高可用性架构
6.1监控PostgreSQL数据库服务器高可用性的步骤
6.2PostgreSQL 数据库服务器的高可用性控制台
6.3界面图标和说明
6.4服务器/数据库的状态(活动/非活动)对高可用性的影响
6.5状态故障的警报机制
6.6在高可用控制台修改服务器详细信息
6.7 在高可用性失效的情况下该怎么办?
1.为什么需要监控高可用性?
持续监控端口和相关数据库操作可确保及早发现问题并找解决方法,提高用户满意度。 此外,监控可以捕获系统指标,用于分析服务器性能趋势以及反复出现的问题。 就数据库服务器而言,可靠的监控系统对于衡量可用性而言至关重要,它会检测威胁到数据库服务器可用性的事件,并立即将重大故障通知到相关方。 将捕获到的问题数据通过告警发送给管理员, 确保应用的高可访问和稳定性是监控的最根本目的。
2.PAM360的高可用性工作原理?
每当主服务器发生故障或宕机时,备用服务器将接管主服务器。 PAM360 中的 HA 设置需提供备用服务器,该服务器可用于在主数据库发生灾难时从 PAM360 存储库检索密码,直到主服务器恢复服务。它主要有以下内容:
- 冗余的 PAM360 服务器和数据库实例。
- 一个实例将是主实例,为用户提供读/写访问。 所有用户将仅与主服务器连接。
- 另一个实例将充当备用实例。
- 主实例和备用实例将始终彼此同步。 数据复制通过安全、加密的通道进行。
- 当主服务器宕机时,备用服务器将为用户提供紧急访问,直到功能齐全的主服务器恢复服务。 此间在备用服务器上对数据库进行的更改(如果有)将在连接恢复时自动同步到主服务器数据库。
3.PAM360 中的高可用性架构
PAM360 中的 HA 架构设计为与两种不同的方案兼容。有关详细说明,请参阅下表:
4.审计跟踪会发生什么?
在上述高可用性方案中,审计跟踪将照常记录。 在场景2中,只要两个位置之间有网络连接,审计跟踪就会由主服务器记录。 当用户连接到备用服务器时,它将记录"密码检索"、"登录"和"注销"等操作。 当两个位置恢复网络连接时,审计数据将进行同步。 在场景1中,当主数据库崩溃时,将审计备用服务器中的用户完成的"密码检索","登录"和"注销"动作。 其他审计记录也在待机状态同步
5.同步主服务器和备用服务器
备用服务器要接管发生故障的主服务器的操作,它必须准确保存相同的数据,并且执行数据库处理的方式与主服务器正常工作状态相同。 因此,同步意味着持续更新备用服务器数据库,即便它是主数据库服务器的精确副本。
PAM360 的 HA 功能经过精心设计,使两个服务器中的数据始终同步。 如果发生备用服务器故障或链路故障,一个数据库中所做的更改将在服务/连接恢复时自动与另一个数据库同步。 此外,在此类故障期间,在备用服务器中执行的操作将照常审计,并在恢复时自动同步。 数据复制通过安全、加密的通道进行。
6.监控 PostgreSQL 数据库服务器的高可用性
PAM360 内置 HA 管理和监控功能,具有多种通知选项,按照以下步骤使用 PAM360 监控和管理 PostgreSQL 数据库服务器的 HA:
6.1 监控 PostgreSQL 数据库服务器高可用性的步骤
- 在开始监控 HA 之前,您需要首先在 PostgreSQL 中运行的服务器中设置 HA。
- 设置 HA 后,可以从 PAM360 控制台开始监控 PostgreSQL HA 设置:
导航到管理 >> 配置 >> 主服务器或备用服务器的高可用性,会看到HA控制台。
6.2 PostgreSQL 数据库服务器的高可用性控制台
PAM360 中的 HA 控制台是一个一体式仪表板样式的窗口,用于监控主服务器和备用服务器以及相关数据库的可用性。 控制台允许您将视图从主服务器切换到备用服务器,反之亦然。
使用 HA 控制台:
- 查看包含 HA 状态及其配置的 HA 摘要。
- 查看服务器和相关数据库的状态。
- 查看复制挂起计数。
- 查看连接丢失和连接恢复时间。
- 修改服务器详细信息。
控制台的视图基于您是否配置了 HA:
- 如果您尚未配置 HA:您将看到一个空控制台,其消息如下图所示。 您需要先 设置高可用性来监控它。
当 HA 未配置 PostgreSQL 时查看控制台
- 如果已正确配置了 HA 设置:您将看到控制台的可用性和主服务器和备用服务器的其他详细信息,如下图所示:
使用 PostgreSQL 配置 HA 时控制台视图
6.3 界面图标和说明
PAM360 HA 监控控制台包括各种元素,每个元素对应于特定细节,如下所述:
Sl 编号: | UI元素/图标 | 状态 | 定义 |
---|---|---|---|
1 |
活动 |
此图标闪烁表示 HA 在主备服务器上运行正常。 |
|
2 |
非活动 |
此图标闪烁表示HA当前工作不正常。 |
|
3 |
成功 |
此图标表示 HA 在您的服务器中已成功配置,如果 HA 配置失败,将显示此界面。 |
|
4 |
|
此图标表示主服务器。 |
|
5 |
|
此图标表示备用服务器。 |
|
6 |
配置详细信息 |
|
这是一个表,列出了主服务器和备用服务器的以下详细信息:服务器名称、服务器端口和操作。 您可以 从这里修改备用服务器详细信息。 (请注意,您无法编辑主服务器详细信息) |
7 |
主/备用服务器 |
此图标表示主/备用服务器已启动并运行。 |
|
此图标表示主/备用服务器已关闭并停止运行。 |
|||
8 |
主/备用服务器 PostgreSQL |
此图标表示主/备用服务器的 PostgreSQL 数据库已启动并运行。 |
|
此图标表示主/备用服务器的 PostgreSQL 数据库已关闭并停止运行。 |
|||
9 |
复制挂起计数 |
|
这表示挂起的复制总数。 如果此值为零,则意味着没有挂起的复制,并且主服务器和备用服务器彼此持续同步。 |
10 |
连接丢失时间 |
|
这表示主服务器和备用服务器之间的连接丢失的时间。 |
11 |
连接恢复时间 |
|
这表示恢复主服务器和备用服务器之间连接的时间。 |
6.4 对高可用性的服务器/数据库状态(活动/非活动)的响应
HA 的基本概念是主服务器和备用服务器之间不断复制数据,其中主服务器充当"主服务器",备用服务器充当"备服务器"。 "状态"对应于主服务器和备用服务器/数据库之间的连接/通信条件。 有两种类型的 HA 状态:
1.活动 - 指示主服务器和备用服务器之间的完美数据复制和数据同步。
2.非活动 - 指示主服务器和备用服务器之间的连接中断。 中断可能是由于中断,如服务器之间的网络问题(反过来在数据库之间)。 因此,主服务器和备用服务器的数据库之间将不发生通信,服务器之间的数据复制和数据同步将受到干扰。
重新建立连接后,数据库之间将开始同步。在网络断开期间,那些连接到主和备用系统的人不会面临任何服务中断。
6.5 状态故障的警报机制
由于上述两个条件(活动/非活动)在 HA 设置中具有重要性,因此当状态从"活动"变为"非活动"时,接收实时警报非常重要。 要配置警报,请导航到"审计 >>资源审计 >>配置用户审计 > 一般操作",然后选择事件"高可用性活动"和"高可用性失败"的警报模式(电子邮件/SNMP 陷阱/Syslog 消息)。
注意:
1.发布 HA 配置:如果更改主 PAM360 服务器的端口,则高可用性设置将不起作用。 您需要更改并重新配置设置。
2.如果您配置了TFA :无论何时启用 TFA 或更改 TFA 类型(PhoneFactor 或 RSA SecurID 或一次性密码),如果已配置 HA,则需要重新启动 PAM360 备用服务器一次使之生效。
6.6 修改 HA 控制台的服务器详细信息
单击备用服务器旁边的"操作"图标 ,编辑其详细信息。 在弹出的窗口中根据需要修改详细信息,然后单击更新。
6.7 在高可用性故障的情况下该怎么办?
一旦 HA 状态变为"非活动", PAM360 HA 设置也会中断。 如果 HA 发生故障,请采集下述路径下的日志并联系support@manageengine.cn:
<PAM360 Installation Folder>/pgsql/data/pg_log/pgsql_Mon.log