监控PAM360的高可用性

    注意:目前PAM360 仅支持后台是PostgreSQL 数据库的高可用性监控,后台数据库采用MSSQL的高可用性监控将在后续版本中支持。

概述

对于关键的服务,一个主要的需求就是对密码的持续访问。PAM360提供的“高可用性”就是来满足这个需求的。 通常,高可用性 (HA) 是指如果主服务器发生故障,让备用服务器接管服务的操作。 PAM360 支持监控服务器的可用性以预测故障,从而避免停机。

主题:

1.为什么需要监控高可用性?

2.高可用性工作原理?

3.高可用性架构

4.审计记录会丢失吗?

5.如何同步主服务器和备用服务器?

6.监控PostgreSQL数据库服务器的高可用性

6.1监控PostgreSQL数据库服务器高可用性的步骤
6.2PostgreSQL 数据库服务器的高可用性控制台
6.3界面图标和说明
6.4服务器/数据库的状态(活动/非活动)对高可用性的影响
6.5状态故障的警报机制
6.6在高可用控制台修改服务器详细信息
6.7 在高可用性失效的情况下该怎么办?

1.为什么需要监控高可用性?

持续监控端口和相关数据库操作可确保及早发现问题并找解决方法,提高用户满意度。 此外,监控可以捕获系统指标,用于分析服务器性能趋势以及反复出现的问题。 就数据库服务器而言,可靠的监控系统对于衡量可用性而言至关重要,它会检测威胁到数据库服务器可用性的事件,并立即将重大故障通知到相关方。 将捕获到的问题数据通过告警发送给管理员, 确保应用的高可访问和稳定性是监控的最根本目的。

2.PAM360的高可用性工作原理?

每当主服务器发生故障或宕机时,备用服务器将接管主服务器。 PAM360 中的 HA 设置需提供备用服务器,该服务器可用于在主数据库发生灾难时从 PAM360 存储库检索密码,直到主服务器恢复服务。它主要有以下内容:

  • 冗余的 PAM360 服务器和数据库实例。
  • 一个实例将是主实例,为用户提供读/写访问。 所有用户将仅与主服务器连接。
  • 另一个实例将充当备用实例。
  • 主实例和备用实例将始终彼此同步。 数据复制通过安全、加密的通道进行。
  • 当主服务器宕机时,备用服务器将为用户提供紧急访问,直到功能齐全的主服务器恢复服务。 此间在备用服务器上对数据库进行的更改(如果有)将在连接恢复时自动同步到主服务器数据库。

3.PAM360 中的高可用性架构

PAM360 中的 HA 架构设计为与两种不同的方案兼容。有关详细说明,请参阅下表:

场景 1

主和备用服务器在同一网络上

在这种情况下,备用服务器位于主服务器运行的同一网络上。 备用服务器提供读/写访问(密码重置操作除外),以防主服务器发生故障。

例如

主和备用服务器同一网络中&备用服务器挂了:

假设主服务器和备用服务器部署的地理位置相同,比如"A"。 在主服务器崩溃或出故障时,主服务器和备用服务器的用户都将从备用服务器获得对密码的紧急访问。

场景 2

主和备用服务器在不同网络中

在这种情况下,主服务器和备用服务器位于不同的网络上。 远程网络中的备用服务器在 WAN 链路故障或主服务器故障时获得读/写访问(密码重置操作除外)。

例如

主和备用服务器位于不同地理位置& WAN故障发生在两个位置之间

假设主服务器位于地理位置"A",备用服务器部署在另一个位置"B"。 默认情况下,"A"和"B"中的用户都将连接到主计算机,并将执行常规密码管理活动。 主数据库和备用数据彼此同步。 现在,想象一下,两个位置之间会发生网络连接丢失。 在这种情况下,两台服务器将开始独立运行。 因此,位置"A"中的用户将保持与主服务器的连接,并将照常执行其操作。 另一方面,位置"B"中的用户将从备用服务器获得对密码的紧急访问。 一旦在"A"和"B"之间重新建立连接,两个位置中的数据都将同步。


4.审计跟踪会发生什么?

在上述高可用性方案中,审计跟踪将照常记录。 在场景2中,只要两个位置之间有网络连接,审计跟踪就会由主服务器记录。 当用户连接到备用服务器时,它将记录"密码检索"、"登录"和"注销"等操作。 当两个位置恢复网络连接时,审计数据将进行同步。 在场景1中,当主数据库崩溃时,将审计备用服务器中的用户完成的"密码检索","登录"和"注销"动作。 其他审计记录也在待机状态同步

5.同步主服务器和备用服务器

备用服务器要接管发生故障的主服务器的操作,它必须准确保存相同的数据,并且执行数据库处理的方式与主服务器正常工作状态相同。 因此,同步意味着持续更新备用服务器数据库,即便它是主数据库服务器的精确副本。

PAM360 的 HA 功能经过精心设计,使两个服务器中的数据始终同步。 如果发生备用服务器故障或链路故障,一个数据库中所做的更改将在服务/连接恢复时自动与另一个数据库同步。 此外,在此类故障期间,在备用服务器中执行的操作将照常审计,并在恢复时自动同步。 数据复制通过安全、加密的通道进行。

6.监控 PostgreSQL 数据库服务器的高可用性

PAM360 内置 HA 管理和监控功能,具有多种通知选项,按照以下步骤使用 PAM360 监控和管理 PostgreSQL 数据库服务器的 HA:

6.1 监控 PostgreSQL 数据库服务器高可用性的步骤
  1. 在开始监控 HA 之前,您需要首先在 PostgreSQL 中运行的服务器中设置 HA
  2. 设置 HA 后,可以从 PAM360 控制台开始监控 PostgreSQL HA 设置:
    导航到管理 >> 配置 >> 主服务器或备用服务器的高可用性,会看到HA控制台。
6.2 PostgreSQL 数据库服务器的高可用性控制台

PAM360 中的 HA 控制台是一个一体式仪表板样式的窗口,用于监控主服务器和备用服务器以及相关数据库的可用性。 控制台允许您将视图从主服务器切换到备用服务器,反之亦然。

使用 HA 控制台:

  • 查看包含 HA 状态及其配置的 HA 摘要。
  • 查看服务器和相关数据库的状态。
  • 查看复制挂起计数。
  • 查看连接丢失和连接恢复时间。
  • 修改服务器详细信息。

控制台的视图基于您是否配置了 HA:

  1. 如果您尚未配置 HA您将看到一个空控制台,其消息如下图所示。 您需要先 设置高可用性来监控它。

    当 HA 未配置 PostgreSQL 时查看控制台

High Availability Console without HA configured -PostgreSQL

  1. 如果已正确配置了 HA 设置:您将看到控制台的可用性和主服务器和备用服务器的其他详细信息,如下图所示:
    使用 PostgreSQL 配置 HA 时控制台视图
High Availability Console with HA configured -PostgreSQL

6.3 界面图标和说明

PAM360 HA 监控控制台包括各种元素,每个元素对应于特定细节,如下所述:

Sl 编号 UI元素/图标 状态 定义

1

活动


此图标闪烁表示 HA 在主备服务器上运行正常。

2

非活动



此图标闪烁表示HA当前工作不正常。

3

成功



此图标表示 HA 在您的服务器中已成功配置,如果 HA 配置失败,将显示此界面

4

-



此图标表示主服务器。

5

-


此图标表示备用服务器。

6

配置详细信息

-


这是一个表,列出了主服务器和备用服务器的以下详细信息:服务器名称、服务器端口和操作。 您可以 从这里修改备用服务器详细信息。 (请注意,您无法编辑主服务器详细信息)

7

主/备用服务器


此图标表示主/备用服务器已启动并运行。


此图标表示主/备用服务器已关闭并停止运行。

8

主/备用服务器 PostgreSQL


此图标表示主/备用服务器的 PostgreSQL 数据库已启动并运行。


此图标表示主/备用服务器的 PostgreSQL 数据库已关闭并停止运行。

9

复制挂起计数

-


这表示挂起的复制总数。 如果此值为零,则意味着没有挂起的复制,并且主服务器和备用服务器彼此持续同步。

10

连接丢失时间

-


这表示主服务器和备用服务器之间的连接丢失的时间。

11

连接恢复时间

-


这表示恢复主服务器和备用服务器之间连接的时间。

6.4 对高可用性的服务器/数据库状态(活动/非活动)的响应

HA 的基本概念是主服务器和备用服务器之间不断复制数据,其中主服务器充当"主服务器",备用服务器充当"备服务器"。 "状态"对应于主服务器和备用服务器/数据库之间的连接/通信条件。 有两种类型的 HA 状态:

1.活动 - 指示主服务器和备用服务器之间的完美数据复制和数据同步。

2.非活动 - 指示主服务器和备用服务器之间的连接中断。 中断可能是由于中断,如服务器之间的网络问题(反过来在数据库之间)。 因此,主服务器和备用服务器的数据库之间将不发生通信,服务器之间的数据复制和数据同步将受到干扰。

重新建立连接后,数据库之间将开始同步。在网络断开期间,那些连接到主和备用系统的人不会面临任何服务中断。

6.5 状态故障的警报机制

由于上述两个条件(活动/非活动)在 HA 设置中具有重要性,因此当状态从"活动"变为"非活动"时,接收实时警报非常重要。 要配置警报,请导航到"审计 >>资源审计 >>配置用户审计 > 一般操作",然后选择事件"高可用性活动"和"高可用性失败"的警报模式(电子邮件/SNMP 陷阱/Syslog 消息)。

    注意:

    1.发布 HA 配置:如果更改主 PAM360 服务器的端口,则高可用性设置将不起作用。 您需要更改并重新配置设置。

    2.如果您配置了TFA :无论何时启用 TFA 或更改 TFA 类型(PhoneFactor 或 RSA SecurID 或一次性密码),如果已配置 HA,则需要重新启动 PAM360 备用服务器一次使之生效。

6.6 修改 HA 控制台的服务器详细信息

单击备用服务器旁边的"操作"图标 ,编辑其详细信息。 在弹出的窗口中根据需要修改详细信息,然后单击更新

6.7 在高可用性故障的情况下该怎么办?

一旦 HA 状态变为"非活动", PAM360 HA 设置也会中断。 如果 HA 发生故障,请采集下述路径下的日志并联系support@manageengine.cn:

<PAM360 Installation Folder>/pgsql/data/pg_log/pgsql_Mon.log

 

© 2021, ZOHO 公司,保留所有权利。

页首