深入了解生产环境中的复杂 Coherence 实现的运行状况和性能,并快速排除故障以避免用户受到影响。
通常,Oracle Coherence 集群具有大量节点和分布式缓存。IT 管理员会发现很难确保 Oracle Coherence 集群的可用性和性能。通过 Applications Manager,您可以快速了解 Coherence 集群的整体运行状况和性能并确定潜在问题。跟踪关键指标,例如,集群大小、脱离节点数、分布式服务数和分区服务数,以及扩展连接数和扩展服务数。
跟踪 Coherence 集群中的分布式的和已复制的缓存服务的运行状况。请查看正在运行的各个服务(哪些已启用存储器,哪些未启用存储器)、某些分区信息(例如,存在危险的分区和存在漏洞的分区)以及发送/接收消息的频率。了解服务的高可用性状态(存在危险、节点安全和机器安全),并了解可在不丢失数据的情况下停止哪些集群成员。可轻松启用、禁用或删除服务,并可在不同服务间比较指标。
针对每个扩展服务跟踪未授权连接尝试次数、活动连接数和每分钟发送/接收的消息数。还可查看有关扩展连接的一些信息,例如,接收/发送的消息数、节点的远程地址等等。
跟踪集群内存详情,包括集群中的所有分布式节点和已复制节点的内存。确保在正确级别进行数据发布,并确保数据包发布方/接收方的高成功率。尽量避免内存不足错误。可用内存不足时接收通知并执行若干步骤来调整内存大小。
在 Coherence 集群出现性能问题(例如,因为用户和数据负载而导致的性能问题)时,收到即时通知。以了解延迟、瓶颈和超时,确定导致负载过高的应用。迅速执行纠正操作以避免终端用户受到影响。
它允许我们跟踪关键指标,如响应时间、资源利用率、错误率和交易性能。实时监控告警会及时通知我们任何问题或异常,使我们能够立即采取行动。
审稿人角色:研究与开发
Lexmark技术支持经理