Kubernetes监控用户指南



Kubernetes-概述

Kubernetes(或k8s)是一个开源容器orchestration系统,用于跨主机集群自动部署,扩展和管理应用程序容器。Kubernetes集群可以跨越公共,私有或混合云中的主机。K8sorchestration允许用户跨多个容器构建应用程序服务,跨集群调度这些容器,扩展这些容器,并随时间管理这些容器的健康状况。

监控Kubernetes集群-监控内容

Applications Manager使管理员可以调整监控策略,以解决分布式Kubernetes环境中引入的新基础结构层(采用容器和容器orchestration时)的问题。

  • 自动发现集群中Kubernetes节点,名称空间,部署,副本集,Pod和容器中对象之间的零件并映射关系。
  • 跟踪集群的容量和资源利用率,并能够深入研究集群的特定部分。
  • 确定集群中是否有足够的节点,并且对现有节点的资源分配对于已部署的应用程序而言已足够。
  • 确保集群上的所有节点都健康状况良好-监控Kubernetes节点(工作人员和主节点)的CPU和内存。
  • 确保部署中的所有所需Pod正在运行,而不是在重新启动循环中。
  • 为容器重新启动设置告警,以识别容器或其主机上影响其应用程序性能的问题。
  • 监控集群中运行的Kubernetes托管应用程序的性能异常值,并跟踪任何单个错误。
  • 查看Kubernetes主节点和节点组件的状态-API服务器,Etcd键/值存储区,调度程序和控制器。
  • 监控Pod可能消耗的Persistent Volume存储以及将Pod专有使用权授予存储的Persistent Volume Claim。

添加一个新的Kubernetes监视器

设立Kubernetes监控先决条件:kubectl应安装在安装Kubernetes在机器上。

请按照以下步骤创建一个新的Kubernetes监视器:

  1. 点击 新建监视器 链接。 
  2.  虚拟化 类别下选择 Kubernetes 
  3. 指定 Kubernetes服务器的 显示名称
  4. 输入运行Kubernetes的服务器的集群主机名/ IP地址。 
  5. 输入凭证详细信息(例如用于身份验证的用户名密码),或在启用从凭证列表中选择选项后,从凭证管理列表中选择所需的凭证。
  6. 选中此框以启用 公共密钥身份验证 (仅支持SSH2)和SSH身份验证的SSH密钥。
  7. 指定 命令提示符值,它是命令提示符中的最后一个字符。默认值为$,可能的值为>,#等。
  8. 输入 SSH端口。 使用的默认SSH端口为22。
  9. 以分钟为单位指定 轮询间隔 
  10.  从组合框(可选)中选择要将Kubernetes与之关联的 业务组。您可以选择多个组来关联您的监视器。
  11. 点击 添加监视器。这将从网络中发现Kubernetes并开始对其进行监控。

监控参数

通过点击监视器选项卡,转到监视器类别视图。点击Virtualization表下的Kubernetes。显示的是Kubernetes批量配置视图,分为三个选项卡:

  • 可用性标签提供了过去24小时或30天的可用性历史记录。
  • 性能选项卡提供了过去24小时或30天的健康状况和事件。
  • 列表视图使您可以执行 批量管理配置

从列表中点击监视器后,将转到Kubernetes监视器仪表板。它有五个标签-

概览

参数描述
命名空间的详细信息
Namespace Name 命名空间名称
Resource Version 命名空间的版本号
Namespace Availability 命名空间的可用性
Namespace CreatedTime 命名空间的创建时间
PODS
Used Pods Count 使用的pod数量
Maximum Pods Count 最大Pod数
Used Pods Count per Node 单个节点中的pod数
集群使用细节
Average Cluster CPU Usage 集群使用的平均CPU
Average Cluster Memory Usage 集群使用的平均内存
节点
Master Node Count 主节点数
Worker Node Count 工作节点数
集群详细信息 包含有关集群的详细信息
组件细节 包含有关组件的详细信息

节点

参数描述
节点存储详细信息
Node Memory Limit GiB中节点内存的最大限制
Node Memory Requests 内存请求数
节点CPU细节
Node CPU Limit CPU最大限制
Node CPU Request CPU请求数
节点内存和CPU的详细信息
Name 节点名称
Allocatable Memory(GiB) 可以在GiB中进行调度的节点的CPU资源
Memory Limit(%) 可以使用的最大内存资源限制
Memory Request(%) 内存请求数(%)
Allocatable CPU Processor Count 可用的CPU进程数
CPU Limit(%) 可以使用的最大CPU资源限制
CPU Request(%) CPU请求数(%)
NODE POD的详细信息
Name Pod名称
Pod Usage Details 可用和已拆分的可用荚的可用pod总数。
Kube-system Pod Count Kube状态pod的数量
Non-Kube-system Pod Count 非Kube状态pod的数量
Image Count 节点中的图像数
Used Pod Count Kubernetes中存在的Pod总数
Allocatable Pod Count 可用的Pod数
节点细节
Name 节点名称
OSImage OSImage名称
OS 容器所在的操作系统名称
Architecture 架构细节
Type 节点类型
Kubelet Version 使用的Kubelet版本
Allocatable Ephemeral Storage(GiB) GiB中可用的临时内存大小
Created Time 创建节点的时间

Pods

参数描述
POD细节
Pod Name Pod名称
Pod Namespace Pod所在的命名空间
Pod Node Name Pod节点的名称
Pod Application Pod应用程序的名称。
Pod Type Pod类型。
Pod created 创建Pod的方式。
Pod Running Status Pod的状态。
Pod Start Time Pod的开始时间。
Pod Created Time Pod创建的时间。
POD内存详细信息
Pods Memory Limit 最大内存限制。
Pods Memory Request 内存请求数。
POD内存和CPU的详细信息
Pod Name pod的名称。
Number of Containers 容器运行的容器数。
Pod CPU Limit(%) 可以使用的最大CPU资源限制。
Pod CPU Request (%) Pod的CPU请求数,以%为单位。
Pod Memory Limit(%) 可以使用的最大内存资源限制。
Pod Memory Request(%) 请求的内存数量,以%为单位。
Pod created 创建pod的方式。
Pod Persistent Volumes Claim pod可以通过其访问永久卷的声明的名称。
CONTAINER 详情
Container Name 容器名称。
Container Image 容器镜像的名称。
Container Pod Name 容器的名称。
Container Restart Count 容器重新启动的次数。
Container Running Status 容器的状态。
Container Start Time 容器的开始时间。

服务

参数描述
服务细节
Services Name 服务名称。
Services Namespace 服务所在的命名空间的名称。
Services Application 服务应用程序的名称。
Service Type 服务类型。
Service Protocol 服务协议名称。
Service Target Port 与服务连接的端口名称。
Service Created Time 服务的创建时间。
部署细节
Deployment Name 部署名称。
Deployment Namespace 部署所在的命名空间。
Deployment Replica Count 部署中的副本数。
Deployment Available Replica Count 部署中可用副本的数量。
Deployment Availability 部署的可用性。

持久卷

参数描述
持久的体积细节
PV Name 持久卷的名称。
PV Status 持久卷的状态。
PV Claim 持续批量索赔的名称。
PV Access Mode 您可以通过其访问持久卷的模式。
PV Storage Class 持久卷存储类的名称。
PV Capacity(GiB) GiB中持久卷的容量。
PV Created Time 持久卷的创建时间。
持久性卷详细信息
PVC Name 持续批量索赔的名称。
PVC Namespace 声明所在的名称空间的名称。
PVC Status 持续批量索赔的状态。
PVC Volume 持久性数量声明的数量。
PV Access Mode 您可以通过其访问持久卷的模式。
PV Storage Class 持久卷存储类的名称。
PVC Requests(GiB) GiB中的持续批量声明请求数。
PVC Created Time 持久体积声明的创建时间。