热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Kubernetestroubleshooting常见问题解决思路和方法

文章目录Kubernetestroubleshooting常见问题解决思路和方法前言Kubernetestroubleshooting流程图流程图详解Pod为Pending状态Po


文章目录

  • Kubernetes troubleshooting 常见问题解决思路和方法
    • 前言
    • Kubernetes troubleshooting流程图
    • 流程图详解
      • Pod为Pending状态
      • Pod为ImagePullBackOff状态
      • Pod为CrashLoopBackOff状态
      • Pod没有Ready
      • Pod状态正常,但是通过Service不能访问到Pod
      • 通过Service能访问Pod,但是集群外不能访问Pod
    • Troubleshooting命令小结
    • 参考文档


Kubernetes troubleshooting 常见问题解决思路和方法


前言

本文基于learnk8s的Kubernetes troubleshooting流程图,说明了Kubernetes常见问题解决思路和方法。


Kubernetes troubleshooting流程图

在这里插入图片描述


流程图详解

使用kubens 来切换namespace,让kubectl 命令更加简单。

如果使用OpenShift,直接用oc命令替换下面的kubectl命令。

另外,可以安装jq 命令行工具来方便对Kubernetes jsonpath进行解析。

查看Pod状态:

kubectl get pods

Pod为Pending状态

Pod为Pending状态的可能原因包括:


  • 集群资源不够,无法分配资源给新的Pod。
  • 资源配额限制(ResourceQuota)。
  • 需要通过PVC绑定PV存储资源,但是没有可用的PV。
  • 指定了专门的调度策略,比如要调度到特定节点上,但是不满足调度条件。

先查看Pod events来定位问题原因:

kubectl describe pod <pod-name>

查看Pod被调度到哪个节点上&#xff1a;

kubectl get pods -o wide

查看Pod的labels&#xff1a;

kubectl get pods --show-labels

Pod为ImagePullBackOff状态

Pod为ImagePullBackOff状态的可能原因包括&#xff1a;


  • Image name不正确。
  • Image tag不正确。
  • 如果是从外网拉取镜像&#xff0c;需要检查&#xff1a;
    • 网络是否正常。
    • 否正确配置了代理。
    • 是否将外网镜像仓库加入了白名单。
  • 如果是从私有镜像仓库&#xff08;private image registry&#xff09;&#xff0c;需要检查&#xff1a;
    • 私有镜像仓库的地址是否正确&#xff0c;特别是地址中包含的项目名称是否一致。
    • 私有镜像仓库是否工作正常。
    • 是否因为私有镜像仓库重启导致之前的镜像丢失。
    • 网络是否正常。
    • 用来拉取镜像的账号是否正确&#xff0c;且有权限。

先查看Pod events来定位问题原因&#xff1a;

kubectl describe pod <pod-name>

Pod为CrashLoopBackOff状态

Pod为CrashLoopBackOff状态的可能原因&#xff1a;


  • 程序错误&#xff0c;导致不断重启。
  • Dockerfile中没有配置程序入口。
  • Pod健康检查配置错误&#xff0c;比如配置了错误的健康检查端点或方式。

先查看Pod events来定位问题原因&#xff1a;

kubectl describe pod <pod-name>

查看Pod日志&#xff1a;

kubectl logs <pod-name>

如果容器死的太快来不及查看日志&#xff0c;可以查看上一个容器的日志&#xff1a;

kubectl logs <pod-name> --previous

Pod没有Ready

Pod没有Ready的可能原因包括&#xff1a;


  • 程序错误&#xff0c;没有完全启动成功。
  • Readiness探针配置错误。

先查看Pod events来定位问题原因&#xff1a;

kubectl describe pod <pod-name>

查看Pod日志&#xff1a;

kubectl logs <pod-name>

Pod状态正常&#xff0c;但是通过Service不能访问到Pod

通过Service不能访问到Pod的可能原因包括&#xff1a;


  • Service的.spec.selector和Pod的.metadata.label不匹配。
  • Service的端口和Pod的端口不匹配。

查看Service配置&#xff1a;

kubectl get svc <service-name> -o yaml

查看Service的selector&#xff1a;

kubectl get svc customer -o jsonpath&#61;&#39;{.spec.selector}&#39;# or use jq to format
kubectl get svc customer -o jsonpath&#61;&#39;{.spec.selector}&#39; | jq

查看Service关联的Pod&#xff1a;

# replace service_name as yours
service_name&#61;customer
sel&#61;${$(kubectl get svc $service_name --output&#61;json | jq -j &#39;.spec.selector | to_entries | .[] | "\(.key)&#61;\(.value),"&#39;)%?}
echo $(kubectl get pods --selector&#61;$sel --output&#61;jsonpath&#61;{.items..metadata.name})

查看Pod的labels&#xff1a;

kubectl get pods --show-labels | grep <pod-name-prefix>

通过Service能访问Pod&#xff0c;但是集群外不能访问Pod

如果是Kubernetes&#xff0c;则检查是否正确配置了Ingress。

如果是OpenShift&#xff0c;则检查是否正确配置了Route。

如果使用Service Mesh&#xff0c;还需要检查是否正确配置Ingress Gateway和VirtualService。


Troubleshooting命令小结

命令小结&#xff1a;

# 列出namespaces
kubens# 切换namespace
kubens <ns-name># 列出当前namespace
kubens -c# 查看Pod
kubectl get pods# 查看Pod的labels
kubectl get pods --show-labels# 查看Pod被调度到哪个节点上
kubectl get pods -o wide# 查看Pod配置
kubectl get pod <pod-name> -o yaml# 获取Pod的某个属性
kubectl get pod <pod-name> -o jsonpath&#61;&#39;{.root.parent.sub}&#39; | jq# 查看Pod的Events和详情
kubectl describe pod <pod-name># 查看Pod日志
kubectl logs <pod-name># 查看前一个容器的日志
kubectl logs <pod-name> --previous

搜索指令小结&#xff1a;

# search in stackoverflow
keyword site:stackoverflow.com

在Kubernetes GitHub issues中搜索&#xff1a;


  • https://github.com/kubernetes/kubernetes/issues

参考文档


  • https://kubernetes.io/docs/reference/kubectl/jsonpath/
  • https://kubernetes.io/docs/reference/kubectl/cheatsheet/
  • https://stedolan.github.io/jq/

推荐阅读
  • 本文详细介绍了 Kubernetes 集群管理工具 kubectl 的基本使用方法,涵盖了一系列常用的命令及其应用场景,旨在帮助初学者快速掌握 kubectl 的基本操作。 ... [详细]
  • Kubernetes 持久化存储与数据卷详解
    本文深入探讨 Kubernetes 中持久化存储的使用场景、PV/PVC/StorageClass 的基本操作及其实现原理,旨在帮助读者理解如何高效管理容器化应用的数据持久化需求。 ... [详细]
  • Windows环境下部署Kubernetes Dashboard指南
    本指南详细介绍了如何在Windows系统中部署Kubernetes Dashboard,包括下载最新配置文件、修改服务类型以支持NodePort访问、下载所需镜像并启动Dashboard服务等步骤。 ... [详细]
  • 深入解析 RuntimeClass 及多容器运行时应用
    本文旨在探讨RuntimeClass的起源、功能及其在多容器运行时环境中的实际应用。通过详细的案例分析,帮助读者理解如何在Kubernetes集群中高效管理不同类型的容器运行时。 ... [详细]
  • 在 Kubernetes 中,Pod 的调度通常由集群的自动调度策略决定,这些策略主要关注资源充足性和负载均衡。然而,在某些场景下,用户可能需要更精细地控制 Pod 的调度行为,例如将特定的服务(如 GitLab)部署到特定节点上,以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制,并探讨了多种优化策略,帮助用户实现更高效、更灵活的资源管理。 ... [详细]
  • Docker 自定义网络配置详解
    本文详细介绍如何在 Docker 中自定义网络设置,包括网关和子网地址的配置。通过具体示例展示如何创建和管理自定义网络,以及容器间的通信方式。 ... [详细]
  • 为何Compose与Swarm之后仍有Kubernetes的诞生?
    探讨在已有Compose和Swarm的情况下,Kubernetes是如何以其独特的设计理念和技术优势脱颖而出,成为容器编排领域的领航者。 ... [详细]
  • 本文档详细介绍了在 Kubernetes 集群中部署 ETCD 数据库的过程,包括实验环境的准备、ETCD 证书的生成及配置、以及集群的启动与健康检查等关键步骤。 ... [详细]
  • 前言Git是目前最流行的版本控制系统,在它的基础之上,GitHub和GitLab成为当前最流行的代码托管平台,它们均提供的代码评审、项目管理、持续集成等功能,越来越多的互联网企业都 ... [详细]
  • 本文深入探讨了Kubernetes中Pod的基础概念及其分类,旨在帮助读者更好地理解和利用这一核心组件。通过详细的解析,我们将了解Pod如何作为最小的部署单元在Kubernetes集群中工作。 ... [详细]
  • Kubernetes与Docker之间的关系解析
    本文探讨了Kubernetes(简称k8s)与Docker之间的关系,旨在帮助读者理解这两种技术如何协同工作,以提高应用程序的部署效率和可扩展性。文章首先介绍了两者的基本概念,然后从虚拟化和部署的角度深入分析。 ... [详细]
  • 本文详细介绍了如何利用go-zero框架从需求分析到最终部署至Kubernetes的全过程,特别聚焦于微服务架构中的网关设计与实现。项目采用了go-zero及其生态组件,涵盖了从API设计到RPC调用,再到生产环境下的监控与维护等多方面内容。 ... [详细]
  • Kubernetes 实践指南:初次体验
    本文介绍了如何通过官方提供的简易示例,快速上手 Kubernetes (K8S),并深入理解其核心概念和操作流程。 ... [详细]
  • 本文总结了一次针对大厂Java研发岗位的面试经历,探讨了面试中常见的问题及其背后的原因,并分享了一些实用的面试准备资料。 ... [详细]
  • Kubernetes 1.9.0 Alpha.1 发布公告 [Kubernetes 最新动态]
    近日,Kubernetes 社区发布了两个新版本:1.8.0 RC.1 和 1.9.0 Alpha.1。这是 k8s 1.9.0 的首次发布,自 v1.8.0 Alpha.3 以来进行了大量更新,共提交了 279 次。 ... [详细]
author-avatar
mobiledu2502902037
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有