热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Kubernetestroubleshooting常见问题解决思路和方法

文章目录Kubernetestroubleshooting常见问题解决思路和方法前言Kubernetestroubleshooting流程图流程图详解Pod为Pending状态Po


文章目录

  • Kubernetes troubleshooting 常见问题解决思路和方法
    • 前言
    • Kubernetes troubleshooting流程图
    • 流程图详解
      • Pod为Pending状态
      • Pod为ImagePullBackOff状态
      • Pod为CrashLoopBackOff状态
      • Pod没有Ready
      • Pod状态正常,但是通过Service不能访问到Pod
      • 通过Service能访问Pod,但是集群外不能访问Pod
    • Troubleshooting命令小结
    • 参考文档


Kubernetes troubleshooting 常见问题解决思路和方法


前言

本文基于learnk8s的Kubernetes troubleshooting流程图,说明了Kubernetes常见问题解决思路和方法。


Kubernetes troubleshooting流程图

在这里插入图片描述


流程图详解

使用kubens 来切换namespace,让kubectl 命令更加简单。

如果使用OpenShift,直接用oc命令替换下面的kubectl命令。

另外,可以安装jq 命令行工具来方便对Kubernetes jsonpath进行解析。

查看Pod状态:

kubectl get pods

Pod为Pending状态

Pod为Pending状态的可能原因包括:


  • 集群资源不够,无法分配资源给新的Pod。
  • 资源配额限制(ResourceQuota)。
  • 需要通过PVC绑定PV存储资源,但是没有可用的PV。
  • 指定了专门的调度策略,比如要调度到特定节点上,但是不满足调度条件。

先查看Pod events来定位问题原因:

kubectl describe pod <pod-name>

查看Pod被调度到哪个节点上&#xff1a;

kubectl get pods -o wide

查看Pod的labels&#xff1a;

kubectl get pods --show-labels

Pod为ImagePullBackOff状态

Pod为ImagePullBackOff状态的可能原因包括&#xff1a;


  • Image name不正确。
  • Image tag不正确。
  • 如果是从外网拉取镜像&#xff0c;需要检查&#xff1a;
    • 网络是否正常。
    • 否正确配置了代理。
    • 是否将外网镜像仓库加入了白名单。
  • 如果是从私有镜像仓库&#xff08;private image registry&#xff09;&#xff0c;需要检查&#xff1a;
    • 私有镜像仓库的地址是否正确&#xff0c;特别是地址中包含的项目名称是否一致。
    • 私有镜像仓库是否工作正常。
    • 是否因为私有镜像仓库重启导致之前的镜像丢失。
    • 网络是否正常。
    • 用来拉取镜像的账号是否正确&#xff0c;且有权限。

先查看Pod events来定位问题原因&#xff1a;

kubectl describe pod <pod-name>

Pod为CrashLoopBackOff状态

Pod为CrashLoopBackOff状态的可能原因&#xff1a;


  • 程序错误&#xff0c;导致不断重启。
  • Dockerfile中没有配置程序入口。
  • Pod健康检查配置错误&#xff0c;比如配置了错误的健康检查端点或方式。

先查看Pod events来定位问题原因&#xff1a;

kubectl describe pod <pod-name>

查看Pod日志&#xff1a;

kubectl logs <pod-name>

如果容器死的太快来不及查看日志&#xff0c;可以查看上一个容器的日志&#xff1a;

kubectl logs <pod-name> --previous

Pod没有Ready

Pod没有Ready的可能原因包括&#xff1a;


  • 程序错误&#xff0c;没有完全启动成功。
  • Readiness探针配置错误。

先查看Pod events来定位问题原因&#xff1a;

kubectl describe pod <pod-name>

查看Pod日志&#xff1a;

kubectl logs <pod-name>

Pod状态正常&#xff0c;但是通过Service不能访问到Pod

通过Service不能访问到Pod的可能原因包括&#xff1a;


  • Service的.spec.selector和Pod的.metadata.label不匹配。
  • Service的端口和Pod的端口不匹配。

查看Service配置&#xff1a;

kubectl get svc <service-name> -o yaml

查看Service的selector&#xff1a;

kubectl get svc customer -o jsonpath&#61;&#39;{.spec.selector}&#39;# or use jq to format
kubectl get svc customer -o jsonpath&#61;&#39;{.spec.selector}&#39; | jq

查看Service关联的Pod&#xff1a;

# replace service_name as yours
service_name&#61;customer
sel&#61;${$(kubectl get svc $service_name --output&#61;json | jq -j &#39;.spec.selector | to_entries | .[] | "\(.key)&#61;\(.value),"&#39;)%?}
echo $(kubectl get pods --selector&#61;$sel --output&#61;jsonpath&#61;{.items..metadata.name})

查看Pod的labels&#xff1a;

kubectl get pods --show-labels | grep <pod-name-prefix>

通过Service能访问Pod&#xff0c;但是集群外不能访问Pod

如果是Kubernetes&#xff0c;则检查是否正确配置了Ingress。

如果是OpenShift&#xff0c;则检查是否正确配置了Route。

如果使用Service Mesh&#xff0c;还需要检查是否正确配置Ingress Gateway和VirtualService。


Troubleshooting命令小结

命令小结&#xff1a;

# 列出namespaces
kubens# 切换namespace
kubens <ns-name># 列出当前namespace
kubens -c# 查看Pod
kubectl get pods# 查看Pod的labels
kubectl get pods --show-labels# 查看Pod被调度到哪个节点上
kubectl get pods -o wide# 查看Pod配置
kubectl get pod <pod-name> -o yaml# 获取Pod的某个属性
kubectl get pod <pod-name> -o jsonpath&#61;&#39;{.root.parent.sub}&#39; | jq# 查看Pod的Events和详情
kubectl describe pod <pod-name># 查看Pod日志
kubectl logs <pod-name># 查看前一个容器的日志
kubectl logs <pod-name> --previous

搜索指令小结&#xff1a;

# search in stackoverflow
keyword site:stackoverflow.com

在Kubernetes GitHub issues中搜索&#xff1a;


  • https://github.com/kubernetes/kubernetes/issues

参考文档


  • https://kubernetes.io/docs/reference/kubectl/jsonpath/
  • https://kubernetes.io/docs/reference/kubectl/cheatsheet/
  • https://stedolan.github.io/jq/

推荐阅读
  • Python 3 Scrapy 框架执行流程详解
    本文详细介绍了如何在 Python 3 环境下安装和使用 Scrapy 框架,包括常用命令和执行流程。Scrapy 是一个强大的 Web 抓取框架,适用于数据挖掘、监控和自动化测试等多种场景。 ... [详细]
  • Docker 中创建 CentOS 容器并安装 MySQL 进行本地连接
    本文详细介绍了如何在 Docker 中创建 CentOS 容器,并在容器中安装 MySQL 以实现本地连接。文章内容包括镜像拉取、容器创建、MySQL 安装与配置等步骤。 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 在《Cocos2d-x学习笔记:基础概念解析与内存管理机制深入探讨》中,详细介绍了Cocos2d-x的基础概念,并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解,例如在处理鱼的运动过程中,可以通过编写自定义函数来动态计算角度变化,利用CallFunc回调机制实现高效的游戏逻辑控制。此外,文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏,为开发者提供了实用的编程技巧和最佳实践。 ... [详细]
  • 基于Net Core 3.0与Web API的前后端分离开发:Vue.js在前端的应用
    本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发,并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作,开发环境为Windows 10和Visual Studio 2019,MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装,为开发者提供了一套完整的开发指南。 ... [详细]
  • 在开发过程中,我最初也依赖于功能全面但操作繁琐的集成开发环境(IDE),如Borland Delphi 和 Microsoft Visual Studio。然而,随着对高效开发的追求,我逐渐转向了更加轻量级和灵活的工具组合。通过 CLIfe,我构建了一个高度定制化的开发环境,不仅提高了代码编写效率,还简化了项目管理流程。这一配置结合了多种强大的命令行工具和插件,使我在日常开发中能够更加得心应手。 ... [详细]
  • 提升 Kubernetes 集群管理效率的七大专业工具
    Kubernetes 在云原生环境中的应用日益广泛,然而集群管理的复杂性也随之增加。为了提高管理效率,本文推荐了七款专业工具,这些工具不仅能够简化日常操作,还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查,这些工具覆盖了集群管理的各个方面,帮助管理员更好地应对挑战。 ... [详细]
  • 技术日志:使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告
    技术日志:使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]
  • 在 Kubernetes 中,Pod 的调度通常由集群的自动调度策略决定,这些策略主要关注资源充足性和负载均衡。然而,在某些场景下,用户可能需要更精细地控制 Pod 的调度行为,例如将特定的服务(如 GitLab)部署到特定节点上,以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制,并探讨了多种优化策略,帮助用户实现更高效、更灵活的资源管理。 ... [详细]
  • 在Kubernetes上部署多个Mitmproxy代理服务器以实现高效流量管理 ... [详细]
  • Spring Boot 实战(一):基础的CRUD操作详解
    在《Spring Boot 实战(一)》中,详细介绍了基础的CRUD操作,涵盖创建、读取、更新和删除等核心功能,适合初学者快速掌握Spring Boot框架的应用开发技巧。 ... [详细]
  • 从用户转型为开发者:一场思维升级的旅程 | 专访 StarRocks Committer 周威
    从用户转变为开发者,不仅是一次角色的转换,更是一场深刻的思维升级之旅。本次专访中,StarRocks Committer 周威分享了他如何在这一过程中逐步提升技术能力与思维方式,为开源社区贡献自己的力量。 ... [详细]
  • 本文探讨了使用Python进行微服务架构设计的合理性和适用性。首先,介绍了微服务的基本概念及其在现代软件开发中的重要性。接着,通过具体的业务场景,详细分析了Python在微服务架构设计中的优势和挑战。文章还讨论了在实际应用中可能遇到的问题,并提出了相应的解决方案。希望本文能够为从事Python微服务开发的技术人员提供有价值的参考和指导。 ... [详细]
  • Docker入门指南:初探容器化技术
    Docker入门指南:初探容器化技术摘要:Docker 是一个使用 Go 语言开发的开源容器平台,旨在实现应用程序的构建、分发和运行的标准化。通过将应用及其依赖打包成轻量级的容器,Docker 能够确保应用在任何环境中都能一致地运行,从而提高开发和部署的效率。本文将详细介绍 Docker 的基本概念、核心功能以及如何快速上手使用这一强大的容器化工具。 ... [详细]
  • 在Docker中,默认情况下,镜像和容器数据存储在`/var/lib/docker`目录下,使用loop设备进行管理。然而,当根分区空间不足时(例如CentOS 7默认安装仅有50GB),可能会导致Docker守护进程启动失败,因为UUID与存储的UUID不匹配。为解决这一问题,可以考虑扩展根分区或更改Docker的数据存储路径,以确保有足够的空间来支持Docker的正常运行。 ... [详细]
author-avatar
mobiledu2502902037
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有