kubeadm搭建高可用K8s集群

作者：书友31443126_163 | 来源：互联网 | 2023-09-03 18:48

准备准备3台机器，分别设置hostname如下所示（此处主要是为了便于标识不同的机器，其实不设置hostname也可以正常搭建）：

准备

准备3台机器，分别设置hostname如下所示（此处主要是为了便于标识不同的机器，其实不设置hostname也可以正常搭建）：

机器IP	hostname
10.103.24.18	master1
10.120.162.6	master2
10.136.22.7	master3

kubeadm搭建高可用K8s集群

第一步：初始化第一个master节点

参考《使用Kubeadm搭建Kubernetes(1.13.1)集群》在master1搭建一个单master节点的k8s集群。

第二步：拷贝证书

参考《使用Kubeadm搭建Kubernetes(1.13.1)集群》在master2和master3安装docker、kubeadm 、 kubectl、flannel，但不要执行kubeadm init。（如果执行了kubeadm init也没关系，再执行kubeadm reset就行了）。

然后在master1节点 /etc/kubernetes/ 目录下执行tar -czvf pki.tar.gz pki对 pki 目录进行压缩生成 pki.tar.gz 文件。

将pki.tar.gz文件上传到第二和第三个master节点{$HOME}/~目录下（可以用scp、rsync、sz/rz等命令都可以）。

然后在第二和第三个master节点{$HOME}/~目录下执行如下命令将证书拷贝到/etc/kubernetes/pki/目录下：

# 解压缩文件
tar -xzvf pki.tar.gz
# 移除已处在的文件
rm -rf /etc/kubernetes/pki/*
# 删除etcd相关的证书
rm -f ~/pki/etcd/peer* ~/pki/etcd/server* ~/pki/etcd/healthcheck-client*
# 拷贝证书到/etc/kubernetes/pki/目录下
sudo cp -ar pki/* /etc/kubernetes/pki/

注意：一定要删除etcd相关的证书，否则会把整个k8s集群搞挂。

第三步：加入其它master节点

在第一步master1搭建完成后，会得到如下的kubeadm join命令。这一步在master2和master3分别执行该kubeadm join命令即可。
注意：一定要加上参数 --experimental-control-plane

sudo kubeadm join 10.136.21.13:6443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:9e6fcf8e46473f8158bb4214af4ab93c01247a442b45887a0cf82c312298abb9 --experimental-control-plane

Q&A

1.如果第二步执行出错，把k8s集群搞挂了怎么办？

登录master1，修改/etc/kubernetes/manifests/etcd.yaml。这一步的目的是启动只有一个etcd节点的集群，然后往这个集群中添加新节点等待数据同步。

# 添加下面两个参数
- --initial-cluster-state=new
- --force-new-cluster=true
# 添加上面两个参数
image: docker2.yidian.com:5000/k8simages/etcd:3.2.24

然后重启kubelet

sudo systemctl restart kubelet

通过sudo docker ps 查看启动的etcd容器ID

通过sudo docker exec -it b69913e36ce1 sh进入容器内。
通过下面的命令可以查看当前etcd集群的节点列表：

etcdctl 
--ca-file=/etc/kubernetes/pki/etcd/ca.crt 
--cert-file=/etc/kubernetes/pki/etcd/healthcheck-client.crt  
--key-file=//etc/kubernetes/pki/etcd/healthcheck-client.key 
--endpoints=https://127.0.0.1:2379 
member list

可以看到当前集群中只有一个节点：

此时，apiserver已经可以正常访问etcd，可以通过kubectl get nodes 验证一下：

2.不小心重置了master节点怎么办？

如果不小心在master节点上执行了 sudo kubeadm reset -f ,导致节点重置，etcd容器被kill，数据清空。直接通过 kubeadm join xxx并不能直接将该节点添加回去，而会报出下面的错误：

[kubeconfig] Writing "controller-manager.conf" kubeconfig file
[kubeconfig] Writing "scheduler.conf" kubeconfig file
[etcd] Checking Etcd cluster health
error syncing endpoints with etc: dial tcp 10.120.162.6:2379: connect: connection refused

解决方案参考文档：Kubernetes master无法加入etcd 集群解决方法

解决方法：

1.在kubeadm-config删除的状态不存在的etcd节点：

`kubectl edit configmaps -n kube-system kubeadm-config`

把上边的删掉：

我尝试了方案一，然后重新执行下面的命令，问题就成功解决了。

sudo kubeadm reset -f
sudo ipvsadm --clear
sudo cp -ar pki/* /etc/kubernetes/pki/
sudo kubeadm join 10.136.21.13:6443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:9e6fcf8e46473f8158bb4214af4ab93c01247a442b45887a0cf82c312298abb9 --experimental-control-plane

效果如下：

3. error uploading configuration: the server was unable to return a response in the time allotted, but may still be processing the request (get configmaps kubeadm-config)

在执行kubectl join xxx命令时，出现这种情况是和docker残留信息有关系，可以考虑重启docker：

sudo systemctl restart docker

如果重启docker还不好使，就删除掉 /var/run/dockershim.sock 文件

sudo rm -f /var/run/dockershim.sock

这样反复多试几次就成功了（个人经验）。

4. join成功后，master始终是NotReady状态

出现这种情况的原因是：该master节点安装flannel失败了。

此时，如果查看kubelet的状态，一般是启动失败的状态。通过 sudo journalctl ~~xe –~~no-pager 可以看到如下报错误信息：

kubelet[45748]: E0222 23:29:19.444759   45748 kubelet.go:1308] Image garbage collection failed once. Stats initialization may not have completed yet: failed to get imageFs info: unable to find data in memory cache
kubelet[45748]: F0222 23:29:19.444777   45748 server.go:174] Failed to create listener for podResources endpoint: listen unix /var/lib/kubelet/pod-resources/kubelet.sock: bind: no such file or directory

这种情况可以尝试手动安装flannel，然后重启机器就可以解决，flannel安装过程参考《安装Kubernetes报错：STATUS NotReady》

如果上述方式不管用，可以尝试下面的方式：

sudo rm -f /var/run/dockershim.sock
sudo rm -f /var/run/docker.sock
sudo systemctl restart docker
sudo systemctl restart kubelet

推荐阅读

join
基于阿里云ECS服务器的k8s集群环境搭建

前言: 网上搭建k8s的文章很多，但很多都无法按其说明在阿里云ecs服务器成功搭建，所以我就花了些时间基于自己成功搭建k8s的步骤写了个操作手册，希望对想搭建k8s环境的盆友有所帮 ... [详细]

蜡笔小新 2024-10-25 13:19:07
stream
cilium系列之三:NodeLocal DNSCache在cilium中的实现

kubernetes官网关于nodelocaldns缓存的介绍 ... [详细]

蜡笔小新 2024-10-16 19:32:22
require
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
main
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
main
LeetCode 540：有序数组中的唯一元素

来源：力扣（LeetCode），链接：https://leetcode-cn.com/problems/single-element-in-a-sorted-array。题目要求在仅包含整数的有序数组中，找到唯一出现一次的元素，并确保算法的时间复杂度为 O(log n) 和空间复杂度为 O(1)。 ... [详细]

蜡笔小新 2024-12-28 13:14:07
install
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
install
解决Linux系统中pygraphviz安装问题

本文探讨了在Linux环境下安装pygraphviz时遇到的常见问题，并提供了详细的解决方案和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 16:44:26
require
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
main
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
select
解决SQL Server动态SQL中LIKE语句参数传递导致无返回值的问题

在使用SQL Server进行动态SQL查询时，如果遇到LIKE语句无法正确返回预期结果的情况，通常是因为参数传递方式不当。本文将详细探讨这一问题，并提供解决方案及相关的技术背景。 ... [详细]

蜡笔小新 2024-12-26 17:02:33
web
Kubernetes 实践指南：初次体验

本文介绍了如何通过官方提供的简易示例，快速上手 Kubernetes (K8S)，并深入理解其核心概念和操作流程。 ... [详细]

蜡笔小新 2024-11-25 11:09:16
web
Kubernetes Metric Server Pod 运行异常：缺少 IP SANs

检查 Kubernetes 系统命名空间中的 Pod 状态时，发现 Metric Server Pod 虽然处于运行状态，但存在异常：日志显示 'it doesn’t contain any IP SANs'。 ... [详细]

蜡笔小新 2024-11-14 07:58:56
controller
Kubernetes_如何在GO语言中使用Kubernetes API？

本文由编程笔记#小编为大家整理，主要介绍了如何在GO语言中使用KubernetesAPI？相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-10-16 13:38:00
main
在Kubernetes上部署JupyterHub的步骤和实验依赖

本文介绍了在Kubernetes上部署JupyterHub的步骤和实验所需的依赖，包括安装Docker和K8s，使用kubeadm进行安装，以及更新下载的镜像等。 ... [详细]

蜡笔小新 2023-12-14 20:27:14
plugins
像跟踪分布式服务调用那样跟踪Go函数调用链 | Gopher Daily (2020.12.07) ʕ◔ϖ◔ʔ

每日一谚：“Acacheisjustamemoryleakyouhaven’tmetyet.”—Mr.RogersGo技术专栏“改善Go语⾔编程质量的50个有效实践” ... [详细]

蜡笔小新 2023-10-17 19:23:45

书友31443126_163

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章