当前位置: 开发笔记 > 编程语言 > 正文

服务器被一堆系统登录_老哥，K8S的服务器崩了咋办啊?

作者： | 来源：互联网 | 2023-09-13 16:47

一切，从今天的报警邮件说起。早上上班的时候收到阿里云的站点监控邮件，一下子有点蒙蔽。“地图搜租房“的服务都稳定运行了几个月了，而且还是在K

一切&＃xff0c; 从今天的报警邮件说起。

早上上班的时候收到阿里云的站点监控邮件&＃xff0c; 一下子有点蒙蔽。

“地图搜租房“的服务都稳定运行了几个月了&＃xff0c;而且还是在K8S集群的&＃xff0c;不应该有问题啊。

然后kubectl get pod 一看。2333...

一堆的服务状态都是Unknown, 还有一堆服务的状态是Pending...

Node节点挂了?

kubectl get node 一看, 哈哈哈, 真的是一个Node 节点NoReady.

咋回事啊老哥, K8S节点还能挂啊,

说好的集群现在就只剩一个机器了, 咋玩啊.

登录腾讯云看看.

咦, 红色了 , 居然是待回收了.

OK, 服务器到期了咯, 哈哈哈哈.

点了一下续费...

别这样同学, 我真的没钱啊.

怂了怂了...

算了, 集群嘛, 一台机器也是集群, 嘿嘿嘿.

手动把一些重量级的服务先停掉,

如Elasticsearch/Gitlab/PostgresQL服务,

然后把"地图搜租房"前端UI/API的Pod数量调整成1(之前是两个),

再然后把域名切到仅剩的机器上,

NGINX配置迁移过来(居然之前这机器就有一份NGINX完整的配置),

重启Nginx, 等待域名解析生效.

最后机器和Pod恢复正常.

整体服务停机了一个多小时恢复正常.

所以, 回到题目的话,

K8S的服务器崩了咋办啊?

一般情况下完全撑得住,

对应节点上的Pod会自动迁移到剩余的机器上面,

需要多少实例理论上都是自动完成迁移的,

不过这种情况下需要注意的是空余的服务器资源是足够的,

不然非常容易导致服务一直在等待CPU或者内存资源, 导致不能正常使用,

一般建议集群内应该都是有闲余资源的, 少一个Node节点不应该影响整个集群.

如果和我一样SB的话, 使用某个Node节点作为网关出口,

然后又恰好这个Node死掉了,

第一件事情应该是先切流量走,

然后是把对应的配置/Nginx等内容挪到新机器,

同时恢复当前需要的Pod, 完成完整的迁移.

好了, 今天的文章水到这里就算了..

PS:

最近"地图搜租房"搜索暂时不可用,

估计得等我买了新的服务器再说了.

推荐阅读

api
接入支付宝小程序功能，人人租机实现从零到百的快速增长

人人租机作为国内领先的信用免押租赁平台，为企业和个人提供全方位的新租赁服务。通过接入支付宝小程序功能，该平台实现了从零到百的迅猛增长，成为全国首家推出“新租赁小程序”开发服务的阿里巴巴小程序服务商（ISV）。这一创新举措不仅提升了用户体验，还显著增强了平台的市场竞争力。 ... [详细]

蜡笔小新 2024-11-02 13:00:12
tags
开发笔记:empireCMS 帝国cms功能总结

开发笔记:empireCMS 帝国cms功能总结 ... [详细]

蜡笔小新 2024-11-17 19:03:16
tags
从用户转型为开发者：一场思维升级的旅程 | 专访 StarRocks Committer 周威

从用户转变为开发者，不仅是一次角色的转换，更是一场深刻的思维升级之旅。本次专访中，StarRocks Committer 周威分享了他如何在这一过程中逐步提升技术能力与思维方式，为开源社区贡献自己的力量。 ... [详细]

蜡笔小新 2024-10-31 09:21:44
list
Kubernetes_如何在GO语言中使用Kubernetes API？

本文由编程笔记#小编为大家整理，主要介绍了如何在GO语言中使用KubernetesAPI？相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-10-16 13:38:00
list
Python 实现监控与运维自动化方案

本文探讨了使用Python实现监控信息收集的方法，涵盖从基础的日志记录到复杂的系统运维解决方案，旨在帮助开发者和运维人员提升工作效率。 ... [详细]

蜡笔小新 2024-11-23 11:25:14
java
从迷茫到收获：阿里腾讯实习Offer的求取之路

本文回顾了作者在求职阿里和腾讯实习生过程中，从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历，还提供了宝贵的面试准备建议和技巧。 ... [详细]

蜡笔小新 2024-11-22 19:32:32
java
PHP与MySQL实现高效分页查询

本文探讨了如何在PHP与MySQL环境中实现高效的分页查询，包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]

蜡笔小新 2024-11-22 05:45:48
java
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
get
Kubernetes Metric Server Pod 运行异常：缺少 IP SANs

检查 Kubernetes 系统命名空间中的 Pod 状态时，发现 Metric Server Pod 虽然处于运行状态，但存在异常：日志显示 'it doesn’t contain any IP SANs'。 ... [详细]

蜡笔小新 2024-11-14 07:58:56
get
小王详解：内部网络中最易理解的NAT原理剖析，挑战你的认知极限

小王详解：内部网络中最易理解的NAT原理剖析，挑战你的认知极限 ... [详细]

蜡笔小新 2024-11-07 15:11:42
command
深入解析 Kubernetes 亲和性调度机制及其优化策略

在 Kubernetes 中，Pod 的调度通常由集群的自动调度策略决定，这些策略主要关注资源充足性和负载均衡。然而，在某些场景下，用户可能需要更精细地控制 Pod 的调度行为，例如将特定的服务（如 GitLab）部署到特定节点上，以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制，并探讨了多种优化策略，帮助用户实现更高效、更灵活的资源管理。 ... [详细]

蜡笔小新 2024-11-05 17:27:07
install
基于阿里云ECS服务器的k8s集群环境搭建

前言: 网上搭建k8s的文章很多，但很多都无法按其说明在阿里云ecs服务器成功搭建，所以我就花了些时间基于自己成功搭建k8s的步骤写了个操作手册，希望对想搭建k8s环境的盆友有所帮 ... [详细]

蜡笔小新 2024-10-25 13:19:07
install
kubernetes 下实现socket.io 的集群模式

2019独角兽企业重金招聘Python工程师标准socket.io单节点模式是很容易部署的，但是往往在生产环境一个节点不能满足业务需求，况且还要保 ... [详细]

蜡笔小新 2024-10-21 15:04:10
install
了解_Istio是啥？一文带你彻底了解！

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Istio是啥？一文带你彻底了解！相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-10-09 19:40:18
function
lora物联网开发教程(物联网lora特点)

长距离星型架构，由于长距离连接性，从而减少了电池寿命。这个协议采用了阿罗哈法。在一个网状网络或者一个异步网络中，例如蜂窝网，结点必须频繁的被唤醒，来同步网络和检查消息。这种同步，大 ... [详细]

蜡笔小新 2024-09-30 13:19:34

Tags | 热门标签

RankList | 热门文章