当前位置: 开发笔记 > 编程语言 > 正文

Istio和Kubernetes：通过混沌工程降低风险

作者：最佳永恒的六二 | 来源：互联网 | 2023-06-25 09:00

Istio和Kubernetes：

点击上方 云原生CTO，选择设为星标

优质文章，每日送达

「【只做懂你de云原生干货知识共享】」

Istio 和 Kubernetes：通过混沌工程降低风险

在 Cloud Native 系统中设计微服务架构时，在Kubernetes 集群上设置Istio服务网格可以让您更好地控制和观察网络流量。但是，它也可以帮助您解决问题，这将是本博文的重点。

混沌工程是 Netflix 创造的一个术语，它可以归结为在生产中破坏您的系统，并在事情有机会意外中断之前设计解决方案来补救副作用。

「https://www.oreilly.com/library/view/chaos-engineering/9781491988459/」

您知道如果后端基础设施的一半无法访问会发生什么吗？如果您的前端 Web 服务器之一出现故障怎么办？如果流量需要额外的几秒钟才能到达后端的关键组件怎么办？如果你不能自信地回答这类问题，你就需要开始混沌工程。

混沌工程实验是我们容器解决方案工程师和我们的客户测试我们共同构建的云原生系统的一部分。此类弹性测试是我们四步云原生转型流程（思考、设计、构建、运行）的一部分，它们可帮助我们的客户在浪费时间、金钱和人力资源之前，尽早找出哪些有效，哪些无效。

既然您知道为什么应该接受这种心态，那么让我们来谈谈将想法付诸行动的一些方法。此外，打破东西可以很有趣！

模拟服务中断

让我们首先模拟您的一个 Web 服务的部分中断。这是用于高可用前端服务的典型 Istio 虚拟服务。

apiVersion: networking.istio.io/v1alpha3 kind: VirtualService metadata: name: frontend spec: hosts: - frontend http: - route: - destination: host: frontend subset: v1

如您所见，我们将传入流量发送到任意数量的带有“前端”标签的服务。您可以开始杀死 pod 以查看会发生什么（您应该这样做）。但是我们将专注于您可以使用 Istio 做什么来模拟您的一些请求被错误配置或无法访问的微服务处理。

这是相同的 yaml，加上一个“错误”部分，我们将使用它来导致我们的一半请求以 503 个内部服务器错误进行响应。

apiVersion: networking.istio.io/v1alpha3 kind: VirtualService metadata: name: frontend spec: hosts: - frontend http: - route: - destination: host: frontend subset: v1 - fault: abort: httpStatus: 503 percent: 50

这是另一个示例，但不是故障，而是设置超时，以便在返回 504 Gateway Timeout 错误之前为我们的服务提供有限的响应时间。这应该针对您的一些后端 REST API 进行测试，以查看依赖于它们的服务如何处理它。

apiVersion: networking.istio.io/v1alpha3 kind: VirtualService metadata: name: frontend spec: hosts: - frontend http: - route: - destination: host: frontend subset: v1 timeout: 1s

最后，我们将尝试通过延迟故障注入在我们的网络中引入一些延迟。通过这个，我们可以了解我们的前端应用程序如何处理预期响应中的延迟。希望它只是在几秒钟后返回您期望的内容，但最好现在找出答案，然后在周六凌晨 4 点被传呼。

让 Istio 重试失败的请求

因此，既然您已经测试了一些常见的故障模式，现在是进行补救的时候了。在大多数情况下，您需要更新应用程序代码以优雅地处理故障，但 Istio 有一个内置的重试选项，可以为您争取一些时间来解决问题。

apiVersion: networking.istio.io/v1alpha3 kind: VirtualService metadata: name: frontend spec: hosts: - frontend http: - route: - destination: host: frontend subset: v1 retries: attempts: 3 perTryTimeout: 2s

HTTP 重试完全符合您的预期。如果请求失败，无论出于何种原因，Istio 都会通过重试您指定的次数来处理它。如果某些服务仍然可用，根据您的配置方式，您的请求最终将由健康的 pod 提供。假设您的基础设施本身是高度可用的（想想多区域/多集群），那么性能下降应该很少（如果有的话）。

知道如果出现问题会发生什么感觉不是很好吗？我知道通过混沌工程的知识，我晚上睡得更轻松。可能会导致生产系统中断似乎很可怕，但即使是最好的灾难恢复计划在经过测试之前也是不完整的。要么你测试它们，要么它们测试你——如果你读了这么多，那么你已经知道哪个更可取了。

参考：

https://blog.container-solutions.com/istio-and-kubernetes-reducing-risk-through-chaos-engineering

更多好文推荐阅读

Kubernetes 模式：InitContainers模式

Kubernetes 日志监控工具

kubernetes是如何工作的

用于蓝/绿部署策略的 Kubectl 插件

Kubernetes 监控：Kubeview

kubernetes二次开发实战(阶段二）

嘿，你在看吗？

推荐阅读

服务器
智能家居巨头 Aqara 基于 KubeSphere 打造物联网微服务平台

智能家居巨头 Aqara 基于 KubeSphere 打造物联网微服务平台 ... [详细]

蜡笔小新 2024-09-29 15:20:29
服务器
对mysql的总结与反思_一次DB故障引起的反思和MySQL Operator选型

前言在一次数据库故障后，我们发现业务库会根据业务的等级会划分多个MySQL实例，许多业务库会同时属于一个MySQL实例，当一个库引发问题后 ... [详细]

蜡笔小新 2024-09-25 13:23:25
export
k8s(十一)helm安装premetheus

1prometheus基础知识1.1prometheus简介Prometheus是一套开源的系统监控报警框架。和Kubernetes类似，它也发源于Google的Borg体系，其原 ... [详细]

蜡笔小新 2024-09-25 11:17:50
数组
异构服务器微服务_微服务架构的核心要点和实现原理

摘要：本文中，我们将进一步理解微服务架构的核心要点和实现原理，为读者的实践提供微服务的设计模式，以期让微服务在读者正在工作的 ... [详细]

蜡笔小新 2024-09-30 14:35:15
nodejs
前端微服务二

为了解决庞大的一整块后端服务带来的变更与扩展方面的限制，出现了微服务架构（Microservices）：微服务是面向服务架构（SOA）的一种变体，把应用程序设计成一系列松耦合的细粒 ... [详细]

蜡笔小新 2024-09-30 18:35:19
nodejs
Shiro 简单了解

Shiro简单了解简单用过SpringSecurity安全框架后，再试试另一个安全框架——Shiro。1.Shiro简介ApacheShiro是一个强大且易用的Java安全框架：S ... [详细]

蜡笔小新 2024-09-29 15:14:16
nodejs
总结_第12章总结

12.1微服务的原则我们在第2章讨论过，微服务原则可以发挥什么样的作用。它们 ... [详细]

蜡笔小新 2024-09-28 19:06:24
nodejs
DDD在微服务架构中落地应用

1DDDDomainDrivenDesign(领域驱动设计,DDD)，不是一种架构，而是一种架构方法论，是一种拆解业务、划分业务、确定业 ... [详细]

蜡笔小新 2024-09-27 12:58:00
runtime
微服务应用性能如何？APM监控工具来告诉你

当微服务系统越来越庞大，各个服务间的调用关系也变得越来越复杂，需要一个工具来帮忙理清请求调用的服务链路。之前使用的是Sleuth+Zipkin的解决方案，最近发现应 ... [详细]

蜡笔小新 2024-09-24 17:38:28
runtime
Spring Boot 打包上传Docker 仓库的详细步骤

这篇文章主要介绍了SpringBoot打包上传Docker仓库的详细步骤,本文分步骤给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下 ... [详细]

蜡笔小新 2024-09-29 19:17:08
char
FluxCD、ArgoCD或Jenkins X，哪个才是适合你的GitOps工具？

GitOps是一种使用基于Git的工作流程来全面管理应用和基础设施的想法，其在最近获得了极大关注。新一代的部署工具更能说明这一点，它们将GitOps作为 ... [详细]

蜡笔小新 2024-09-29 19:04:37
char
C10K问题,c1000k问题

为什么80%的码农都做不了架构师？#0系列目录#聊聊远程通信Java远程通讯技术及原理分析聊聊Socket、TCPIP、HTTP、FTP及网 ... [详细]

蜡笔小新 2024-09-26 18:02:26
char
阿里p8用端午节3天假期整理出了Spring Cloud知识点大全，太全了

前言：今天一觉起来，发现我们开工的日期又延迟了，虽然已经在家办公一个多礼拜了，但是由于家里的环境还是不能有很高的效率。于是干脆就对SpringCloud的一些知识点做了一些整理。 ... [详细]

蜡笔小新 2024-09-26 11:16:30
char
实战分析SpringBoot整合JSON，面试题附答案

前言作为同时具备高性能、高可靠和高可扩 ... [详细]

蜡笔小新 2024-09-25 13:56:27
runtime
eBPF和WebAssembly：云原生VM的比较及应用领域

本文比较了eBPF和WebAssembly作为云原生VM的特点和应用领域。eBPF作为运行在Linux内核中的轻量级代码执行沙箱，适用于网络或安全相关的任务；而WebAssembly作为图灵完备的语言，在商业应用中具有优势。同时，介绍了WebAssembly在Linux内核中运行的尝试以及基于LLVM的云原生WebAssembly编译器WasmEdge Runtime的案例，展示了WebAssembly作为原生应用程序的潜力。 ... [详细]

蜡笔小新 2023-12-14 21:27:37

最佳永恒的六二

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章