当前位置: 开发笔记 > 后端 > 正文

IT运维必读：避免故障、拒绝背锅的六大原则

作者：爱你一辈子2502860605 | 来源：互联网 | 2023-07-22 17:20

众所周知，故障是运维人员永远的痛！相信每一个运维人员的KPI中都有一项：可用性。可用性高就是不出故障，各个公司对可用性和故

众所周知&＃xff0c;故障是运维人员永远的痛&＃xff01;相信每一个运维人员的KPI中都有一项&＃xff1a;可用性。

可用性高就是不出故障&＃xff0c;各个公司对可用性和故障评级的标准都不相同&＃xff0c;但是避免故障的方法却是殊途同归。

在这里插入图片描述

运维人员应该怎么避免故障&＃xff1f;下面简单列举了以下几条&＃xff1a;

变更要有回滚&＃xff0c;在同样的环境测试过

所有的变更都必须有回滚的办法&＃xff0c;在同样的环境下测试过。没有做过的东西&＃xff0c;总是会在你意想不到的地方给你一次痛击&＃xff0c;多年运维经验告诉我们&＃xff0c;所有没有做过的变更&＃xff0c;出错的概率最大。

所以我们需要给变更以回滚的可能&＃xff0c;在各个步骤可能出错的情况下&＃xff0c;考虑回滚到最初状态。优秀的运维人员对不考虑回滚的的操作都是敬而远之的。从某种意义上来说&＃xff0c;运维是一门经验的学科&＃xff0c;是一门试错的学科。

对破坏性的操作谨慎小心

破坏性的操作有哪些列&＃xff1f;对数据库来说有&＃xff1a;DROP Table&＃xff0c;Drop database&＃xff0c;truncate table&＃xff0c;delete all data&＃xff1b;这些操作做完了以后几乎无法考虑怎么把数据都回滚回去了。就算回滚&＃xff0c;代价也是非常大的。你执行这样的语句非常简单&＃xff0c;但是回滚恢复数据缺非常困难。这些操作时就要更加谨慎了。

设置好命令提示

让你时刻知道你在操作哪个数据库&＃xff0c;让你知道你在哪个目录下。开多个标签页的话&＃xff0c;如果每个标签页的标题上内容一样&＃xff0c;我们切来切去就有可能在错误的标签页上做操作&＃xff0c;设置了这个以后&＃xff0c;这个问题概率就会小很多。

备份并验证备份有效性

是人总会出错&＃xff0c;是机器总可能会有突然崩溃的那一天&＃xff0c;怎么办&＃xff1f;我们需要准备备份。备份有了&＃xff0c;是否就可以高枕无忧了&＃xff1f;还是不行。你需要验证备份的有效性。没有一个备份能够保证它备份出来的数据能够100%恢复出正确的数据。所以&＃xff0c;备份并不只是备份&＃xff0c;它还包括备份的验证&＃xff0c;它如果不能恢复出正确的数据&＃xff0c;就只是浪费空间而已。

交接和休假最容易出故障变更请谨慎

这个是经验之谈。我们在总结故障的情况时&＃xff0c;发现在公司部门有变化时&＃xff0c;工作交接&＃xff0c;故障的出现频率会比正常情况下多50%以上。有人说&＃xff0c;这是因为机器或者应用是有感情的&＃xff0c;舍不得离开的运维者。

我们不谈感情&＃xff0c;简单的理性分析一下。公司或者部门难免会做一些调整&＃xff0c;变化是世界上唯一不变的事情。而运维人员是一线做事情的人&＃xff0c;部门调整或者领导的更换可能导致工作的着重点不同&＃xff0c;做事的方式和评测的标准变了&＃xff0c;适应过程中难免会出现一些考虑不周到的地方&＃xff0c;出故障也是情理之中了。

所以&＃xff0c;运维部门和运维人员对变化需要尽量放平心态&＃xff1b;接手别人的工作要一而再&＃xff0c;再而三的确认变更方案。请教人并不见得就是能力不行的表现&＃xff1b;休假前最好各种可以做好的事情&＃xff0c;最好能够准备一份文档&＃xff0c;指明在什么情况下怎么做和联系哪些人。在别人放假的时候接手工作&＃xff0c;“能拖则拖”&＃xff0c;实在需要执行&＃xff1a;必须不厌其烦的跟原运维者确认各个操作细节。

搭建报警&＃xff0c;及时获得出错信息

搭建性能监控&＃xff0c;了解历史&＃xff0c;获得趋势&＃xff0c;预测未来。运维的最高境界不是故障来了&＃xff0c;泰山崩于前而不惊&＃xff0c;而是没有故障&＃xff0c;让故障消失在萌芽之中。请给那些默默无闻&＃xff0c;每天想着我们的系统还存在哪些隐患&＃xff0c;怎么解决&＃xff0c;怎么及早发现的运维人员鼓掌。他们是最可爱的人。而他们赖以生存的工具就是报警和监控。Oracle发展了这么多年&＃xff0c;awr和相关的性能参数都相对比较全&＃xff1b;MySQL现在也已经迎头赶上&＃xff0c;配套的工具越来越多。

报警可以让你及时知道系统出现了什么异常。性能监控可以让你了解系统的历史性能信息。分析故障发生时的各种现象&＃xff0c;确认故障的真正原因&＃xff1b;了解变化趋势&＃xff0c;发现故障的苗头&＃xff0c;及早优化和调整。报警和性能监控其实不不完全独立的&＃xff0c;很多性能的监控项也可以报警出来。

推荐阅读

mysql
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
port
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
api
对MariaDB未来发展的思考与担忧

本文探讨了MariaDB在当前数据库市场中的地位和挑战，分析其可能面临的困境，并提出了对未来发展的几点看法。 ... [详细]

蜡笔小新 2024-12-25 18:20:32
api
分组获取最大N条记录的优化方案及新年祝福

探讨如何从数据库中按分组获取最大N条记录的方法，并分享新年祝福。本文提供多种解决方案，适用于不同数据库系统，如MySQL、Oracle等。 ... [详细]

蜡笔小新 2024-12-24 12:30:56
api
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
api
网站与MySQL数据库的连接与交互

本文详细介绍了如何通过多种编程语言（如PHP、JSP）实现网站与MySQL数据库的连接，包括创建数据库、表的基本操作，以及数据的读取和写入方法。 ... [详细]

蜡笔小新 2024-12-27 14:09:23
api
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29
port
通过Web界面管理Linux日志的解决方案

本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法，使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境，还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-12-24 17:11:38
port
Java时代的淘宝技术演进

本文探讨了2012年4月期间，淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型，以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]

蜡笔小新 2024-12-24 12:12:13
port
QT预备式（包含MySql配置）未完成……

20100423：Fixes:更新批处理，以兼容WIN7。第一次系统地玩QT，于是诞生了此预备式：【QT版本4.6.0&#x ... [详细]

蜡笔小新 2024-12-24 09:50:00
port
MySQL 基础操作：增删改查详解

本文详细介绍了 MySQL 数据库中的基础操作，包括创建、查询、修改和删除数据库、表及数据的命令。通过具体的 SQL 语句示例，帮助读者快速掌握 MySQL 的基本操作。 ... [详细]

蜡笔小新 2024-12-24 06:46:51
upload
构建个人博客站点：基于LAMP环境的WordPress部署指南

本文详细介绍如何利用已搭建的LAMP（Linux、Apache、MySQL、PHP）环境，快速创建一个基于WordPress的内容管理系统（CMS）。WordPress是一款流行的开源博客平台，适用于个人或小型团队使用。 ... [详细]

蜡笔小新 2024-12-23 20:23:57
upload
Oracle与DB2的最新版本概述

本文介绍了Oracle和IBM DB2数据库管理系统当前的最新版本，包括它们的主要特点、功能改进以及发布日期。文章详细探讨了两个系统在企业级应用中的表现，并提供了对各自版本更新的重点解析。 ... [详细]

蜡笔小新 2024-12-23 15:55:27
port
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
asp.net
无需重启MySQL服务即可生效my.cnf配置文件修改

通常情况下，修改my.cnf配置文件后需要重启MySQL服务才能使新参数生效。然而，通过特定命令可以在不重启服务的情况下实现配置的即时更新。本文将详细介绍如何在线调整MySQL配置，并验证其有效性。 ... [详细]

蜡笔小新 2024-12-21 14:26:22

爱你一辈子2502860605

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章