热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

IT运维必读:避免故障、拒绝背锅的六大原则

众所周知,故障是运维人员永远的痛!相信每一个运维人员的KPI中都有一项:可用性。可用性高就是不出故障,各个公司对可用性和故

众所周知,故障是运维人员永远的痛!相信每一个运维人员的KPI中都有一项:可用性。

可用性高就是不出故障,各个公司对可用性和故障评级的标准都不相同,但是避免故障的方法却是殊途同归。

在这里插入图片描述

运维人员应该怎么避免故障?下面简单列举了以下几条:

01

变更要有回滚,在同样的环境测试过

所有的变更都必须有回滚的办法,在同样的环境下测试过。没有做过的东西,总是会在你意想不到的地方给你一次痛击,多年运维经验告诉我们,所有没有做过的变更,出错的概率最大。

所以我们需要给变更以回滚的可能,在各个步骤可能出错的情况下,考虑回滚到最初状态。优秀的运维人员对不考虑回滚的的操作都是敬而远之的。从某种意义上来说,运维是一门经验的学科,是一门试错的学科。

02

对破坏性的操作谨慎小心

破坏性的操作有哪些列?对数据库来说有:DROP Table,Drop database,truncate table,delete all data;这些操作做完了以后几乎无法考虑怎么把数据都回滚回去了。就算回滚,代价也是非常大的。你执行这样的语句非常简单,但是回滚恢复数据缺非常困难。这些操作时就要更加谨慎了。

03

设置好命令提示

让你时刻知道你在操作哪个数据库,让你知道你在哪个目录下。开多个标签页的话,如果每个标签页的标题上内容一样,我们切来切去就有可能在错误的标签页上做操作,设置了这个以后,这个问题概率就会小很多。

04

备份并验证备份有效性

是人总会出错,是机器总可能会有突然崩溃的那一天,怎么办?我们需要准备备份。备份有了,是否就可以高枕无忧了?还是不行。你需要验证备份的有效性。没有一个备份能够保证它备份出来的数据能够100%恢复出正确的数据。所以,备份并不只是备份,它还包括备份的验证,它如果不能恢复出正确的数据,就只是浪费空间而已。

05

交接和休假最容易出故障变更请谨慎

这个是经验之谈。我们在总结故障的情况时,发现在公司部门有变化时,工作交接,故障的出现频率会比正常情况下多50%以上。有人说,这是因为机器或者应用是有感情的,舍不得离开的运维者。

我们不谈感情,简单的理性分析一下。公司或者部门难免会做一些调整,变化是世界上唯一不变的事情。而运维人员是一线做事情的人,部门调整或者领导的更换可能导致工作的着重点不同,做事的方式和评测的标准变了,适应过程中难免会出现一些考虑不周到的地方,出故障也是情理之中了。

所以,运维部门和运维人员对变化需要尽量放平心态;接手别人的工作要一而再,再而三的确认变更方案。请教人并不见得就是能力不行的表现;休假前最好各种可以做好的事情,最好能够准备一份文档,指明在什么情况下怎么做和联系哪些人。在别人放假的时候接手工作,“能拖则拖”,实在需要执行:必须不厌其烦的跟原运维者确认各个操作细节。

06

搭建报警,及时获得出错信息

搭建性能监控,了解历史,获得趋势,预测未来。运维的最高境界不是故障来了,泰山崩于前而不惊,而是没有故障,让故障消失在萌芽之中。请给那些默默无闻,每天想着我们的系统还存在哪些隐患,怎么解决,怎么及早发现的运维人员鼓掌。他们是最可爱的人。而他们赖以生存的工具就是报警和监控。Oracle发展了这么多年,awr和相关的性能参数都相对比较全;MySQL现在也已经迎头赶上,配套的工具越来越多。

报警可以让你及时知道系统出现了什么异常。性能监控可以让你了解系统的历史性能信息。分析故障发生时的各种现象,确认故障的真正原因;了解变化趋势,发现故障的苗头,及早优化和调整。报警和性能监控其实不不完全独立的,很多性能的监控项也可以报警出来。


推荐阅读
  • 我的新书已正式上市,可在当当和京东购买。如果您喜欢本书,欢迎留下宝贵评价。本书历时3至4年完成,内容涵盖MySQL的安装、配置、开发、测试、监控和运维等方面,旨在帮助读者系统地学习MySQL。 ... [详细]
  • Linux虚拟机中MySQL安装指南
    本文详细介绍了如何在Linux虚拟机上安装MySQL,包括解决常见问题的方法和步骤。 ... [详细]
  • 本文档详细介绍了2017年8月31日关于MySQL数据库备份与恢复的教学内容,包括MySQL日志功能、备份策略、备份工具及实战演练。 ... [详细]
  • 本文详细介绍了如何在 Python 3.3 环境下操作 MySQL 数据库,包括调用存储过程、连接数据库以及基本的数据操作方法。 ... [详细]
  • 在不断发展的信息技术领域,选择合适的数据库管理系统对项目成功至关重要。本文通过比较Oracle和SQL Server两种主流数据库,探讨它们在不同应用场景下的优缺点,帮助开发者根据自身需求做出合理选择。 ... [详细]
  • 本文详细介绍了Django框架内置的对象关系映射(ORM)机制,包括其工作原理、如何连接MySQL数据库以及ORM的主要优势和局限性。同时,提供了配置和使用Django ORM的具体步骤。 ... [详细]
  • 本文介绍了MySQL的基本操作命令,包括数据库和表的创建、数据的查询与删除等,并深入探讨了索引的作用及其对数据库性能的影响。 ... [详细]
  • 本文汇总了一系列适合Java和PHP毕业设计的题目,涵盖多个领域,旨在帮助即将完成学业的学生们找到合适的项目方向。 ... [详细]
  • 本文详细探讨了成为一名合格的初级Java工程师所需掌握的知识体系,以及从初级到中级乃至高级工程师的成长路径和职业发展前景。 ... [详细]
  • 本文详细介绍了 Java 中 `java.sql.Timestamp` 类的 `valueOf()` 方法,该方法用于将符合 JDBC 转义格式的时间戳字符串转换为 `Timestamp` 对象,并通过示例展示了其在实际开发中的应用。 ... [详细]
  • 本文详细探讨了Laravel框架中的数据库操作,包括读写分离、事务处理、Eloquent ORM的使用、关联关系管理及性能优化技巧。 ... [详细]
  • 深入解析数据库连接池的类型及参数配置
    本文详细介绍了数据库连接池的三大类型及其各自的特性,并深入探讨了连接池的关键参数配置,帮助开发者更好地理解和利用数据库连接池技术。 ... [详细]
  • 本文介绍了如何在配置了virtualenv和virtualenvwrapper环境后,利用PyCharm创建新的Django项目,并将开发数据库从SQLite切换至更适用于生产环境的MySQL数据库。文章详细记录了尝试使用MySQLdb、MySQL自带Connector及pymysql等不同数据库连接库时遇到的问题及解决办法。 ... [详细]
  • 在阿里云与腾讯云筹建传统主从复制环境_mysql
    MySQL主从复制环境可以说是一切高可用的基础。它的原理也比较简单,下面我们先来了 ... [详细]
  • MySQL 默认字符集详解与配置
    本文探讨了MySQL数据库中默认字符集的选择问题,特别是对于需要支持多语言环境的应用来说,如何正确设置字符集以避免数据乱码等常见问题。 ... [详细]
author-avatar
爱你一辈子2502860605
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有