热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

运维的自动化驾驶

上周五子衿技术论坛的主题是数字化转型,下午的运维数字化转型分会场是我主持的,不少厂家、用

上周五子衿技术论坛的主题是数字化转型,下午的运维数字化转型分会场是我主持的,不少厂家、用户、高校都参加了这次活动,受疫情影响,下午分会场不能超过25人,不过最终进场的人员超过了30人。线上还有而是多人参与了分会场。
在上午的主会场上我分享了IT运维数字化转型的几个探索案例,其中也提到IT部门是不是会成为企业里最晚实现数字化转型的部门。这个观点得到了参加下午分会场讨论的朋友的广泛认同。大家一起分析了业务部门与IT部门在数字化方面的差异,现在的业务部门离开IT系统基本上就不能办理或者处理业务了,因此数字化程度是很高的,而现在IT部门很少有完整的管理系统,大部分工作都是离开运维专业的管理系统手工进行的。在数字化程度上,IT部门已经远远落后于其服务的业务部门了。
另外一个大家十分关注运维数字化转型中的数据问题,目前实际上IT部门对自己运维的环境的数据的掌握并不强。几年前我们在做“IT健康管理”方案的时候,很多客户的IT主管都对我们需要采集大量的系统运行指标数据感到十分不解。我拼命解释说,只有采集了充足的指标,才能构建出高质量的分析模型,才能更好的掌握系统的运行情况。不过大部分人都对我的说法不理解,觉得目前他们这样运维系统也没有什么大问题,他们也已经建立了网管监控系统,采集了一些指标,为什么我们不能把这些指标充分利用起来,用现有的指标去构建分析模型,非要再增加这么多指标呢?实际上每个人都有惯性,习惯了二十年前网管思路的运维人员有时候很难接受我们现在的自动化驾驶的理念的。
就像对于特斯拉这样的数字化的汽车,我们很习惯把它当成普通的车辆来驾驶,用传统的驾驶方式肯定也能开的不错。不过如果你只想用普通的驾驶方式去驾驶特斯拉的时候,可能花了不少冤枉钱了,因为马赛克在各种自动化辅助手段的支持上花了不少心思,这辆车的很多钱也花在了这方面。
如果把运维比作驾驶汽车也是如此,你可以采用传统的方式来运维你的IT系统,也可以尝试使用新的自动化驾驶的方式来进行运维。不过随着企业的IT系统越来越复杂,数量也越来越多,什么事情都要靠传统的手工模式来做已经变得不大可能了。运维自动化、运维智能化越来越成为企业运维部门关注的方向。
我们经历过以人为中心的手工运维阶段,可能现在大多数企业也还停留在这个阶段,不过随着企业数字化转型的不断深入,我们面临更为复杂的运维需求。
企业将面对更为复杂的IT环境,面临更昂贵的运维成本,业务部门对IT部门的运维要求也越来越高。如果我们还死守传统的以人为中心的手工运维模式,肯定是要出问题的。提高自动化、智能化的方式,把一些十分消耗人力资源的数据采集、分析、监控、巡检工作用高效的自动化作业替代,提高生产力,解放人力资源会成为未来企业IT运维中十分重要的一项工作。不过在这里我们需要的是真正自动化作业工具,而不是一些花架子工具。
很多人觉得只有自动化处置工具才是真正有效的工具,其他大多数都是花架子。这实际上也并不奇怪,因为在以前,确实很少存在真正有效的能够防患于未然或者能够完成根因定位的运维工具。不过现在自动化处置能够完成的事情还十分有限,大部分局限于系统的自动化部署。在自动化处置上要复杂的多,因为从自动化问题发现,到自动化处置策略产生,到自动化处置完成,再到自动化效果评估,是一套十分复杂而存在一定风险的闭环流程。哪怕很多标榜自动化处置的产品能够举出的比较有说服力的例子,不外乎自动空间扩容而已。
上面是我画的一张自动化处置的时序图,自动化处置过程分为多个阶段:
(1)通过大量的有效的数据采集进行自动化的分析,实现问题发现,比如通过IT健康管理的模型发现系统存在的缺陷;
(2)通过智能化诊断实现自动化的根因定位;
(3)评估缺陷可能产生的风险,并根据风险产生消缺方案,同时评估故障自动化消除的风险。想要做好这个并不容易,哪怕是空间扩容大家任务可以完美解决的自动化处置问题也是如此。以Oracle数据库的表空间容量管理为例,表空间使用率超过99%了必须扩容吗?不一定的,因为数据文件可能是自动扩展的。设置了自动扩展的数据文件,只需要监控ASM磁盘组的容量了吗?也不一定,因为普通8K数据文件自动扩展到32GB就无法再扩展了。只有把这些都分析清楚了,才能真正的发现容量风险。能够发现真正的风险就能做好自动处置了吗?如果我们要扩容ASM磁盘组,我们从哪里获得新的磁盘呢?事先准备好磁盘吗?如果都提前准备好了磁盘,为什么不马上加进去还要系统去冒风险自动化加入呢?这不是为了自动化而自动化吗?哪怕这种做法被认为是不错的自动化处置,从哪去分配磁盘呢?ASM磁盘组里最好每块盘的大小都是符合FAILGROUP的成员盘大小的,而且性能也最好接近,我们如何保证这些呢?
(4)对于风险可控的作业自动处置,当我们通过评估这个工作可以自动化执行,那么就会根据预案设置自动化执行作业,并把这个作业的工作内容推送给管理员;
(5)持续监控执行过程,并持续进行风险监控,一旦发现问题及时终止,并通知运维人员;
(6)执行完毕进行效果评估,并将评估结果通知运维人员;
(7)根据不同的自动化处置类别,在预定的时间内对执行效果进行持续监控,发现问题及时通知运维人员。
实际上汽车的自动化驾驶和运维的自动化驾驶一样精密,汽车的自动化驾驶是依赖于大量的视觉和距离传感器以及汽车自身运行的大量数据的,没有这些,自动驾驶的汽车就是杀人和自杀的利器。运维的自动化驾驶也是如此。在业务数字化的过程中,第一步和第二步永远是“业务的数字化描述”和“业务的数字化建模”,不能自动化描述某个业务的数字模型,就无法进行真正的进行自动化处置。
不幸的是,我们的大多数IT主管并不理解或者并不接受这个观点,他们总是希望看到他们想要看到的结果,而并不愿意接受达到这些结果所需要的成本。如果这个问题不改变,那么运维的自动化驾驶就只是一句口号了。



推荐阅读
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 本文探讨了现代分布式架构的多样性,包括高并发、多活数据中心、容器化、微服务、高可用性和弹性架构等,并介绍了与这些架构相关的重要管理技术,如DevOps、应用监控和自动化运维。文章还深入分析了分布式系统的核心概念、主要用途及类型,同时对比了单体应用与分布式服务化的优缺点。 ... [详细]
  • Navicat Premium 15 安装指南及数据库连接配置
    本文详细介绍 Navicat Premium 15 的安装步骤及其对多种数据库(如 MySQL 和 Oracle)的支持,帮助用户顺利完成软件的安装与激活。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 本文深入探讨了 Java 编程语言的基础,特别是其跨平台特性和 JVM 的工作原理。通过介绍 Java 的发展历史和生态系统,帮助初学者理解如何编写并运行第一个 Java 程序。 ... [详细]
  • MySQL 数据库迁移指南:从本地到远程及磁盘间迁移
    本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移,包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机,以及解决迁移过程中可能遇到的问题。 ... [详细]
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 实体映射最强工具类:MapStruct真香 ... [详细]
  • ElasticSearch 集群监控与优化
    本文详细介绍了如何有效地监控 ElasticSearch 集群,涵盖了关键性能指标、集群健康状况、统计信息以及内存和垃圾回收的监控方法。 ... [详细]
  • 创邻科技成功举办Graph+X生态合作伙伴大会,30余家行业领军企业共聚杭州
    9月22日,创邻科技在杭州举办“Graph+X”生态合作伙伴大会,汇聚了超过30家行业头部企业的50多位企业家和技术领袖,共同探讨图技术的前沿应用与发展前景。 ... [详细]
  • 为何我选择了华为云GaussDB数据库
    本文分享了作者选择华为云GaussDB数据库的理由,详细介绍了GaussDB(for MySQL)的技术特性和优势,以及它在金融和互联网行业的应用场景。 ... [详细]
  • Ubuntu GamePack:专为游戏爱好者打造的Linux发行版
    随着Linux系统在游戏领域的应用越来越广泛,许多Linux用户开始寻求在自己的系统上畅玩游戏的方法。UALinux,一家致力于推广GNU/Linux使用的乌克兰公司,推出了基于Ubuntu 16.04的Ubuntu GamePack,旨在为Linux用户提供一个游戏友好型的操作环境。 ... [详细]
  • 全能终端工具推荐:高效、免费、易用
    介绍一款备受好评的全能型终端工具——MobaXterm,它不仅功能强大,而且完全免费,适合各类用户使用。 ... [详细]
author-avatar
独斟自饮醉
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有