热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

数据中心_数据中心里如何做好日志监控

篇首语:本文由编程笔记#小编为大家整理,主要介绍了数据中心里如何做好日志监控相关的知识,希望对你有一定的参考价值。 ======= 日志是带时间标记的足迹、记录行为、条件和事件,数据中心里的任何

篇首语:本文由编程笔记#小编为大家整理,主要介绍了数据中心里如何做好日志监控相关的知识,希望对你有一定的参考价值。




=======


日志是带时间标记的足迹、记录行为、条件和事件,数据中心里的任何设备都会有日志输出,对这些日志进行管理是数据中心运维工作的重要组成部分。日志管理不但可以对日常操作进行控制与管理提供依据,还可以在某些故障发生之前通过日志信息就能感知到,也可以在故障发生时打印一些异常记录,还可以供故障发生后分析使用。作为数据中心的运维人员学会检查和分析日志数据,是一项必备的技能。然而日志是一把“双刃剑”,用好它,可以大幅提升数据中心的运维水平,降低数据中心的故障发生概率,节约运维开销;用不好它,反而会画蛇添足,增加运维的工作量,加大开销,所以对于数据中心日志的管理和使用,是一门大学问,如何灵活运用是摆在每个数据中心运维者面前的一道难题。本文抛砖引玉,说一说这里的道道。


数据中心里的设备成千上万,尤其是大型数据中心,各种服务器、网络设备、安全与存储等,拥有数千台设备的规模很正常,如果这些设备每台一天报一条日志信息,那么就是数千条日志,这个数据量可想而知。而且最为令人头疼的是,不同厂家甚至是同一厂家的不同型号设备的日志信息格式完全不同,无法通过通用的日志服务器去采集,有时甚至要一类设备用一种日志服务器,另一类设备用另外一种。一个数据中心为了获取所有设备的日志信息,要搭建数个日志服务器,分别进行监控,这样查看和管理起来非常不便,而且不同设备的日志风格不同,有些信息含义并不十分明确,让人丈二和尚摸不着头脑,这都让日志的作用大打折扣。还有很多问题,并不能通过日志提前发现问题。平时可能设备上报了很多日志信息,但是都是一些无关痛痒的无用信息,而真正出现故障了,反而没有任何日志报出了,采集这样的日志信息无助于数据中心管理提升,而是给数据中心添乱。还有不少的数据中心为了节省管理费用,管理网与数据网合一,管理网的数据也走业务转发设备,这样在真正出现故障时,日志信息经过的网络路径也出了故障,就会导致日志信息的丢弃,也错失了避免严重故障的机会,这些都是当前数据中心在日志监控上面临的问题。


怎样将数据中心的日志监控有效做起来,是每个数据中心最为关心的问题。首先,日志信息要统一格式。作为甲方,数据中心有权利要求其采购的设备输出日志符合通用日志服务器采集的格式,无法满足的设备坚决不再进行后期采购,如此一来就可以在整个数据中心部署一套日志监控设备即可,这样可大幅节省监控设备的运维支出;其次,日志采集与业务转发分离,日志数据走单独的管理网,管理网一般是通过专有设备将所有设备的管理口,服务器的单独网卡连接起来,这样业务网络有中断,并不影响到日志数据的收集,这样往往可以给分析问题提供及时、有效的信息,缩短故障定位和恢复的时间;第三,日志信息要简洁和准确,一个大型数据中心数千台设备,不能什么日志都向日志主机发送,只有可能影响到转发业务的日志才会采集,如果设备无法控制,就在日志服务器上进行控制,对不同日志进行等级分类,平时只关注级别高的告警,级别低的忽略不计。此时,设备提供的日志准确性尤为重要,哪些日志可能会影响业务,哪些日志是提示性的,哪些日志是操作类的记录,这样分得清楚,这样在日志服务器上可以调取自己关心的那类日志,不用全部查看,这将大大节省日常运维的检查时间;第四,很多数据中心已经开始做自动化的运维管理,对日志服务器增加自动化检查的脚本,通过脚本对日志进行检查,这样可大大节省人工成本。这种自动化运维管理是通过TCL脚本,对日志进行检查,当发现异常关键字时,给出自动告警,有些脚本还可以自动执行一些恢复的设备命令,这样达到发现故障自行恢复的目的。比如:可以在自动化脚本中增加“Fan is fault”的判断,当发现日志里出现这样的字样时就主动给出提示,或者将告警直接发向运维人员的值班手机上,这样运维人员立即就能知道是哪台设备的风扇出了问题,日志自动化管理是数据中心提升运维水平的重要手段;第五,与设备商做好交流沟通,要求设备商提供完整的日志信息,包括告警级别的分类,这些日志的准确性将直接决定未来运维的效率,如果设备商的设备在故障时,并没有从日志中反映出来,就说明这些设备做得还不够好,要改进。所有的故障都应该通过日志反映出来,这样才能高效运维。设备可维护性也可作为数据中心未来采购的重要参考标准。操作灵活性差,信息记录缺失都是可维护性差的表现,对于这类设备应检查采购或不采购。数据中心出了问题并不可怕,可怕的是出了问题后还不知道怎么回事,没有历史记录可查。


日志监控是未来数据中心管理的重要组成部分,通过日志监控可以避免或者减少业务故障的时间,对于数据中心运维特别有意义。当然,日志监控并不能解决数据中心所有问题,数据中心业务特别复杂,问题表现各异,就算日志监控做得再完整,很多问题也不能通过日志完全反映出来。比如通过FTP下载数据慢,这样业务层问题,通过日志很难反映出来,就需要借助抓包、统计报文等其它手段再深入分析。总之,日志监控还需要不断完善,不仅是数据中心,也需要数据中心设备提供商一起努力,将日志监控做好,从而提升数据中心的运维水平。


(来源:企业网D1Net) 


如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿,投稿邮箱:editor@d1net.com


推荐阅读
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 本文介绍了如何利用HTTP隧道技术在受限网络环境中绕过IDS和防火墙等安全设备,实现RDP端口的暴力破解攻击。文章详细描述了部署过程、攻击实施及流量分析,旨在提升网络安全意识。 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 提升 Kubernetes 集群管理效率的七大专业工具
    Kubernetes 在云原生环境中的应用日益广泛,然而集群管理的复杂性也随之增加。为了提高管理效率,本文推荐了七款专业工具,这些工具不仅能够简化日常操作,还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查,这些工具覆盖了集群管理的各个方面,帮助管理员更好地应对挑战。 ... [详细]
  • 【Linux】CentOS 7 远程连接指南:高效安全的远程管理方法
    在 CentOS 7 中实现高效且安全的远程管理,本文详细介绍了如何检查和安装配置 OpenSSH。首先,通过 `yum list installed` 命令检查系统是否已安装 OpenSSH,若未安装,则使用 `yum install openssh-server` 进行安装。随后,配置 SSH 服务以确保其安全性和稳定性,包括修改默认端口、禁用 root 登录等关键步骤。此外,还提供了常见问题的解决方案,帮助用户顺利进行远程连接。 ... [详细]
  • 本文详细介绍了如何在PHP中记录和管理行为日志,包括ThinkPHP框架中的日志记录方法、日志的用途、实现原理以及相关配置。 ... [详细]
  • 本文详细介绍了Java代码分层的基本概念和常见分层模式,特别是MVC模式。同时探讨了不同项目需求下的分层策略,帮助读者更好地理解和应用Java分层思想。 ... [详细]
  • Linux CentOS 7 安装PostgreSQL 9.5.17 (源码编译)
    近日需要将PostgreSQL数据库从Windows中迁移到Linux中,LinuxCentOS7安装PostgreSQL9.5.17安装过程特此记录。安装环境&#x ... [详细]
  • 深入解析Struts、Spring与Hibernate三大框架的面试要点与技巧 ... [详细]
  • 帝国CMS中的信息归档功能详解及其重要性
    本文详细解析了帝国CMS中的信息归档功能,并探讨了其在内容管理中的重要性。通过归档功能,用户可以有效地管理和组织大量内容,提高网站的运行效率和用户体验。此外,文章还介绍了如何利用该功能进行数据备份和恢复,确保网站数据的安全性和完整性。 ... [详细]
  • 本文详细介绍了在CentOS 6.5 64位系统上使用阿里云ECS服务器搭建LAMP环境的具体步骤。首先,通过PuTTY工具实现远程连接至服务器。接着,检查当前系统的磁盘空间使用情况,确保有足够的空间进行后续操作,可使用 `df` 命令进行查看。此外,文章还涵盖了安装和配置Apache、MySQL和PHP的相关步骤,以及常见问题的解决方法,帮助用户顺利完成LAMP环境的搭建。 ... [详细]
  • 这篇文章 | 夕阳下的防火墙命令全解 ... [详细]
  • TCP三次握手过程详解与图示解析
    本文详细解析了TCP三次握手的过程,并通过图示清晰展示了各个状态的变化。同时,文章还介绍了四次挥手的图解,解释了在TIME_WAIT状态中,客户端最后一次发送的ACK包的作用和重要性。 ... [详细]
  • 本文探讨了利用Python编程语言开发自动化脚本来实现文件的全量和增量备份方法。通过详细分析不同备份策略的特点,文章介绍了如何使用Python标准库中的os和shutil模块来高效地管理和执行备份任务。此外,还提供了示例代码和最佳实践,帮助读者快速掌握自动化备份技术,确保数据的安全性和完整性。 ... [详细]
  • 解读中台架构:微服务与分布式技术的区别及应用
    中心化与去中心化是长期讨论的话题。中心化架构的优势在于部署和维护相对简单,尤其在服务负载较为稳定的情况下,能够提供高效稳定的性能。然而,随着业务规模的扩大和技术需求的多样化,中心化架构的局限性逐渐显现,如扩展性和故障恢复能力较差。相比之下,微服务和分布式技术通过解耦系统组件,提高了系统的灵活性和可扩展性,更适合处理复杂多变的业务场景。本文将深入探讨中台架构中微服务与分布式技术的区别及其应用场景,帮助读者更好地理解和选择适合自身业务的技术方案。 ... [详细]
author-avatar
手机用户2502909293
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有