热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

zabbix不显示监控设备网口_zabbix小点滴:监控网络排查隐患

刚接手一家单位的网络管理,发现网络比较简单,核心设备为Huawei,接入交换机70台均为H3CS3100,设备较旧已有7年以上,出现些网络

刚接手一家单位的网络管理,发现网络比较简单,核心设备为Huawei,接入交换机70台均为H3C S3100,设备较旧已有7年以上,出现些网络故障也是在所难免,保障网络担子不轻。

网络问题

接手后从用户、管理人员各方反馈等,发现网络中存在一定的问题:

弱电间灰尘较大,线缆较乱

网络经常出现瞬断现象

每年都有几台网络设备故障

网络有时比较卡,过段时间后会自动恢复

可能存在的隐患有:

网络设备可能出现异常

部分交换机风扇有可能实效

部分设备接口有可能损坏

接入端存在环路的可能

针对上面的情况,需要有有效手段对网络进行监测,定位网络隐患并通过告警及时响应。

zabbix监控

主要监控设备为交换机,监控方式必然采用SNMP,考虑到告警、设备数量不多,相对prometheus,使用zabbix是较为合适的选择。

监控项

考虑上述隐患,分析监控项如下:

核心交换机

ICMP Ping

SNMP 状态

设备描述、版本信息等

设备上线时间

CPU使用率、内存使用率、温度

风扇状态、电源状态

主要接口状态

主要接口出入流量、出入包速率、错误数量

接入交换机

ICMP Ping

SNMP 状态

设备描述、版本信息等

设备上线时间

CPU使用率、内存使用率、温度

风扇状态

由于接入交换机均直接接入核心,因此不在接入上监控上联端口情况,接入接口其他端口连接终端设备,一般情况不作监控。

触发告警

主要告警有:

ping不通

ping平丢包率过高

ping响应值较高

无法获取SNMP

设备刚重启

cpu利用率高

mem利用率高

温度过高

温度过低(部分设备无法获取温度,一直为0)

风扇异常

接口使用率过高

接口发包速度过快

接口错误率过高

日志监控

网络中一些异常会通过trap、设备之身日志方式,对于设备日志,可以采用syslog方式发送到日志服务器,通过在日志服务器部署zabbix agent,使用active模式可对日志文本的监控分析,对异常情况进行告警

设备异常登录

设备接口异常(接口错误、)

设备状态异常(风扇、电源)

安全风险(设备自身检测出的网络攻击,如ARP miss等)

...

案例

网络瞬断分析

网络瞬断比较难处理,在整个网络中也是较难排查,采用zabbix自带的模板“Template Module ICMP Ping”对网络交换机管理网段进行检测,运行一段时间后,发现有大量告警,出现一段时间(约2分钟左右)的中断。对高告警进行统计分析:

主要集中在几台设备,时间上也集中在上下班时间,因此怀疑设备配置需要检查,尤其是STP相关,查阅文档,对交换机进行优化,对终端接口启用边缘接口,减少对生成树的影响。调整之后,观察设备不存在ping不通的情况:

经对比,验证采用配置边缘接口效果较好,可以向全部网络设备推广,至于响应时间过高,已经比之前少很多,可以预计全部配置后效果应该更少。

观察配置边缘接口的设备,发现CPU使用率有明显变化,进一步印证效果:



推荐阅读
  • Docker安全策略与管理
    本文探讨了Docker的安全挑战、核心安全特性及其管理策略,旨在帮助读者深入理解Docker安全机制,并提供实用的安全管理建议。 ... [详细]
  • 本文介绍如何在现有网络中部署基于Linux系统的透明防火墙(网桥模式),以实现灵活的时间段控制、流量限制等功能。通过详细的步骤和配置说明,确保内部网络的安全性和稳定性。 ... [详细]
  • 深入解析TCP/IP五层协议
    本文详细介绍了TCP/IP五层协议模型,包括物理层、数据链路层、网络层、传输层和应用层。每层的功能及其相互关系将被逐一解释,帮助读者理解互联网通信的原理。此外,还特别讨论了UDP和TCP协议的特点以及三次握手、四次挥手的过程。 ... [详细]
  • 本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储(DAS)、网络附加存储(NAS)和存储区域网络(SAN)的特点,帮助读者理解不同存储方式的优势与局限性。 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • 本文详细探讨了虚拟化的基本概念,包括服务器虚拟化、网络虚拟化及其在云计算环境中的应用。特别强调了SDN技术在网络虚拟化和云计算中的关键作用,以及网络虚拟化技术如何提升资源利用效率和管理灵活性。 ... [详细]
  • 最新进展:作为最接近官方声明的信息源,本文吸引了大量关注。若需获取最新动态,请访问:lkhill.com/ccie-version-5-update ... [详细]
  • CentOS 7 磁盘与文件系统管理指南
    本文详细介绍了磁盘的基本结构、接口类型、分区管理以及文件系统格式化等内容,并提供了实际操作步骤,帮助读者更好地理解和掌握 CentOS 7 中的磁盘与文件系统管理。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 近期遇到电脑网络不稳定和游戏时频繁重启的问题,寻求专业建议。网络环境为ADSL调制解调器通过路由器共享给两台电脑使用,怀疑存在ARP攻击或硬件配置问题。希望获得详细的故障排查和解决方案。 ... [详细]
  • 网络运维工程师负责确保企业IT基础设施的稳定运行,保障业务连续性和数据安全。他们需要具备多种技能,包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]
  • 本文探讨了 Spring Boot 应用程序在不同配置下支持的最大并发连接数,重点分析了内置服务器(如 Tomcat、Jetty 和 Undertow)的默认设置及其对性能的影响。 ... [详细]
  • 本文深入探讨了 Redis 的两种持久化方式——RDB 快照和 AOF 日志。详细介绍了它们的工作原理、配置方法以及各自的优缺点,帮助读者根据具体需求选择合适的持久化方案。 ... [详细]
  • 通过Web界面管理Linux日志的解决方案
    本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法,使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境,还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]
  • Consul 单节点与集群环境构建指南
    本文详细介绍了如何安装和配置 Consul 以支持服务注册与发现、健康检查等功能,包括单节点和集群环境的搭建步骤。 ... [详细]
author-avatar
放肆的微笑-扯痛了忧伤
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有