TelegrafInfluxdbGrafana容器化部署拓展（Https、AD域、告警集成）并监控Cisco设备指标

作者：林秋伟左婷_894 | 来源：互联网 | 2023-06-01 07:02

前言：还记得在去年的笔记中提到过使用python的pysnmp模块，配合Influxdb，Grafana收集Cisco设备指标。链接如下

前言&＃xff1a;

还记得在去年的笔记中提到过使用python的pysnmp模块&＃xff0c;配合Influxdb&＃xff0c;Grafana收集Cisco设备指标。链接如下&＃xff1a;https://blog.csdn.net/tushanpeipei/article/details/117329794 。在该实例中&＃xff0c;我们通过python编写脚本收集设备信息&＃xff0c;并将收集的信息格式化后发送到Influxdb进行存储&＃xff0c;最后Grfana从Influxdb中读取数据做可视化呈现。总的来说&＃xff0c;这种方式需要自己编写python的脚本&＃xff0c;虽然灵活性很高&＃xff0c;但是相对来说比较麻烦&＃xff0c;并且需要一定的代码能力。

前段时间为了进一步提升监控套件的安全性和好用性&＃xff0c;对之前的部署方案进行调整。使用Telegraf代替python实现了对设备信息的收集&＃xff0c;并且进一步实现了Https加密&＃xff0c;AD域用户和告警功能的集成。通过Telegraf-Influxdb-Grafana完成指标监控的这套解决方案也被称为TIG。借着这次机会&＃xff0c;我也重新梳理了一下其中各个套件的用处以及与其他特性的集成的方式。

一、认识TIG套件

TIG套件是当下流行的一套设备指标监控解决方案&＃xff0c;它由Telegraf-Influxdb-Grafana三个组件组合而成&＃xff0c;它们的关系如图1所示&＃xff1a;
在这里插入图片描述

图1&＃xff1a;TIG组件

首先&＃xff0c;Telegraf 是一个基于服务器的代理&＃xff0c;用于从数据库、系统和物联网传感器收集和发送所有指标和事件。此外&＃xff0c;Telegraf 是用 Go 编写的&＃xff0c;可以编译成一个没有外部依赖项的二进制文件&＃xff0c;并且需要非常小的内存占用。进一步说&＃xff0c;Telegraf的组件如图2所示&＃xff1a;
在这里插入图片描述

图2&＃xff1a;Telegraf 组成

上图显示&＃xff0c;Telegraf从有四种基本插件类型&＃xff1a;Input、processor、aggregator 和 Output 。其中功能如下&＃xff1a;

Input&＃xff1a;Telegraf 输入插件从系统、服务和第三方 API 收集指标。
Processor&＃xff1a;处理器插件在发送指标之前转换、修饰和过滤指标&＃xff0c;允许收集的数据在数据到达时进行清理。
Aggregator&＃xff1a;聚合器插件创建聚合指标&＃xff0c;例如收集和处理的指标的平均值、最小值和最大值。
Output&＃xff1a;输出插件写入各种数据存储、服务和消息队列&＃xff0c;如 InfluxDB、Graphite、OpenTSDB、Datadog、Kafka、MQTT、NSQ 等。

首先是Input插件&＃xff08;详情请参考&＃xff1a;https://github.com/influxdata/telegraf/tree/master/plugins/inputs/snmp&＃xff09;&＃xff0c;Telegraf支持多多种Input插件&＃xff0c;例如inputs.snmp。此外&＃xff0c;Telegraf可以通过2种方式获取目标设备的指标信息&＃xff0c;一种是Pull&＃xff0c;另外一种则是Push (Traps)。以SNMP插件为例子&＃xff0c;在Pull模型中&＃xff0c;监控代理会定期向目标设备上运行的 SNMP 代理发送 SNMP 请求。设备上的 SNMP 代理使用特定请求的指标进行响应。在Push模式下&＃xff0c;通信从另一端开始。受监控设备&＃xff08;通过 SNMP 代理&＃xff09;将状态消息&＃xff08;Traps&＃xff09;发送到监控系统的Traps接收器。这种模式下没有周期性调度&＃xff0c;Traps消息在生成时发送&＃xff0c;提供系统和网络性能问题的实时视图。当Telegraf收集到信息后&＃xff0c;通过Processor和Aggregator对输入信息进行处理和聚会&＃xff0c;并将最终的数据通过Output插件&＃xff08;详情请参考&＃xff1a;https://github.com/influxdata/telegraf/tree/master/plugins/outputs&＃xff09;输出到存储端&＃xff0c;例如常见与之配套使用的Influxdb数据库。

第二个组件是Influxdb。Influxdb 类似于 SQL 数据库&＃xff0c;但在许多方面有所不同。进一步说&＃xff0c;Influxdb 专为时间序列数据而构建的高性能数据库。关系数据库可以处理时间序列数据&＃xff0c;但并未针对常见的时间序列工作负载进行优化。Influxdb 旨在存储大量时间序列数据并快速对该数据进行实时分析。具体来说&＃xff0c;Influxdb会为在每次收集数据时记录对应的时间戳&＃xff0c;其记录的数据通常如图3&＃xff1a;
在这里插入图片描述

图3&＃xff1a;Influxdb数据

参数解释如下&＃xff1a;

InfluxDB 测量 ( foodships) 类似于 SQL 数据库表。
InfluxDB 标签&＃xff08;park_id和planet&＃xff09;就像 SQL 数据库中的索引列。
InfluxDB 字段 ( #_foodships) 就像 SQL 数据库中的未索引列。
InfluxDB 点&＃xff08;例如&＃xff0c;2015-04-16T12:00:00Z 5&＃xff09;类似于 SQL 行。

补充&＃xff1a;与Influxdb相似的时序性监控系统叫做Prometheus&＃xff08;普罗米修斯&＃xff09;。它们有一些不同之处。简而言之&＃xff0c;这两个产品都是优秀的时间序列数据库。它们的默认模式不同&＃xff08;InfluxDB 为推送&＃xff0c;Prometheus 为拉取&＃xff09;。有些人认为 PromQL&＃xff0c;Prometheus 的语言&＃xff0c;比 InfluxDB 使用的语言更简单&＃xff0c;但总而言之&＃xff0c;使用一种工具或另一种工具的决定可能取决于具体的用例。如果监控是我们最感兴趣的&＃xff0c;那么 Prometheus 是最安全的选择&＃xff0c;因为它具有许多集成和可扩展模型。如果我们更有可能将时间序列数据库用于 IoT、传感器或分析&＃xff0c;那么我们可能希望选择 InfluxDB。具体请参考&＃xff1a;https://logz.io/blog/prometheus-influxdb/#:~:text&＃61;InfluxDB is a push-based,and Prometheus fetches them periodically.

最后一个插件是Grafana&＃xff0c;Grafana可谓时当下最受欢迎的开源交互式数据可视化平台&＃xff0c;由Grafana Labs 开发&＃xff0c;它允许用户通过统一到一个仪表板&＃xff08;或多个仪表板&＃xff09;中的图表和图形来查看他们的数据&＃xff0c;以便于解释和理解。仪表盘示例如图4所示&＃xff1a;
在这里插入图片描述

图4&＃xff1a;Grafana Dashboard

此外&＃xff0c;Grafana还可以设置告警&＃xff0c;一旦设置的告警规则被触发&＃xff0c;Grafana则可以发送报警给运维人员。需要注意的是&＃xff0c;Grafana仅仅作为数据呈现端&＃xff0c;它需要连接数据库并从中提取数据。例如&＃xff0c;Influxdb&＃xff0c;Prometheus都可以作为Grafana的数据存储端。

二、TIG容器化部署

实验目的&＃xff1a;
通过TIG收集Cisco设备的指标信息&＃xff0c;并存放在Influxdb数据库中&＃xff0c;最后通过Grafana的Dashboard做呈现。此外&＃xff0c;考虑到安全性和好用性&＃xff0c;本次实验中集成了Https、AD域以及告警功能。

提前准备&＃xff1a;

搭建AD服务器。
搭建CA服务器。
搭建SMTP服务器。
在Cisco ASA设备上开启SNMP v2c。

TIG套件代码分析&＃xff1a;
在这里插入图片描述

图5&＃xff1a;TIG套件代码

图5展示了TIG容器化部署所需要的代码和文件。首先是三个json的模板&＃xff0c;这三个模板其实是通过json文件编写的针对于Cisco设备指标呈现的Dashboard。Dashboard可以自己编写&＃xff0c;或者在网上搜索别人共享的文件。接下来Docker-compose.yml&＃xff0c;该文件是TIG套件容器化的配置文件。然后是grafana.ini和ldap.toml文件&＃xff0c;它们分别是Grafana的配置和AD域集成文件。下一个重要的文件是telegraf.conf文件&＃xff0c;我们可以通过配置该文件&＃xff0c;从目标设备中获取各种指标信息。最后的2文件个则与Https的证书相关&＃xff0c;分别是Grafana Web页面的证书和私钥。接下来是对一些重要文件的解读&＃xff1a;

telegraf.conf&＃xff1a;
该文件记录了对Telegraf组件的配置信息&＃xff0c;其中值得注意的配置有input和output插件。在本次实验中&＃xff0c;通过inputs.snmp插件&＃xff0c;主动拉取目标设备的指标&＃xff0c;如图6所示&＃xff1a;
在这里插入图片描述

图6&＃xff1a;Telegraf inputs.snmp 插件代码

图6中的配置显示了Telegraf通过snmpv2&＃xff0c;对IP地址为10.1.102.254的ASA设备的内存&＃xff0c;CPU&＃xff0c;接口速率等信息进行采集。具体的参数和采集指标可以自行调整。第二个需要配置的是Output插件&＃xff0c;由于最终输出的目标是influxdb&＃xff0c;所以最终使用的是outputs.influxdb。代码如图7所示&＃xff1a;
在这里插入图片描述

图7&＃xff1a;Telegraf outputs.infuxdb 插件代码

我们需要在此处定义连接的influxdb数据库地址以及登录该数据库的账号密码。

接下来&＃xff0c;我们需要对Grafana进行三个配置&＃xff0c;分别是配置Https&＃xff0c;AD域以及告警。首先是Grafana Web界面的Https的配置。配置Https需要两个关键文件&＃xff0c;分别是Grafana Web的证书和私钥。具体来说&＃xff0c;私钥和证书都可以通过openssl工具生成&＃xff0c;或者通过openssl生成私钥和证书请求文件&＃xff0c;再由现有的CA机构签发证书。获得2个文件后&＃xff0c;就可以在grafana.ini中开启https并加载上述两个文件&＃xff0c;如图8所示&＃xff1a;
在这里插入图片描述

图8&＃xff1a;Grafana https 代码

第二步则是配置集成AD域&＃xff0c;首先创建文件ldap.toml定义连接AD域的各种参数&＃xff0c;如图9所示&＃xff1a;
在这里插入图片描述

图9&＃xff1a;Grafana AD域参数

由上图可只&＃xff0c;集成AD域的参数包含AD服务器地址&＃xff0c;端口号&＃xff0c;绑定的DN等配置。具体的配置可以根据自己的AD域配置进行修改。紧接着&＃xff0c;我们需要将grafana.ini文件中加载AD域配置&＃xff0c;如图10所示&＃xff1a;
在这里插入图片描述

图10&＃xff1a;Grafana AD域加载

最后&＃xff0c;我们还需要在Grafana中集成告警信息的发送者。该操作同样在grafana.ini文件中进行配置即可&＃xff0c;如图11所示。这个SMTP服务器可以是知名的邮件服务商&＃xff0c;也可以是自己环境中所搭建的。
在这里插入图片描述

图11&＃xff1a;Grafana smtp 配置

到此位置&＃xff0c;我们将TIG套件的配置已经完成。接下来&＃xff0c;需要将其容器化&＃xff0c;相关配置在docker-compose.yml文件中进行完成。该文件配置如图12所示&＃xff1a;
在这里插入图片描述

图12&＃xff1a;TIG docker-compose文件

具体来说&＃xff0c;在该文件中定义了三个套件所用的容器image&＃xff0c;influxdb的数据库名称&＃xff0c;数据库管理员账户&＃xff0c;端口映射&＃xff0c;以及将三个套件的配置文件等信息通过卷挂载的形式映射到了容器中。此外&＃xff0c;TIG三个套件还需要通过定义的TIG_net桥接网络进行通信。

完成上述配置后&＃xff0c;仅需要在进入docker-compose.yml文件所在目录&＃xff0c;输入命令&＃xff1a;docker-compose up -d 即可容器化部署TIG。

代码下载地址&＃xff1a; https://github.com/Prin-Meng/telegraf_influxdb_grafana

三、TIG套件应用示例

首先&＃xff0c;我们可以使用https://IP地址:3000登录Grafana的Web界面&＃xff0c;如图13所示&＃xff1a;
在这里插入图片描述

图13&＃xff1a;Grafana登录界面

接下来&＃xff0c;在Grafana的Data Source界面添加influxdb&＃xff0c;如图14所示。其中需要配置的是influxdb的url&＃xff0c;以及连接该数据库管理员的账号密码。
在这里插入图片描述

图14&＃xff1a;Grafana连接Influxdb数据库

添加成功后&＃xff0c;我们导入监控设备的Dashboard文件。本次实验的目的是收集Cisco ASA的指标&＃xff0c;则只需要在图15的界面导入准备好的ASA SNMP monitor.json文件即可即可&＃xff1a;
在这里插入图片描述

图15&＃xff1a;Grafana导入Dashboard

完成上述步骤后&＃xff0c;即可等待Telegraf收集数据并通过Grafana做呈现了&＃xff0c;如图16所示&＃xff0c;可以看到目前收集到的Cisco ASA的内存利用率&＃xff0c;CPU利用率&＃xff0c;接口速率等信息。
在这里插入图片描述

图16&＃xff1a;TIG 监控 Cisco ASA

最后&＃xff0c;我们需要在Grafana的alert界面配置Grafana 的告警信息&＃xff0c;配置页面如图17所示。
在这里插入图片描述

图17&＃xff1a;Grafana告警配置

需要注意的是&＃xff0c;Grafana 8以后的告警界面和之前的Grafana有较大的区别&＃xff0c;功能更新强大但相对复杂。我们需要设置的内容包括&＃xff1a;告警的规则&＃xff0c;告警信息的内容&＃xff0c;告警的联系方式&＃xff0c;管理员联系地址&＃xff0c;通知策略等。进一步说&＃xff0c;告警示意图架构如图18所示&＃xff1a;
在这里插入图片描述

图18&＃xff1a;Grafana告警架构

具体的告警配置步骤可以参考&＃xff1a;
https://www.youtube.com/watch?v&＃61;UtmmhLraSnE&＃xff0c;https://grafana.com/docs/grafana/latest/alerting/

参考资料

SNMP 代理协议监控&＃xff1a; https://www.influxdata.com/integration/snmp/
比较 InfluxDB 和 SQL 数据库&＃xff1a; https://docs.influxdata.com/influxdb/v1.8/concepts/crosswalk/
Prometheus 与 InfluxDB&＃xff1a;监控比较&＃xff1a;https://logz.io/blog/prometheus-influxdb/#:~:text&＃61;InfluxDB is a push-based,and Prometheus fetches them periodically.
乾颐堂现任明教教主教主技术进化论 2020第21期.InfluxDB Python实战&＃xff1a; https://www.bilibili.com/video/BV1SV41127HU?from&＃61;search&seid&＃61;13988085653859648559

推荐阅读

regex
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
match
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
ip
Python多进程高效读取超大文件的技巧

本文详细介绍了如何使用Python的多进程技术来高效地分块读取超大文件，并将其输出为多个文件。通过这种方式，可以显著提高读取速度和处理效率。 ... [详细]

蜡笔小新 2024-11-14 10:59:08
ip
禁止Mysql默认端口访问Internet

过去查询Mysql的时候，都见3306对所有端口开放着，感觉不安全。netstat -anlp | grep mysqltcp 0&am ... [详细]

蜡笔小新 2024-11-13 17:36:31
ip
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
ip
解决 Ubuntu 下 Samba 重新安装时配置文件未重新生成的问题

在 Ubuntu 中遇到 Samba 服务器故障时，尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]

蜡笔小新 2024-11-12 13:02:23
ip
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
object
第二十五天接口、多态

1.java是面向对象的语言。设计模式：接口接口类是从java里衍生出来的，不是python原生支持的主要用于继承里多继承抽象类是python原生支持的主要用于继承里的单继承但是接 ... [详细]

蜡笔小新 2024-11-12 06:43:20
ip
Mac上安装Jupyter Notebook的详细步骤与技巧

本文将详细介绍如何在Mac上安装Jupyter Notebook，并提供一些常见的问题解决方法。通过这些步骤，您将能够顺利地在Mac上运行Jupyter Notebook。 ... [详细]

蜡笔小新 2024-11-12 00:45:51
jar
JavaWeb文件上传：前端实现与后端处理详解

在JavaWeb开发中，文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件，都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件，该库提供了强大的文件解析和存储能力，能够高效地处理各种文件类型。此外，为了提高系统的安全性和稳定性，还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]

蜡笔小新 2024-11-11 19:50:46
object
Python 伦理黑客技术：深入探讨后门攻击（第三部分）

在《Python 伦理黑客技术：深入探讨后门攻击（第三部分）》中，作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流，难以确定消息批次的结束点，这给后门攻击的实现带来了挑战。为了解决这一问题，文章提出了一系列有效的技术方案，包括使用特定的分隔符和长度前缀，以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性，还为安全研究人员提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 16:33:02
ip
MATLAB字典学习工具箱SPAMS：稀疏与字典学习的详细介绍、配置及应用实例

SPAMS（Sparse Modeling Software）是一个强大的开源优化工具箱，专为解决多种稀疏估计问题而设计。该工具箱基于MATLAB，提供了丰富的算法和函数，适用于字典学习、信号处理和机器学习等领域。本文将详细介绍SPAMS的配置方法、核心功能及其在实际应用中的典型案例，帮助用户更好地理解和使用这一工具箱。 ... [详细]

蜡笔小新 2024-11-09 16:17:27
java
Cookie学习小结

Cookie学习小结 ... [详细]

蜡笔小新 2024-11-14 16:26:25
java
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
object
优化Hadoop 2.7.2源代码以支持Snappy压缩和解压功能的Native编译

为了在Hadoop 2.7.2中实现对Snappy压缩和解压功能的原生支持，本文详细介绍了如何重新编译Hadoop源代码，并优化其Native编译过程。通过这一优化，可以显著提升数据处理的效率和性能。此外，还探讨了编译过程中可能遇到的问题及其解决方案，为用户提供了一套完整的操作指南。 ... [详细]

蜡笔小新 2024-11-09 19:45:36

林秋伟左婷_894

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章