Logstash：如何在Ubuntu上使用Rsyslog、Logstash和Elasticsearch集中日志

作者：小时候V有时候 | 来源：互联网 | 2023-07-10 12:36

在我之前的一篇文章“Beats：使用Linux系统上的Rsyslog收集日志并导入Elasticsearch”，我讲述了如何使用Rsyslog在Linu

在我之前的一篇文章 “Beats&＃xff1a;使用 Linux 系统上的 Rsyslog 收集日志并导入 Elasticsearch”&＃xff0c;我讲述了如何使用 Rsyslog 在 Linux 系统上收集日志并发送到 Elasticsearch 中。在那个解决方案里&＃xff0c;我们配置 Rsyslog 为一个 client 模式&＃xff0c;并发送日志到 Elasticsearch 中。我们在 Logstash 里对日志进行结构化。

在今天的文章中&＃xff0c;我将使用另外一种方式。我们把 Rsyslog 同时配置为 server 及 client 模式。通过 server 模式&＃xff0c;我可以把各个应用或其它系统的日志统一收集在一起&＃xff0c;并通过 client 模式发送到 Logstash 中。我们甚至可以直接使用 Rsyslog 的配置直接使日志结构化。除非我们需要特殊的处理&＃xff0c;否则我们可以甚至在 Logstash 中省去 filter 这个部分。

介绍

理解组织生成的数百万条日志行可能是一项艰巨的挑战。一方面&＃xff0c;这些日志行提供了应用程序性能、服务器性能指标和安全性的视图。另一方面&＃xff0c;日志管理和分析可能非常耗时&＃xff0c;这可能会阻碍这些日益必要的服务的采用。

rsyslog、Elasticsearch 和 Logstash 等开源软件提供了传输、转换和存储日志数据的工具。

在本教程中&＃xff0c;你将学习如何创建一个集中的 rsyslog 服务器来存储来自多个系统的日志文件&＃xff0c;然后使用 Logstash 将它们发送到 Elasticsearch 服务器。从那里&＃xff0c;你可以决定如何最好地分析数据。

目标

本教程教你如何集中 syslog 生成或接收的日志&＃xff0c;特别是称为 rsyslog 的变体。 Syslog 和基于 syslog 的工具&＃xff08;如 rsyslog&＃xff09;从内核和许多运行以保持类 UNIX 服务器运行的程序中收集重要信息。由于 syslog 是一个标准&＃xff0c;而不仅仅是一个程序&＃xff0c;因此许多软件项目都支持将数据发送到 syslog。通过集中这些数据&＃xff0c;你可以更轻松地审核安全性、监控应用程序行为并跟踪其他重要的服务器信息。

然后&＃xff0c;你可以从集中式或聚合 rsyslog 服务器将数据转发到 Logstash&＃xff0c;后者可以在将日志数据发送到 Elasticsearch 之前进一步解析和丰富您的日志数据。

本教程的最终目标是&＃xff1a;

设置单个客户端&＃xff08;或转发&＃xff09;rsyslog 服务器
设置单个服务器&＃xff08;或收集&＃xff09;rsyslog 服务器&＃xff0c;以从 rsyslog 客户端接收日志
设置 Logstash 实例以接收来自 rsyslog 收集服务器的消息
设置 Elasticsearch 服务器以接收来自 Logstash 的数据

安装

在今天的练习中&＃xff0c;我不准备进行安装描述。我希望你已经安装好自己的&＃xff1a;

Elasticsearch
Kibana
Logstash
rsyslog &＃xff08;如过系统还没有安装好的话&＃xff0c;请参考文章 “Beats&＃xff1a;使用 Linux 系统上的 Rsyslog 收集日志并导入 Elasticsearch” 安装&＃xff09;

- 一个系统的 rsyslog 将被配置为 server 模式

- 其它系统的 rsyslog 将被配置为 client 模式

为了说明问题的方便&＃xff0c;我在 Ubuntu 20.04 的 Linux 机器上部署上面部署 Elastic Stack 及 Rsyslog。在这个机器上的 Rsyslog 将被配置为服务器模式。我的机器的 IP 地址是 192.168.0.4。你可以通过如下的方式来获得&＃xff1a;

ifconfig -a | grep 192

$ ifconfig -a | grep 192inet 192.168.0.4 netmask 255.255.255.0 broadcast 192.168.0.255

或者&＃xff1a;

ifconfig -a

你可以使用其它的 Linux 机器部署 Rsyslog&＃xff0c;并按照下面的方式来配置为 client 模式。它们的 syslog 日志将被发送到集中处理的 Rsyslog server 中&＃xff0c;并最终通过 Logstash 导入到 Elastiicsearch 中。

配置 Rsyslog 为 server 模式来集中收集数据

在本节中&＃xff0c;我们将 rsyslog-server 配置为能够在端口 514 上接收来自其他 syslog 服务器的数据的中央服务器。要将 rsyslog-server 配置为从其他 syslog 服务器接收数据&＃xff0c;请在 rsyslog-server 上编辑 /etc/rsyslog.conf&＃xff1a;

/etc/rsyslog.conf

# provides UDP syslog reception module(load&＃61;"imudp") input(type&＃61;"imudp" port&＃61;"514")# provides TCP syslog reception module(load&＃61;"imtcp") input(type&＃61;"imtcp" port&＃61;"514")

找到已经在 rsyslog.conf 中注释掉的这些行&＃xff0c;并它们的注释取消掉。最终的结果就像上面显示的那样。这样&＃xff0c;我们同时启动了 TCP 及 UDP 。

每个部分的第一行 module(load&＃61;"imudp") 和 module(load&＃61;"imtcp") 分别加载 imudp 和 imtcp 模块。 imudp 代表输入模块 udp&＃xff0c;imtcp 代表输入模块 tcp。这些模块侦听来自其他系统日志服务器的传入数据。

每个部分的第二行&＃xff08;input(type&＃61;"imudp" port&＃61;"514") 和 input(type&＃61;"imtcp" port&＃61;"514")&＃xff09;表明 rsyslog 应该为这些协议启动各自的 UDP 和 TCP 服务器&＃xff0c;这些协议侦听端口 514&＃xff08;这是 syslog 默认端口&＃xff09;。

我们重新启动 rsyslog 服务&＃xff1a;

sudo service rsyslog restart

我们可以通过如下的命令来检查 rsyslog 服务是否运行正常&＃xff1a;

service rsyslog status

提示&＃xff1a;你可以使用如下的命令来检查 rsyslog 的配置文件&＃xff1a;

sudo rsyslogd -N1

你可以使用如下的命令来检查 rsyslog 服务的运行日志&＃xff1a;

journalctl -u rsyslog
配置其它系统的 Rsyslog 发送日志到集中服务器

我们在其他的 Linux 机器把 Rsyslog 配置为 client 模式&＃xff0c;并把该机器的日志发送到 Rsyslog server 里去。这个 server 也就是我们的集中处理及上传日志的服务。针对我的情况它的 IP 地址是 192.168.0.4。

在 Ubuntu 的安装中&＃xff0c;我们找到路径 /etc/rsyslog.d&＃xff1a;

# pwd /etc/rsyslog.d root&＃64;liuxgu:/etc/rsyslog.d# ls 20-ufw.conf 50-default.conf

我们修改 50-default.conf 这个文件。在文件顶部的 log by facility 之前添加以下行&＃xff0c;将 private_ip_of_ryslog_server 替换为你的中央服务器的私有 IP&＃xff1a;

*.* &＃64;private_ip_of_ryslog_server:514

行的第一部分 (.) 表示我们要发送所有消息。虽然它超出了本教程的范围&＃xff0c;但你可以将 rsyslog 配置为仅发送某些消息。该行的其余部分解释了如何发送数据以及将数据发送到何处。在我们的例子中&＃xff0c;IP 地址前的 &＃64; 符号告诉 rsyslog 使用 UDP 发送消息。将此更改为&＃64;&＃64; 以使用 TCP。接下来是安装了 rsyslog 和 Logstash 的 rsyslog-server 的私有 IP 地址。冒号后面的数字是要使用的端口号。

重新启动 rsyslog 以启用更改&＃xff1a;

sudo service rsyslog restart

恭喜&＃xff01; 你现在正在将系统日志消息发送到中央服务器&＃xff01;

把日志格式化为 JSON

Elasticsearch 要求它接收到的所有文档都是 JSON 格式&＃xff0c;而 rsyslog 提供了一种通过模板的方式来实现这一点的方法。

在这一步中&＃xff0c;我们将配置我们的中央 rsyslog 服务器以使用 JSON 模板来格式化日志数据&＃xff0c;然后将其发送到 Logstash&＃xff0c;然后将其发送到 Elasticsearch。

回到 rsyslog-server 中央服务器&＃xff0c;创建一个新的配置文件&＃xff0c;在发送到 Logstash 之前将消息格式化为 JSON 格式&＃xff1a;

sudo vi /etc/rsyslog.d/01-json-template.conf

完全按照所示将以下内容复制到文件中&＃xff1a;

/etc/rsyslog.d/01-json-template.conf

template(name&＃61;"json-template"type&＃61;"list") {constant(value&＃61;"{")constant(value&＃61;"\"&＃64;timestamp\":\"") property(name&＃61;"timereported" dateFormat&＃61;"rfc3339")constant(value&＃61;"\",\"&＃64;version\":\"1")constant(value&＃61;"\",\"message\":\"") property(name&＃61;"msg" format&＃61;"json")constant(value&＃61;"\",\"sysloghost\":\"") property(name&＃61;"hostname")constant(value&＃61;"\",\"severity\":\"") property(name&＃61;"syslogseverity-text")constant(value&＃61;"\",\"facility\":\"") property(name&＃61;"syslogfacility-text")constant(value&＃61;"\",\"programname\":\"") property(name&＃61;"programname")constant(value&＃61;"\",\"procid\":\"") property(name&＃61;"procid")constant(value&＃61;"\"}\n") }

除了第一个和最后一个&＃xff0c;请注意此模板生成的行在它们的开头有一个逗号。这是为了维护 JSON 结构&＃xff0c;并通过整齐地排列所有内容来帮助保持文件可读。此模板以 Elasticsearch 和 Logstash 期望接收它们的方式格式化你的消息。这是它们的样子&＃xff1a;

{"&＃64;timestamp" : "2015-11-18T18:45:00Z","&＃64;version" : "1","message" : "Your syslog message here","sysloghost" : "hostname.example.com","severity" : "info","facility" : "daemon","programname" : "my_program","procid" : "1234" }

提示&＃xff1a;如果你想自定义日志数据&＃xff0c;rsyslog.com 文档会显示 rsyslog 中可用的变量。但是&＃xff0c;你必须以 JSON 格式将其发送到 Logstash&＃xff0c;然后再发送到 Elasticsearch。

正在发送的数据尚未使用此格式。下一步显示配置服务器以使用此模板文件。

配值中央服务器发送日志到 Logstash

现在我们有了定义正确 JSON 格式的模板文件&＃xff0c;让我们配置 rsyslog 中央服务器以将数据发送到 Logstash&＃xff0c;它在本教程的同一台服务器上。

启动时&＃xff0c;rsyslog 将查看 /etc/rsyslog.d 中的文件并从中创建其配置。让我们添加我们自己的配置文件来扩展配置。

创建 /etc/rsyslog.d/60-output.conf&＃xff1a;

sudo vi /etc/rsyslog.d/60-output.conf

将以下行复制到此文件&＃xff1a;

# This line sends all lines to defined IP address at port 10514, # using the "json-template" format template *.* &＃64;private_ip_logstash:10514;json-template

开头的 *.* 表示处理所有日志消息的行的其余部分。 &＃64; 符号表示使用 UDP&＃xff08;使用 &＃64;&＃64; 代替使用 TCP&＃xff09;。 &＃64; 后的 IP 地址或主机名是转发消息的位置。在我们的例子中&＃xff0c;我们使用 rsyslog 中央服务器的私有 IP 地址&＃xff0c;因为 rsyslog 中央服务器和 Logstash 服务器安装在同一台服务器上。这必须与您配置 Logstash 以在下一步中侦听的私有 IP 地址相匹配。

接下来是端口号。本教程使用端口 50515。请注意&＃xff0c;Logstash 服务器必须使用相同的协议侦听相同的端口。最后一部分是我们的模板文件&＃xff0c;它展示了如何在传递数据之前格式化数据。

不要重新启动 rsyslog。首先&＃xff0c;我们必须配置 Logstash 以接收消息。

配置 Logstash 以接收 JSON 信息

我们首先按照好 Logstash&＃xff0c;然后创建如下的配置文件&＃xff1a;

/etc/logstash/conf.d/syslog.conf

# pwd /etc/logstash/conf.d root&＃64;liuxgu:/etc/logstash/conf.d# ls syslog.conf

input {udp {host &＃61;> "logstash_private_ip"port &＃61;> 50515codec &＃61;> "json"type &＃61;> "rsyslog"} }output {elasticsearch {hosts &＃61;> ["https://elasticsearch_private_ip:9200"]user &＃61;> elasticpassword &＃61;> passwordssl_certificate_verification &＃61;> truecacert &＃61;> "/etc/logstash/config/certs/ca.crt"}# stdout { codec &＃61;> rubydebug } }

在上面&＃xff0c;你必须根据自己时间的 IP 地址进行替换。在上面&＃xff0c;我的 rsyslog 中央服务器及 Elasticsearch 都处于 192.168.0.4 这个 IP 地址的服务器上。如果你使用安全&＃xff0c;请按照上面的方式配置好证书。否则在上面的配置中&＃xff0c;安全的部分可以略去。在上面的配置中&＃xff0c;我们并没有使用任何的 filter 来对数据进行任何的处理。我们在 rsyslog 中已经采用 JSON template 对数据进行了结构化处理。如果我们需要对数据更进一步处理&＃xff0c;那么我们可以采用 filter 来操作。

根据定义&＃xff0c;系统日志协议是 UDP&＃xff0c;因此此配置反映了该标准。

在输入块中&＃xff0c;通过将 logstash_private_ip 替换为 rsyslog 服务器的私有 IP 地址来设置 Logstash 主机地址&＃xff0c;该服务器上也安装了 Logstash。

输入块将 Logstash 配置为侦听端口 50515&＃xff0c;因此它不会与同一台机器上的 syslog 实例竞争。小于 1024 的端口需要以 root 身份运行 Logstash&＃xff0c;这不是一个好的安全实践。

请务必将 elasticsearch_private_ip 替换为您的 Elasticsearch 服务器的私有 IP 地址。输出块显示了一个简单的条件配置。它的目标是只允许匹配的事件通过。在这种情况下&＃xff0c;这只是“类型”为“rsyslog”的事件。

我们可以使用如下的命令来启动 Logstash&＃xff1a;

sudo service logstash restart

或者使用如下的命令来重新启动 rsyslog&＃xff1a;

sudo service rsyslog restart

提示&＃xff1a;要对 Logstash 进行故障排除&＃xff0c;请使用 sudo service logstash stop 停止服务并在前台使用详细消息运行它&＃xff1a;

/opt/logstash/bin/logstash -f /etc/logstash/conf.d/logstash.conf --verbose

它将包含常用信息&＃xff0c;例如使用 Logstash 使用的 IP 地址和 UDP 端口进行验证&＃xff1a;

Starting UDP listener {:address&＃61;>"192.168.0.4:50515", :level&＃61;>:info}
验证数据采集

我们打开 Kibana。我们需要为采集进来的数据创建一个叫做 logstash-* 的索引模式。我们可以在 Discover 中查看已经被导入的数据&＃xff1a;

从上面&＃xff0c;我们可以看出来显示的字段确实是我们使用 JSON template 进行处理的结构化数据。

我们可以使用 telnet 向中央 Rsyslog 服务器发送一些数据。我们通过 telnet 连接到中央 Rsyslog 服务器&＃xff0c;并向它发送一些信息&＃xff1a;

telnet 192.168.0.4 514

在上面&＃xff0c;192.168.0.4 是我的 Rsyslog 中央服务器的地址。我们向它发送如下的日志信息&＃xff1a;

<30>Aug 4 10:52:20 cooltest logstash[13329]: "type" &＃61;> "rsyslog"

在上面&＃xff0c;我们把 sysloghost 的值置为 nice。等一会儿&＃xff0c;我们在 Kibana 的界面来进行搜索&＃xff1a;

我们可以在 /var/log/syslog 中查看到最新生成的 log 信息&＃xff1a;

在 Kibana 中&＃xff0c;我们可以查看到如下的信息&＃xff1a;

这说明&＃xff0c;我们的 Rsyslog 中央服务器是正常工作的。

结论

你的日志现在在 Elasticsearch 中。下一步是什么&＃xff1f; 考虑阅读 Kibana 可以做什么来可视化 Elasticsearch 中的数据&＃xff0c;包括折线图和条形图、饼图、地图等。 Kibana 101&＃xff1a;可视化入门解释了如何使用 Kibana Web 界面来搜索和可视化日志。

推荐阅读

filter
Nginx使用AWStats日志分析的步骤及注意事项

本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息，并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境，并进行DNS解析。 ... [详细]

蜡笔小新 2023-12-14 19:42:01
filter
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
filter
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
filter
计算机网络初识及通信流程分析

本文介绍了计算机网络的定义和通信流程，包括客户端编译文件、二进制转换、三层路由设备等。同时，还介绍了计算机网络中常用的关键词，如MAC地址和IP地址。 ... [详细]

蜡笔小新 2023-12-13 16:50:29
command
Webmin远程命令执行漏洞复现及防护方法

本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法，同时提供了防护方法。漏洞存在于Webmin的找回密码页面中，攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外，还指出了参考链接中的数据包不准确的问题，并解释了漏洞触发的条件。最后，给出了防护方法以避免受到该漏洞的攻击。 ... [详细]

蜡笔小新 2023-12-13 16:14:53
command
如何在服务器主机上实现文件共享的方法和工具

本文介绍了在服务器主机上实现文件共享的方法和工具，包括Linux主机和Windows主机的文件传输方式，Web运维和FTP/SFTP客户端运维两种方式，以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外，还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK，以及主机迁移服务会收集的源端服务器信息。 ... [详细]

蜡笔小新 2023-12-13 13:23:48
java
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
java
Linux下Kafka单机安装配置方法（实操成功）

本文介绍了在Linux下安装和配置Kafka的方法，包括安装JDK、下载和解压Kafka、配置Kafka的参数，以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例，帮助读者快速完成Kafka的安装和配置。 ... [详细]

蜡笔小新 2023-12-12 18:14:32
c语言
31.项目部署

目录1一些概念1.1项目部署1.2WSGI1.3uWSGI1.4Nginx2安装环境与迁移项目2.1项目内容2.2项目配置2.2.1DEBUG2.2.2STAT ... [详细]

蜡笔小新 2023-12-12 12:15:41
java
操作系统的定义和功能

本文介绍了操作系统的定义和功能，包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别，包括进程和线程的定义和作用。 ... [详细]

蜡笔小新 2023-12-11 14:17:13
java
centos安装Mysql的方法及步骤详解

本文介绍了centos安装Mysql的两种方式：rpm方式和绿色方式安装，详细介绍了安装所需的软件包以及安装过程中的注意事项，包括检查是否安装成功的方法。通过本文，读者可以了解到在centos系统上如何正确安装Mysql。 ... [详细]

蜡笔小新 2023-12-11 07:30:47
java
Linux下安装免费杀毒软件ClamAV及使用方法

本文介绍了在Linux系统下安装免费杀毒软件ClamAV的方法，并提供了使用该软件更新病毒库和进行病毒扫描的指令参数。同时还提供了官方安装文档和下载地址。 ... [详细]

蜡笔小新 2023-12-10 14:10:51
java
主从数据库架构配置及实验环境搭建方法

本文介绍了在Web应用系统中，数据库性能是导致系统性能瓶颈最主要的原因之一，尤其是在大规模系统中，数据库集群已经成为必备的配置之一。文章详细介绍了主从数据库架构的好处和实验环境的搭建方法，包括主数据库的配置文件修改和设置需要同步的数据库等内容。MySQL的主从复制功能在国内外大型网站架构体系中被广泛采用，本文总结了作者在实际的Web项目中的实践经验。 ... [详细]

蜡笔小新 2023-12-10 12:20:19
java
5个基本Linux命令行工具的现代化替代品

本文介绍了5个基本Linux命令行工具的现代化替代品，包括du、top和ncdu。这些替代品在功能上进行了改进，提高了可用性，并且适用于现代化系统。其中，ncdu是du的替代品，它提供了与du类似的结果，但在一个基于curses的交互式界面中，重点关注占用磁盘空间较多的目录。 ... [详细]

蜡笔小新 2023-12-09 20:30:48
command
如何使用readlink获取文件的完整路径？

本文介绍了使用readlink命令获取文件的完整路径的简单方法，并提供了一个示例命令来打印文件的完整路径。共有28种解决方案可供选择。 ... [详细]

蜡笔小新 2023-12-09 17:28:17

小时候V有时候

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章