ELK+Filebeat+Kafka+ZooKeeper构建海量日志分析平台(elk5.2+filebeat2.11)

作者：淘美国 | 来源：互联网 | 2023-05-30 15:02

ELKFilebeatKafkaZooKeeper构建海量日志分析平台参考：http:www.tuicool.comarticlesR77fieA我在做ELK日志平台

ELK&＃43;Filebeat&＃43;Kafka&＃43;ZooKeeper 构建海量日志分析平台

参考&＃xff1a;http://www.tuicool.com/articles/R77fieA

我在做ELK日志平台开始之初选择为ELK&＃43;Redis直接构建&＃xff0c;在采集nginx日志时一切正常&＃xff0c;当我采集我司业务报文日志类后&＃xff0c;logstash会报大量的redis connect timeout。换成redis cluster后也是同样的情况后&＃xff0c;就考虑对消息中间件进行替换重新选型&＃xff0c;经过各种刷文档&＃xff0c;决定选用kafka来替换redis。根据网上找的一篇参考文档中的架构图如下&＃xff1a;

注&＃xff1a;由于环境有限&＃xff0c;在对该架构图中的elasticsearch集群与logstash转发层进行了合并在一台服务器上。

架构解读 : &＃xff08;整个架构从左到右&＃xff0c;总共分为5层&＃xff09;&＃xff08;本文将第三层以下的进行了合并&＃xff0c;无elasticsearch集群&＃xff09;

第一层、数据采集层

最左边的是业务服务器集群&＃xff0c;上面安装了filebeat做日志采集&＃xff0c;同时把采集的日志分别发送给两个logstash服务。

第二层、数据处理层&＃xff0c;数据缓存层

logstash服务把接受到的日志经过格式处理&＃xff0c;转存到本地的kafka broker&＃43;zookeeper 集群中。

第三层、数据转发层

这个单独的Logstash节点会实时去kafka broker集群拉数据&＃xff0c;转发至ES DataNode。

第四层、数据持久化存储

ES DataNode 会把收到的数据&＃xff0c;写磁盘&＃xff0c;建索引库。

第五层、数据检索&＃xff0c;数据展示

ES Master &＃43; Kibana 主要协调 ES集群&＃xff0c;处理数据检索请求&＃xff0c;数据展示。

一、环境准备

操作系统环境:&＃xff08;测试环境统一为centos7;正式线上环境&＃xff1a;采集层、处理缓存层为centos6.5,转发层、持久层、检索展示层为centos7&＃xff09;&＃xff08;本文以实验环境进行撰写&＃xff09;

服务器角色分配&＃xff1a;

主机IP	角色	所属服务层	部署服务
192.168.11.11	日志生产	采集层	filebeat
192.168.11.12	日志缓存	数据处理层、缓存层	Zookeeper&＃43;kafka&＃43;logstash
192.168.11.13	日志缓存	数据处理层、缓存层	Zookeeper&＃43;kafka&＃43;logstash
192.168.11.14	日志展示	持久、检索、展示层	Logstash&＃43;elasticsearch&＃43;kibana

软件包版本:

jdk-8u112-linux-x64

filebeat-5.2.0-linux-x86_64

logstash-5.2.0

kafka_2.11-0.10.1.1

kibana-5.2.0-linux-x86_64

elasticsearch-5.2.0

zookeeper-3.4.9

二、部署安装

&＃xff08;一&＃xff09;、部署logstash&＃43;elasticsearch&＃43;kibana&＃xff08;持久、检索、展示层&＃xff09;

1、jdk解压部署

[webapp&＃64;localhost ~]$ tar -xzf jdk-8u112-linux-x64.tar.gz -C /data/webapp/

2、配置jdk环境变量

[webapp&＃64;localhost ~]$ cat .bash_profile

# .bash_profile

# Get the aliases and functions

if [ -f ~/.bashrc ]; then

. ~/.bashrc

# User specific environment and startup programs

export JAVA_HOME&＃61;/data/webapp/jdk1.8.0_112

PATH&＃61;$JAVA_HOME/bin:$PATH:$HOME/.local/bin:$HOME/bin

export PATH

3、系统调优

[webapp&＃64;localhost ~]$ vim /etc/sysctl.conf

fs.file-max&＃61;65536

vm.max_map_count &＃61; 262144

[webapp&＃64;localhost ~]$ vim /etc/security/limits.conf

* soft nofile 65535

* hard nofile 131072

* soft nproc 2048

* hard nproc 4096

4、解压部署logstash&＃43;elasticsearch&＃43;kibana

[webapp&＃64;localhost ~]$ unzip -d /data/webapp/ elasticsearch-5.2.0.zip

[webapp&＃64;localhost ~]$ tar -xzf logstash-5.2.0.tar.gz -C /data/webapp/

[webapp&＃64;localhost ~]$ tar -xzf kibana-5.2.0-linux-x86_64.tar.gz -C /data/webapp/

4.1、配置logstash的配置文件

[webapp&＃64;localhost ~]$ cd /data/webapp/logstash-5.2.0/config/

[webapp&＃64;localhost config]$ vim logstash_to_es.conf

input {

kafka {

bootstrap_servers &＃61;> "192.168.11.12:9092,192.168.11.13:9092"

topics &＃61;> ["ecplogs"]

}

output {

elasticsearch {

hosts &＃61;> ["192.168.11.14:9200"]

index &＃61;> "ecp-log-%{&＃43;YYYY.MM.dd}"

flush_size &＃61;> 20000

idle_flush_time &＃61;> 10

template_overwrite &＃61;> true

}

注&＃xff1a;["ecplogs"]此字段是kafka的消息主题&＃xff0c;后边在部署kafka后需要创建

4.2、配置logstash的启动脚本

[webapp&＃64;localhost config]$ cd ../bin/

[webapp&＃64;localhost bin]$ vim start-logstash.sh

#!/bin/bash

export JAVA_HOME&＃61;/data/webapp/jdk1.8.0_112

export JRE_HOME&＃61;/data/webapp/jdk1.8.0_112/jre

export CLASSPATH&＃61;$JAVA_HOME/lib:$JRE_HOME/lib:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH&＃61;$JAVA_HOME/bin:$PATH

/data/webapp/logstash-5.2.0/bin/logstash　-f /data/webapp/logstash-5.2.0/config/logstash_to_es.conf > /dev/null &

4.3、配置elasticsearch的配置文件

[webapp&＃64;localhost ~]$ cd /data/webapp/elasticsearch-5.2.0/config/

[webapp&＃64;localhost config]$ vim elasticsearch.yml

node.name:elk1

path.data:/data/webapp/elk_data

path.logs:/data/webapp/elk_data

network.host: 192.168.11.14

http.port: 9200

4.4、配置JVM&＃xff08;正式环境不需要&＃xff0c;测试环境内存较小需要更改&＃xff0c;将2g改为512M&＃xff09;

[webapp&＃64;localhost config]$ vim jvm.options

-Xms512m

-Xmx512m

4.5、配置Kibana的配置文件

[webapp&＃64;localhost ~]$ cd /data/webapp/kibana-5.2.0-linux-x86_64/config/

[webapp&＃64;localhost config]$ vim kibana.yml

server.port: 5601

server.host: "192.168.11.14"

elasticsearch.url: "http://192.168.11.14:9200"

&＃xff08;二&＃xff09;、部署Zookeeper&＃43;kafka&＃43;logstash&＃xff08;双机集群缓存处理层&＃xff0c;正式环境建议三台&＃xff09;

1、部署zookeeper集群

[webapp&＃64;localhost ~]$ tar -xzf zookeeper-3.4.9.tar.gz -C /data/webapp/

[webapp&＃64;localhost ~]$ cd /data/webapp/zookeeper-3.4.9/conf/

[webapp&＃64;localhost conf]$ cp zoo_sample.cfg zoo.cfg

[webapp&＃64;localhost conf]$ vim zoo.cfg

dataDir&＃61;/data/webapp/zookeeper-3.4.9/zookeeper

server.1&＃61;192.168.11.12:12888:13888

server.2&＃61;192.168.11.13:12888:13888

[webapp&＃64;localhost conf]$ echo 1 > /data/webapp/zookeeper-3.4.9/zookeeper/myid

注&＃xff1a;在另外一台配置文件相同&＃xff0c;只需要将myid重置为2

[webapp&＃64;localhost conf]$ echo 2 > /data/webapp/zookeeper-3.4.9/zookeeper/myid

2、启动zookeeper服务&＃xff08;在两台服务器中都启动&＃xff09;

[webapp&＃64;localhost zookeeper-3.4.9]$ bin/zkServer.sh start

2.1、查看两台zookeeper集群状态

[webapp&＃64;localhost zookeeper-3.4.9]$ bin/zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /data/webapp/zookeeper-3.4.9/bin/../conf/zoo.cfg

Mode: follower

[webapp&＃64;localhost zookeeper-3.4.9]$ bin/zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /data/webapp/zookeeper-3.4.9/bin/../conf/zoo.cfg

Mode: leader

3、配置kafka集群

[webapp&＃64;localhost ~]$ tar -xzf kafka_2.11-0.10.1.1.tgz -C /data/webapp/

[webapp&＃64;localhost ~]$ cd /data/webapp/kafka_2.11-0.10.1.1/config/

[webapp&＃64;localhost config]$ vim server.properties

broker.id&＃61;1

port &＃61; 9092

host.name &＃61; 192.168.11.12

log.dirs&＃61;/data/webapp/kafka-logs

log.retention.hours&＃61;1

zookeeper.connect&＃61;192.168.11.12:2181,192.168.11.13:2181

default.replication.factor&＃61;2

注&＃xff1a;两台集群配置只需要将broker.id、host.name进行修改&＃xff0c;其它一致。

[webapp&＃64;localhost config]$ vim server.properties

broker.id&＃61;2

host.name &＃61; 192.168.11.13

4、启动kafka集群&＃xff08;在两台服务器中都启动&＃xff09;

[webapp&＃64;localhost kafka_2.11-0.10.1.1]$　bin/kafka-server-start.sh -daemon config/server.properties

4.1、创建消息主题

[webapp&＃64;localhost kafka_2.11-0.10.1.1]$　bin/kafka-topics.sh --create --zookeeper 192.168.11.11:2181 --replication-factor 1 --partitions 2 --topic ecplogs

4.2、测试消息生产与消费

在主机192.168.11.13上进行消息消费

[webapp&＃64;localhost kafka_2.11-0.10.1.1]$　/data/webapp/kafka_2.11-0.10.1.1/bin/kafka-console-consumer.sh --zookeeper 192.168.11.11:2181 --topic ecplogs --from-beginning

在主机192.168.11.12上进行消息生产&＃xff1a;

[webapp&＃64;localhost kafka_2.11-0.10.1.1]$　bin/kafka-console-producer.sh --broker-list 192.168.11.11:9092 --topic ecplogs

在此终端中输入数据&＃xff0c;会在192.168.11.13终端上进行显示出来。那么kafka功能正常。

5、配置logstash

5.1配置logstash的配置文件

[webapp&＃64;localhost ~]$ tar -xzf logstash-5.2.0.tar.gz -C /data/webapp/

[webapp&＃64;localhost ~]$ cd /data/webapp/logstash-5.2.0/config/

[webapp&＃64;localhost config]$ vim logstash_in_filebeat.conf

input {

beats {

port &＃61;> 5044

}

output {

kafka {

bootstrap_servers &＃61;> "192.168.11.12:9092,192.168.11.13:9092"

topic_id &＃61;> "ecplogs"

}

5.2配置Logstash启动脚本&＃xff08;如4.2&＃xff09;

&＃xff08;三&＃xff09;、部署filebeat&＃xff08;日志采集&＃xff09;

1、解压部署

[webapp&＃64;localhost ~]$ tar -xzf filebeat-5.2.0-linux-x86_64.tar.gz -C /data/webapp/

2、配置filebeat配置文件

[webapp&＃64;localhost ~]$ cd /data/webapp/filebeat-5.2.0-linux-x86_64/

[webapp&＃64;localhost filebeat-5.2.0-linux-x86_64]$ vim filebeat.yml

filebeat.prospectors:

- input_type: log

paths:

- /data/logs/ecplog.log

multiline.pattern: ^请

multiline.negate: true

multiline.match: after

output.logstash:

hosts: ["192.168.11.13:5044"]

注解&＃xff1a;该配置文件格式参照yml型&＃xff0c;multiline.x配置项为多行合并规则&＃xff0c;如无&＃xff0c;可以不用配置

3、启动filebeat

[webapp&＃64;localhost filebeat-5.2.0-linux-x86_64]$ nohup ./filebeat -c filebeat.yml > /dev/null &

&＃xff08;四&＃xff09;各环节服务器启动与数据追踪

1、启动192.168.11.12/13服务器上的logstash

[webapp&＃64;localhost ~]$ /data/webapp/logstash-5.2.0/bin/start-logstash.sh

2、在192.168.11.12/13终端上进行日志消费测试

[webapp&＃64;localhost kafka_2.11-0.10.1.1]$　/data/webapp/kafka_2.11-0.10.1.1/bin/kafka-console-consumer.sh --zookeeper 192.168.11.11:2181 --topic ecplogs --from-beginning

注&＃xff1a;如果配置正常&＃xff0c;该两终端中会都会源源不断的输出/data/logs/ecplog.log的日志数据。

3、启动192.168.11.14服务器上的logstash&＃43;es&＃43;kibana

4、测试es数据索引

[webapp&＃64;localhost ~]$ curl "http://192.168.11.14:9200/ecplogs-2017.02.09"

注&＃xff1a;如果配置正常&＃xff0c;curl出来的是有数据的&＃xff0c;而非404类

5、通过web展示&＃xff0c;访问http://192.168.11.14:5601

6、Kibanad页面配置&＃xff08;略&＃xff09;

转载于:https://www.cnblogs.com/delgyd/p/elk.html

推荐阅读

byte
HTTP header 介绍

HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写，它用于传送www方式的数据。HTTP协议采用了请求响应模型。客服端向服务器发送一 ... [详细]

蜡笔小新 2024-11-14 09:13:00
search
Linux 环境下 Java 及相关软件的安装指南

本文详细介绍了如何在 Linux 系统上安装 JDK 1.8、MySQL 和 Redis，并提供了相应的环境配置和验证步骤。 ... [详细]

蜡笔小新 2024-11-13 18:10:16
include
CentOS 7 中配置开机自动挂载 NFS 的解决方案

本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法，并解决了常见的配置失败问题。 ... [详细]

蜡笔小新 2024-11-13 12:05:24
post
在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧

在 CentOS 7 环境中安装和配置 Redis 时，需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程，并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外，还探讨了如何优化性能和确保数据安全，帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]

蜡笔小新 2024-11-11 18:27:44
import
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08
byte
Java Socket 关键参数详解与优化建议

Java Socket 的 API 虽然被广泛使用，但其关键参数的用途却鲜为人知。本文详细解析了 Java Socket 中的重要参数，如 backlog 参数，它用于控制服务器等待连接请求的队列长度。此外，还探讨了其他参数如 SO_TIMEOUT、SO_REUSEADDR 等的配置方法及其对性能的影响，并提供了优化建议，帮助开发者提升网络通信的稳定性和效率。 ... [详细]

蜡笔小新 2024-11-09 21:38:05
io
Kafka安装与配置深度解析：程序员必备指南

Kafka 是由 Apache 软件基金会开发的高性能分布式消息系统，支持高吞吐量的发布和订阅功能，主要使用 Scala 和 Java 编写。本文将深入解析 Kafka 的安装与配置过程，为程序员提供详尽的操作指南，涵盖从环境准备到集群搭建的每一个关键步骤。 ... [详细]

蜡笔小新 2024-11-07 12:22:05
io
Jeecg开源社区启动第12届架构技术培训班，现正式开放报名通道

Jeecg开源社区正式启动第12届架构技术培训班，现已开放报名。本次培训采用师徒制模式，深入探讨Java架构技术。类似于大学导师指导研究生的方式，特别适合在职人员。导师将为学员布置课题，提供丰富的视频资料，并进行一对一指导，帮助学员高效学习和完成任务。我们的教学方法注重实践与理论结合，旨在培养学员的综合技术能力。 ... [详细]

蜡笔小新 2024-11-06 10:35:24
io
一文了解消息中间件RabbitMQ

消息中间件---RabbitMQ1消息中间件的作用2.常用的消息中间件3消息中间件RabbitMQ3.1RabbitMQ介绍3.3RabbitMQ的队列模式3.3RabbitMQ的 ... [详细]

蜡笔小新 2024-10-17 09:26:04
io
Linux中activemq的安装

1.tarzxfapache-activemq-5.12.0-bin.tar.gztarzxfapache-activemq-5.12.0-bin.tar.gz2.cdapac ... [详细]

蜡笔小新 2024-11-14 11:39:24
io
Web服务器与MySQL服务器分离配置疑问

在将Web服务器和MySQL服务器分离的情况下，是否需要在Web服务器上安装MySQL？如果安装了MySQL，如何解决PHP连接MySQL服务器时出现的连接失败问题？ ... [详细]

蜡笔小新 2024-11-13 23:06:58
io
Linux 计划任务 Cron 的使用与管理

本文介绍了 Linux 系统中用于定期执行任务的 cron 服务及其配置方法。通过 crond 和 crontab 命令，用户可以轻松地安排系统和用户级别的周期性任务。 ... [详细]

蜡笔小新 2024-11-13 13:40:11
email
Git命令基础应用指南

本指南详细介绍了Git命令的基础应用，包括如何使用`git clone`从远程服务器克隆仓库（例如：`git clone [url/path/repository]`）以及如何克隆本地仓库（例如：`git clone [local/path/repository]`）。此外，还提供了常见的Git操作技巧，帮助开发者高效管理代码版本。 ... [详细]

蜡笔小新 2024-11-11 09:19:38
io
《Linux高性能服务器编程》深入解析：3.2 TCP报头结构与功能

在《Linux高性能服务器编程》一书中，第3.2节深入探讨了TCP报头的结构与功能。TCP报头是每个TCP数据段中不可或缺的部分，它不仅包含了源端口和目的端口的信息，还负责管理TCP连接的状态和控制。本节内容详尽地解析了TCP报头的各项字段及其作用，为读者提供了深入理解TCP协议的基础。 ... [详细]

蜡笔小新 2024-11-10 14:18:44
io
如何通过登录PHP网站实现校园内外差异化访问：内部免费而外部需付费

该大学网站采用PHP和MySQL技术，在校内可免费访问某些外部收费资料数据库。为了方便学生校外访问，建议通过学校账号登录实现免费访问。具体方案可包括利用学校服务器作为代理，结合身份验证机制，确保合法用户在校外也能享受免费资源。 ... [详细]

蜡笔小新 2024-11-10 03:11:33

淘美国

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章