kubernetes日志收集

作者：劲舞团之舞之精灵_559 | 来源：互联网 | 2023-06-17 09:03

本文日志收集流程：k8s使用daemonset创建filebeat服务；filebeat发送日志到kafka；logstash收集kaf

本文日志收集流程&＃xff1a;

k8s 使用 daemonset 创建 filebeat 服务&＃xff1b;
filebeat 发送日志到 kafka&＃xff1b;
logstash 收集 kafka 接收到的日志&＃xff1b;
logstash 发送日志到 ES&＃xff1b;
kibana 从 ES 提取日志并展示。

其中除filebeat是搭建在k8s中外&＃xff0c;其他组件均使用宿主机或docker搭建

一、部署kafka

参考文章&＃xff1a;Dokcer 搭建 kafka_我的喵叫初六的博客-CSDN博客pull镜像docker pull wurstmeister/zookeeperdocker pull wurstmeister/kafka安装zookeeper我这里做了资源限制docker run -d \--name zookeeper \-p 2181:2181 \--memory&＃61;1024m --cpus&＃61;1 \-t wurstmeister/zookeeper安装kafkadocker run -d \--name kafka \-p 9092https://blog.csdn.net/weixin_38367535/article/details/121103419

二、部署logstash、ES、kibana

参考文章&＃xff1a;ELK &＃43; Filebeat 7.13_我的喵叫初六的博客-CSDN博客之前编写过低版本的ELK日志收集&＃xff0c;最近换公司&＃xff0c;部署了一套单节点7.13版本ELK&＃xff0c;7.13版本较之前6.x版本还是有很大区别的。一、环境ELK部署在同一台Centos7.9服务器上Filebeat用于收集nginx日志java日志使用的是阿里云NAS共享存储&＃xff0c;所以直接将日志目录挂载到了ELK服务器上JDK 1.8二、下载安装1、下载# elasticsearchwget https://artifacts.elastic.co/downloads/elasti..https://blog.csdn.net/weixin_38367535/article/details/119183688

三、部署filebeat

下载 filebeat yaml 文件

curl -L -O https://raw.githubusercontent.com/elastic/beats/master/deploy/kubernetes/filebeat-kubernetes.yaml

文件内容&＃xff1a;

# cat filebeat-kubernetes.yaml--- apiVersion: v1 kind: ConfigMap metadata:name: filebeat-confignamespace: kube-systemlabels:k8s-app: filebeat data:filebeat.yml: |-filebeat.inputs:- type: containerpaths:- /var/log/containers/*.logprocessors:- add_kubernetes_metadata:host: ${NODE_NAME}matchers:- logs_path:logs_path: "/var/log/containers/"# To enable hints based autodiscover, remove &＃96;filebeat.inputs&＃96; configuration and uncomment this:#filebeat.autodiscover:# providers:# - type: kubernetes# node: ${NODE_NAME}# hints.enabled: true# hints.default_config:# type: container# paths:# - /var/log/containers/*${data.kubernetes.container.id}.logprocessors:- add_cloud_metadata:- add_host_metadata:cloud.id: ${ELASTIC_CLOUD_ID}cloud.auth: ${ELASTIC_CLOUD_AUTH}output.kafka:enabled: truehosts: ["172.16.105.148:9092"]topic: &＃39;k8s-uat-log&＃39;max_message_bytes: 5242880partition.round_robin:reachable_only: truekeep-alive: 120required_acks: 1 --- apiVersion: apps/v1 kind: DaemonSet metadata:name: filebeatnamespace: kube-systemlabels:k8s-app: filebeat spec:selector:matchLabels:k8s-app: filebeattemplate:metadata:labels:k8s-app: filebeatspec:serviceAccountName: filebeatterminationGracePeriodSeconds: 30hostNetwork: truednsPolicy: ClusterFirstWithHostNetcontainers:- name: filebeatimage: docker.elastic.co/beats/filebeat:7.4.2args: ["-c", "/etc/filebeat.yml","-e",]env:- name: ELASTICSEARCH_HOSTvalue: elasticsearch- name: ELASTICSEARCH_PORTvalue: "9200"- name: ELASTICSEARCH_USERNAMEvalue: elastic- name: ELASTICSEARCH_PASSWORDvalue: changeme- name: ELASTIC_CLOUD_IDvalue:- name: ELASTIC_CLOUD_AUTHvalue:- name: NODE_NAMEvalueFrom:fieldRef:fieldPath: spec.nodeNamesecurityContext:runAsUser: 0# If using Red Hat OpenShift uncomment this:#privileged: trueresources:limits:memory: 200Mirequests:cpu: 100mmemory: 100MivolumeMounts:- name: configmountPath: /etc/filebeat.ymlreadOnly: truesubPath: filebeat.yml- name: datamountPath: /usr/share/filebeat/data- name: varlibdockercontainersmountPath: /var/lib/docker/containersreadOnly: true- name: varlogmountPath: /var/logreadOnly: truevolumes:- name: configconfigMap:defaultMode: 0640name: filebeat-config- name: varlibdockercontainershostPath:path: /var/lib/docker/containers- name: varloghostPath:path: /var/log# data folder stores a registry of read status for all files, so we don&＃39;t send everything again on a Filebeat pod restart- name: datahostPath:# When filebeat runs as non-root user, this directory needs to be writable by group (g&＃43;w).path: /var/lib/filebeat-datatype: DirectoryOrCreate --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata:name: filebeat subjects: - kind: ServiceAccountname: filebeatnamespace: kube-system roleRef:kind: ClusterRolename: filebeatapiGroup: rbac.authorization.k8s.io --- apiVersion: rbac.authorization.k8s.io/v1 kind: RoleBinding metadata:name: filebeatnamespace: kube-system subjects:- kind: ServiceAccountname: filebeatnamespace: kube-system roleRef:kind: Rolename: filebeatapiGroup: rbac.authorization.k8s.io --- apiVersion: rbac.authorization.k8s.io/v1 kind: RoleBinding metadata:name: filebeat-kubeadm-confignamespace: kube-system subjects:- kind: ServiceAccountname: filebeatnamespace: kube-system roleRef:kind: Rolename: filebeat-kubeadm-configapiGroup: rbac.authorization.k8s.io --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRole metadata:name: filebeatlabels:k8s-app: filebeat rules: - apiGroups: [""] # "" indicates the core API groupresources:- namespaces- pods- nodesverbs:- get- watch- list - apiGroups: ["apps"]resources:- replicasetsverbs: ["get", "list", "watch"] --- apiVersion: rbac.authorization.k8s.io/v1 kind: Role metadata:name: filebeat# should be the namespace where filebeat is runningnamespace: kube-systemlabels:k8s-app: filebeat rules:- apiGroups:- coordination.k8s.ioresources:- leasesverbs: ["get", "create", "update"] --- apiVersion: rbac.authorization.k8s.io/v1 kind: Role metadata:name: filebeat-kubeadm-confignamespace: kube-systemlabels:k8s-app: filebeat rules:- apiGroups: [""]resources:- configmapsresourceNames:- kubeadm-configverbs: ["get"] --- apiVersion: v1 kind: ServiceAccount metadata:name: filebeatnamespace: kube-systemlabels:k8s-app: filebeat ---

文件并未做过多修改&＃xff0c;主要有镜像版本&＃xff0c;我拉取文件的时候&＃xff0c;文件中的filebeat版本是8.0&＃xff0c;拉取失败了所以改成了7.4.2版本

pod cpu处建议做个限制&＃xff0c;否则发生错误可能会占用很大cpu

另外就是删除了output部分&＃xff0c;删除了原文的输出到ES&＃xff0c;改为kafka

output.kafka:enabled: truehosts: ["172.16.105.148:9092"]topic: &＃39;k8s-uat-log&＃39;max_message_bytes: 5242880partition.round_robin:reachable_only: truekeep-alive: 120required_acks: 1

注意这里的topci必须提前在kafka中创建一下。

启动pod&＃xff1a; kubectl apply -f filebeat-kubernetes.yaml

pod状态正常后查看日志&＃xff0c;出现2021-11-03T03:47:39.954Z INFO [monitoring] log/log.go:145 Non-zero metrics in the last 30s {"monitoring":xxxxxxxxx等字样表示已经发送给kafka了

这时我们去kafka查看一下

kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic k8s-uat-log --from-beginning

这段命令在kafka服务器上执行

出现快速滚动的日志信息即表示已经接收到来自filebeat的日志了&＃xff0c;记得快点ctrl c。。。

四、配置logstash

cat config/k8s-uat-log.confinput {kafka {bootstrap_servers &＃61;> ["172.16.105.148:9092"]client_id &＃61;> "k8s-uat-log1"group_id &＃61;> "host_log"auto_offset_reset &＃61;> "latest"consumer_threads &＃61;> 5decorate_events &＃61;> truetopics &＃61;> ["k8s-uat-log"]type &＃61;> "k8s-uat-log"codec &＃61;> json} }filter {mutate {remove_field &＃61;> ["&＃64;metadata","ecs","stream","input","log","pod-template-hash","uid","architecture","containerized","hostname","os","agent"] # 删除字段} }output {if [type] &＃61;&＃61; "k8s-uat-log" {elasticsearch{hosts &＃61;> ["127.0.0.1:9200"]index &＃61;> "k8s-uat-log-%{&＃43;YYYY.MM.dd}"timeout &＃61;> 300}} }

input处指定kafka

client_id 自定义写

group_id 这个用来做logstash负载用的&＃xff0c;比如你想多启动一个logstash收集同样的这个日志&＃xff0c;那么group_id必须一致&＃xff0c;client_id不同

多台logstash实例消费同一个topics时&＃xff0c;需要保证kafka的分区不能只有一个&＃xff0c;logstash的实例数不能大于kafka的分区数。

auto_offset_reset &＃61;> "latest" 从最后提交的offset开始消费&＃xff0c;避免logstash重启后从头消费&＃xff0c;浪费资源数据重复

topics 指定 kafka topic

type 用于output部分匹配&＃xff0c;多个input可以使用不同的type&＃xff0c;达到output区分发送

codec 使用json格式

filter处使用了删除字段配置&＃xff0c;这里你可以去掉&＃xff0c;看自己需要啥就留什么

启动logstash

logstash日志出现to the committed offset FetchPosition{offset&＃61;104940字样表示启动成功&＃xff0c;这里的offset就是上面 auto_offset_reset &＃61;> "latest" 配置相关的字段

五、查看结果

打开kibana添加索引输入k8s-uat能出现自动匹配的日期索引就表示logstash已将日志发送到ES中了&＃xff0c;配置好索引后日志收集工作就全部完成了。

推荐阅读

scala
Kafka安装与配置深度解析：程序员必备指南

Kafka 是由 Apache 软件基金会开发的高性能分布式消息系统，支持高吞吐量的发布和订阅功能，主要使用 Scala 和 Java 编写。本文将深入解析 Kafka 的安装与配置过程，为程序员提供详尽的操作指南，涵盖从环境准备到集群搭建的每一个关键步骤。 ... [详细]

蜡笔小新 2024-11-07 12:22:05
jar
CentOS 7环境下Jenkins的安装与前后端应用部署详解

CentOS 7环境下Jenkins的安装与前后端应用部署详解 ... [详细]

蜡笔小新 2024-11-04 16:46:02
tree
【并发编程】全面解析 Java 内存模型，一篇文章带你彻底掌握

本文深入解析了 Java 内存模型（JMM），从基础概念到高级特性进行全面讲解，帮助读者彻底掌握 JMM 的核心原理和应用技巧。通过详细分析内存可见性、原子性和有序性等问题，结合实际代码示例，使开发者能够更好地理解和优化多线程并发程序。 ... [详细]

蜡笔小新 2024-11-02 09:09:51
jar
Android中将独立SO库封装进JAR包并实现SO库的加载与调用

在Android开发中，将独立的SO库封装进JAR包并实现其加载与调用是一个常见的需求。本文详细介绍了如何将SO库嵌入到JAR包中，并确保在外部应用调用该JAR包时能够正确加载和使用这些SO库。通过这种方式，开发者可以更方便地管理和分发包含原生代码的库文件，提高开发效率和代码复用性。文章还探讨了常见的问题及其解决方案，帮助开发者避免在实际应用中遇到的坑。 ... [详细]

蜡笔小新 2024-11-07 14:28:55
export
Kafka 集群的高效部署与优化策略

本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤，包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践，涵盖节点选择、网络优化和性能调优等方面，旨在提升系统的稳定性和处理能力。此外，还提供了常见的故障排查方法和监控方案，帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]

蜡笔小新 2024-11-06 20:37:50
version
求助：在CentOS 5.8系统上安装PECL扩展遇到问题

在 CentOS 5.8 系统上尝试安装 APC 扩展时遇到了问题，具体表现为 PECL 工具无法正常工作。为了确保顺利安装，需要解决 PECL 的相关依赖和配置问题。建议检查 PHP 和 PECL 的版本兼容性，并确保所有必要的库和开发工具已正确安装。此外，可以尝试手动下载 APC 扩展的源代码并进行编译安装，以绕过 PECL 工具的限制。 ... [详细]

蜡笔小新 2024-11-06 16:57:24
web
FastDFS Nginx 扩展模块的源代码解析与技术剖析

FastDFS Nginx 扩展模块的源代码解析与技术剖析 ... [详细]

蜡笔小新 2024-11-04 20:15:18
web
项目开发中不可或缺的Linux命令详解

在项目开发过程中，掌握一些关键的Linux命令至关重要。例如，使用 `Ctrl+C` 可以立即终止当前正在执行的命令；通过 `ps -ef | grep ias` 可以查看特定服务的进程信息，包括进程ID（PID）和JVM参数（如内存分配和远程连接端口）；而 `netstat -apn | more` 则用于显示网络连接状态，帮助开发者监控和调试网络服务。这些命令不仅提高了开发效率，还能有效解决运行时的各种问题。 ... [详细]

蜡笔小新 2024-11-03 13:59:27
jar
分布式开源任务调度框架 TBSchedule 深度解析与应用实践

本文深入解析了分布式开源任务调度框架 TBSchedule 的核心原理与应用场景，并通过实际案例详细介绍了其部署与使用方法。首先，从源码下载开始，详细阐述了 TBSchedule 的安装步骤和配置要点。接着，探讨了该框架在大规模分布式环境中的性能优化策略，以及如何通过灵活的任务调度机制提升系统效率。最后，结合具体实例，展示了 TBSchedule 在实际项目中的应用效果，为开发者提供了宝贵的实践经验。 ... [详细]

蜡笔小新 2024-11-02 11:59:52
select
2019年后蚂蚁集团与拼多多面试经验详述与深度剖析

2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]

蜡笔小新 2024-10-30 17:30:06
select
技术日志：深入探讨Spark Streaming与Spark SQL的融合应用

技术日志：深入探讨Spark Streaming与Spark SQL的融合应用 ... [详细]

蜡笔小新 2024-10-30 14:20:53
select
深入解析IO复用技术及其在C10K问题中的应用

本文深入探讨了IO复用技术的原理与实现，重点分析了其在解决C10K问题中的关键作用。IO复用技术允许单个进程同时管理多个IO对象，如文件、套接字和管道等，通过系统调用如`select`、`poll`和`epoll`，高效地处理大量并发连接。文章详细介绍了这些技术的工作机制，并结合实际案例，展示了它们在高并发场景下的应用效果。 ... [详细]

蜡笔小新 2024-10-29 18:24:19
web
全面解析JavaScript代码注释技巧与标准规范

在Web前端开发中，JavaScript代码的可读性和维护性至关重要。本文将详细介绍如何有效地使用注释来提高代码的可读性，并探讨JavaScript代码注释的最佳实践和标准规范。通过合理的注释，开发者可以更好地理解和维护复杂的代码逻辑，提升团队协作效率。 ... [详细]

蜡笔小新 2024-11-10 15:16:18
web
在CentOS系统中部署与配置ZooKeeper详解

在CentOS系统中部署与配置ZooKeeper详解 ... [详细]

蜡笔小新 2024-11-06 19:44:56
select
分布式一致性算法：Paxos 的企业级实战

一、简介首先我们这个平台是ES专题技术的分享平台，众所周知，ES是一个典型的分布式系统。在工作和学习中，我们可能都已经接触和学习过多种不同的分布式系统了，各 ... [详细]

蜡笔小新 2024-10-21 16:29:21

劲舞团之舞之精灵_559

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章