关于logstash导入es库的配置文件的一些理解

作者：胡慧君孟勋欣怡 | 来源：互联网 | 2023-05-17 15:58

参数类型是否必选默认值描述add_fieldhashNo{}在事件中加入一个fieldclose_oldernumberNo3600一个已经监听中的文件，如果超过这个值的时

参数	类型	是否必选	默认值	描述
add_field	hash	No	{}	在事件中加入一个field
close_older	number	No	3600	一个已经监听中的文件，如果超过这个值的时间内没有更新内容，就关闭监听它的文件句柄。默认是3600秒，即一个小时。【时间点短】
codec	codec	No	"plain"	codec用于输入的数据，在数据进入到ipnput之前，可以使用input codecs对数据进行解码，从而省去了使用单独的filter来完成这项工作
delimiter	string	No	"\n"	设置行与行之间的分隔符，默认使用”\n“
discover_interval	number	No	15	设置logstash每隔多久去检查一次被监听的path下是否有新文件。默认值是15秒
exclude	array	No		不想被监听的文件可以排除出去，这里跟path 一样支持glob展开
ignore_older	number	No	86400	在每次检查文件列表的时候，如果一个文件的最后修改时间超过这个值，就忽略这个文件。默认是86400秒，即一天
max_open_files	number	No		配置当前input可以监控的文件（句柄）的最大值。当我们需要处理的文件大于这个参数的值时，使用close_older参数将一些文件关闭
path	array	Yes		用来设置要监控的input目标文件的文件路径，可以使用通配符的方式描述文件路径，如/var/log/.log。如果设置的值为/var/log//.log, 会在/var/log路径下，递归的寻找后缀为log的目标文件
sincedb_path	string	No		如果你不想用默认的$HOME/.sincedb（windows平台上在C:\Windows\System32\Config\systemprpfile.sincedb），可以通过这个配置定义sincedb文件到其他位置
sincedb_write_interval	number	No	15	logstash 每隔多久写一次sincedb文件，默认是15秒
start_position	string, "beginning"或“end”	No	“end“	logstash 从什么位置开始去读文件数据，默认是结束位置，也就是说logstash进程会以类似tail -F 的形式运行。如果你是要导入原始数据，把这个设置改为“beginning”，Logstash进程就从头开始读取，有点类似cat，但是读到最后一行不会终止，而是继续变成 tail -F。
stat_interval	number	No	1	logstash每隔多久检查一次被监听文件的状态（是否有更新），默认是1秒
tags	array	No		添加一个任意的数字作为当前事件的标签，这个标签对我们后续的工作会有帮助
type	string	No		input的所有事件都需要添加一个type属性，types属性主要在filter场景中使用。type会作为事件的一部分进行存储，因此后续也可以用type作为关键字在kibana中搜索

这个表格对于配置文件来说已经挺全的了，说一下自己的理解和实验得到的结果。logstash是默认每隔多少秒监听你要导入的文件是否增添了新的内容的。对于一个全新的待导入的文件，他会从头开始导入，并且创建一个 <文件inode，已写入的字节数>这样的一个记录，方便记录已经导入了多少数据到es库中，同时sincedb_path可以指定这个记录存放的位置。但是如果你把这个位置删了，再运行一遍logstash，好像没有什么影响，它照样能按照之前的情况给你重新把记录拷贝了，所以我把索引、sindb_path指定的文件删除，再重新运行logstash，想重新导入原来删除的文件到es库里头，没有任何变化，可能logstash认为我们已经把这个文件导了多少字节进入es库了吧。所以这种情况，我觉得应该是把文件拷贝一份，导入拷贝后的文件入到es库里头，因为拷贝后的文件inode就变化了嘛。别的方法暂时还没想到，但是肯定有。

关于使用logstash将日志数据增量导入es库中，对于全新的日志文件，logstash是从开头开始导入的，但是对于已经写入一部分的日志文件，过了一段时间后日志文件又写入了一些数据，logstash能够自动监测到日志文件的变化并进行导入es库，它根据的机制应该就是<文件inode，已写入的字节数>这样的一个记录。自动进行监听，每当发现已写入的字数小于文件的大小了，就开始自动进行导入，从已写入的字节数之后的字节进行导入。

所以这部分的配置文件，我认为最终要的是 input部分要有path（指明文件路径），codec=>json（解析日志的json格式），start_postion没有必要了（因为对于全新的文件他会自动从头开始导入，而对于已经导入的文件则会依据那个记录从上次导入之后的位置对新的东西导入），sindb_path也没有必要（除非是指定/dev/null这样的）；output部分：指明elasticsearch 以及他的host和index就行了 ,stdout部分可以指明一下codec=>rubydebug作为验证导入的文件导入没

推荐阅读

web
ElasticStack 日志监控：Logstash 编码插件详解与生产环境应用实例分析

在ElasticStack日志监控系统中，Logstash编码插件自5.0版本起进行了重大改进。插件被独立拆分为gem包，每个插件可以单独进行更新和维护，无需依赖Logstash的整体升级。这不仅提高了系统的灵活性和可维护性，还简化了插件的管理和部署过程。本文将详细介绍这些编码插件的功能、配置方法，并通过实际生产环境中的应用案例，展示其在日志处理和监控中的高效性和可靠性。 ... [详细]

蜡笔小新 2024-11-09 19:27:28
ip
技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告

技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]

蜡笔小新 2024-11-07 14:33:19
text
Spring 高级教程（15）：Spring AOP（3）—— 使用注解配置切面（1）：方法执行前后的增强处理

本文介绍了如何在Spring框架中使用AspectJ实现AOP编程，重点讲解了通过注解配置切面的方法，包括方法执行前和方法执行后的增强处理。阅读本文前，请确保已安装并配置好AspectJ。 ... [详细]

蜡笔小新 2024-11-15 15:57:13
replace
vue引入echarts地图的四种方式

一、vue中引入echart1、安装echarts:npminstallecharts--save2、在main.js文件中引入echarts实例: Vue.prototype.$echartsecharts3、在需要用到echart图形的vue文件中引入: importechartsfrom&quot;echarts&quot;;4、如果用到map（地图），还 ... [详细]

蜡笔小新 2024-11-15 13:07:46
ip
TypeScript: 泛型的力量与价值

本文探讨了 TypeScript 中泛型的重要性和应用场景，通过多个实例详细解析了泛型如何提升代码的复用性和类型安全性。 ... [详细]

蜡笔小新 2024-11-15 12:12:42
ip
iOS snow animation

CTSnowAnimationView.hCTMyCtripCreatedbyalexon1614.Copyright©2016年ctrip.Allrightsreserved.# ... [详细]

蜡笔小新 2024-11-15 11:52:38
controller
Go Echo 框架入门指南【1】

本文介绍了 Go 语言中的高性能、可扩展、轻量级 Web 框架 Echo。Echo 框架简单易用，仅需几行代码即可启动一个高性能 HTTP 服务。 ... [详细]

蜡笔小新 2024-11-14 18:30:58
web
包含phppdoerrorcode的词条

包含phppdoerrorcode的词条 ... [详细]

蜡笔小新 2024-11-14 12:06:14
ip
Android 自定义加载对话框 CustomProgressDialog

本文介绍如何在 Android 中自定义加载对话框 CustomProgressDialog，包括自定义 View 类和 XML 布局文件的详细步骤。 ... [详细]

蜡笔小新 2024-11-12 21:51:00
ip
微信公众号推送模板40036问题

返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]

蜡笔小新 2024-11-12 16:31:32
web
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
replace
利用GLSL在iOS上实现YV12到RGB的转换，并附带展示结果图像

本文介绍了如何在iOS平台上使用GLSL着色器将YV12格式的视频帧数据转换为RGB格式，并展示了转换后的图像效果。通过详细的技术实现步骤和代码示例，读者可以轻松掌握这一过程，适用于需要进行视频处理的应用开发。 ... [详细]

蜡笔小新 2024-11-06 19:18:22
controller
优化后的标题：在Formtastic中预选模型对象集合作为复选框的使用方法与技巧

在Formtastic中，预选模型对象集合作为复选框的使用方法与技巧。本文介绍了如何将模型对象集合传递给Formtastic表单，并在复选框中预选这些对象。通过示例代码和详细解释，展示了如何高效地实现这一功能，确保用户界面友好且操作简便。具体来说，通过 `@things = Thing.all` 将所有对象加载到集合中，并在表单中进行预选。这种方法不仅提高了代码的可读性和维护性，还增强了用户体验。 ... [详细]

蜡笔小新 2024-11-03 15:10:30
controller
利用Ruby on Rails构建自定义页面 - Building Custom Pages with Ruby on Rails

我正在使用 Ruby on Rails 构建个人网站。总体而言，RoR 是一个非常出色的工具，它提供了丰富的功能和灵活性，使得创建自定义页面变得既高效又便捷。通过利用其强大的框架和模块化设计，我可以轻松实现复杂的功能，同时保持代码的整洁和可维护性。此外，Rails 的社区支持也非常强大，为开发过程中遇到的问题提供了丰富的资源和解决方案。 ... [详细]

蜡笔小新 2024-11-01 15:54:21
client
Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案

Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案 ... [详细]

蜡笔小新 2024-10-26 16:29:42

胡慧君孟勋欣怡

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章