热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:数据采集flumekafka

本文由编程笔记#小编为大家整理,主要介绍了数据采集flumekafka相关的知识,希望对你有一定的参考价值。需求:采集8类日志数据,并且进入es展示:方案制定:目前数据采
本文由编程笔记#小编为大家整理,主要介绍了数据采集flume kafka相关的知识,希望对你有一定的参考价值。

需求:采集8类日志数据,并且进入es展示:

方案制定:目前数据采集通用flume+kafka模式,所以采用原有模式,一类服务进入一个topic,然后通过logstash进行数据清洗,最后进入es进行展示。

flume采用tadir 读取数据源,memory 进行缓存,kafka进行sink

 

a1.sources = s1 s2 s3 s4 s5 s6 s7 s8
a1.channels
= c1 c2 c3 c4 c5 c6 c7 c8
a1.sinks
= k1 k2 k3 k4 k5 k6 k7 k8
a1.sources.s1.type
= TAILDIR
a1.sources.s1.filegroups
= f1 f2
a1.sources.s1.filegroups.f1
= /home/es/.*.log
a1.sources.s1.channels
= c1
a1.sources.s2.type
= TAILDIR
a1.sources.s2.filegroups
= f1 f2
a1.sources.s2.filegroups.f1
= /home/adm/.*.log
a1.sources.s2.channels
= c2
a1.sources.s3.type
= TAILDIR
a1.sources.s3.filegroups
= f1 f2
a1.sources.s3.filegroups.f1
= /home/bas/.*.log
a1.sources.s3.channels
= c3
a1.sources.s4.type
= TAILDIR
a1.sources.s4.filegroups
= f1 f2
a1.sources.s4.filegroups.f1
= /home/cha/.*.log
a1.sources.s4.channels
= c2
a1.sources.s5.type
= TAILDIR
a1.sources.s5.filegroups
= f1 f2
a1.sources.s5.filegroups.f1
= /home/anog/.*.log
a1.sources.s5.channels
= c5
a1.sources.s6.type
= TAILDIR
a1.sources.s6.filegroups
= f1 f2
a1.sources.s6.filegroups.f1
= /home/dip/es_okeano/3.27.20.38/config_log/.*.log
a1.sources.s6.channels
= c6
a1.sources.s7.type
= TAILDIR
a1.sources.s7.filegroups
= f1 f2
a1.sources.s7.filegroups.f1
= /home/oau/.*.log
a1.sources.s7.channels
= c7
a1.sources.s8.type
= TAILDIR
a1.sources.s8.filegroups
= f1 f2
a1.sources.s8.filegroups.f1
= /home/z/.*.log
a1.sources.s8.channels
= c8
a1.channels.c1.type
= memory
a1.channels.c1.capacity
= 10000
a1.channels.c1.transactionCapacity
= 1000
a1.channels.c2.type
= memory
a1.channels.c2.capacity
= 10000
a1.channels.c2.transactionCapacity
= 1000
a1.channels.c3.type
= memory
a1.channels.c3.capacity
= 10000
a1.channels.c3.transactionCapacity
= 1000
a1.channels.c4.type
= memory
a1.channels.c4.capacity
= 10000
a1.channels.c4.transactionCapacity
= 1000
a1.channels.c5.type
= memory
a1.channels.c5.capacity
= 10000
a1.channels.c5.transactionCapacity
= 1000
a1.channels.c6.type
= memory
a1.channels.c6.capacity
= 10000
a1.channels.c6.transactionCapacity
= 1000
a1.channels.c7.type
= memory
a1.channels.c7.capacity
= 10000
a1.channels.c7.transactionCapacity
= 1000
a1.channels.c8.type
= memory
a1.channels.c8.capacity
= 10000
a1.channels.c8.transactionCapacity
= 1000
a1.sinks.k1.channel
= c1
a1.sinks.k1.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.topic
= ws_activity
a1.sinks.k1.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k1.kafka.flumeBatchSize
= 5
a1.sinks.k1.kafka.producer.acks
= 1
a1.sinks.k2.channel
= c2
a1.sinks.k2.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k2.kafka.topic
= ws_admin
a1.sinks.k2.kafka.bootstrap.servers
= 172.56.10.23:9092
a1.sinks.k2.kafka.flumeBatchSize
= 5
a1.sinks.k2.kafka.producer.acks
= 1
a1.sinks.k3.channel
= c3
a1.sinks.k3.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k3.kafka.topic
= ws_authorization_oauth
a1.sinks.k3.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k3.kafka.flumeBatchSize
= 5
a1.sinks.k3.kafka.producer.acks
= 1
a1.sinks.k4.channel
= c4
a1.sinks.k4.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k4.kafka.topic
= ws_base
a1.sinks.k4.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k4.kafka.flumeBatchSize
= 5
a1.sinks.k4.kafka.producer.acks
= 1
a1.sinks.k5.channel
= c5
a1.sinks.k5.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k5.kafka.topic
= ws_channel
a1.sinks.k5.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k5.kafka.flumeBatchSize
= 5
a1.sinks.k5.kafka.producer.acks
= 1
a1.sinks.k6.channel
= c6
a1.sinks.k6.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k6.kafka.topic
= ws_config
a1.sinks.k6.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k6.kafka.flumeBatchSize
= 5
a1.sinks.k6.kafka.producer.acks
= 1
a1.sinks.k7.channel
= c7
a1.sinks.k7.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k7.kafka.topic
= ws_material
a1.sinks.k7.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k7.kafka.flumeBatchSize
= 5
a1.sinks.k7.kafka.producer.acks
= 1
a1.sinks.k8.channel
= c8
a1.sinks.k8.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k8.kafka.topic
= ws_zuul
a1.sinks.k8.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k8.kafka.flumeBatchSize
= 5
a1.sinks.k8.kafka.producer.acks
= 1

 


推荐阅读
  • 本文介绍了解决java开源项目apache commons email简单使用报错的方法,包括使用正确的JAR包和正确的代码配置,以及相关参数的设置。详细介绍了如何使用apache commons email发送邮件。 ... [详细]
  • 深入理解Kafka服务端请求队列中请求的处理
    本文深入分析了Kafka服务端请求队列中请求的处理过程,详细介绍了请求的封装和放入请求队列的过程,以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析,帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]
  • springboot基于redis配置session共享项目环境配置pom.xml引入依赖application.properties配置Cookie序列化(高版本不需要)测试启 ... [详细]
  • 我正在使用sql-serverkafka-connect和debezium监视sqlserver数据库,但是当我发布并运行我的wo ... [详细]
  • ConsumerConfiguration在kafka0.9使用JavaConsumer替代了老版本的scalaConsumer。新版的配置如下:bootstrap. ... [详细]
  • druid接入kafka indexing service整个流程
    先介绍下我们的druid集群配置Overload1台Coordinator1台Middlemanager3台Broker3台Historical一共12台,其中cold6台,hot ... [详细]
  • kafka教程基本概念
    kafka教程基本概念 ... [详细]
  • 大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于KAFKA的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。一、概述在对kafka有了 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了在Oracle数据库中创建序列时如何选择cache或nocache参数。cache参数可以提高序列的存取速度,但可能会导致序列丢失;nocache参数可以避免序列丢失,但在高并发访问时可能导致性能问题。文章详细解释了两者的区别和使用场景。 ... [详细]
  • 在重复造轮子的情况下用ProxyServlet反向代理来减少工作量
    像不少公司内部不同团队都会自己研发自己工具产品,当各个产品逐渐成熟,到达了一定的发展瓶颈,同时每个产品都有着自己的入口,用户 ... [详细]
  • 开发笔记:计网局域网:NAT 是如何工作的?
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了计网-局域网:NAT是如何工作的?相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 达人评测 酷睿i5 12450h和锐龙r7 5800h选哪个好 i512450h和r75800h对比
    本文介绍了达人评测酷睿i5 12450h和锐龙r7 5800h选哪个好的相关知识,包括两者的基本配置和重要考虑点。希望对你在选择时提供一定的参考价值。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
author-avatar
Candy王丫丫
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有