当前位置: 开发笔记 > 编程语言 > 正文

大数据》》》flume上

作者：太阳神神神_890 | 来源：互联网 | 2023-09-08 20:26

笔记及视频位置：链接：https:pan.baidu.coms11IXcvZZm9DOulUaZVC8l-A密码：p0291.在开始之前：需要修改下主机名 vimetcho

笔记及视频位置：

链接：https://pan.baidu.com/s/11IXcvZZm9DOulUaZVC8l-A 密码：p029

大数据---》》》flume上

1.在开始之前：需要修改下主机名

vim /etc/hosts

192.168.126.129 master

2.关闭防火墙

你的Linux的版本不同，关闭防火墙的方式不同

systemctl status firewalld.service
启动一个服务：systemctl start firewalld.service
关闭一个服务：systemctl stop firewalld.service
重启一个服务：systemctl restart firewalld.service
显示一个服务的状态：systemctl status firewalld.service
在开机时启用一个服务：systemctl enable firewalld.service
在开机时禁用一个服务：systemctl disable firewalld.service
查看服务是否开机启动：systemctl is-enabled firewalld.service;echo $?
查看已启动的服务列表：systemctl list-unit-files|grep enabled

3.创建用户

adduser flume：添加用户
userdel -r flume: 删除用户
passwd flume:设置密码

4.切换到新用户

su - flume

5. 创建目录

|--bigdata

|--install ：存放解压包

|--software :存放待安装的包

|--test ：存放数据文件

6.jdk安装

1.解压jdk：

tar -zxvf jdk-8u102-linux-x64.tar.gz -C ~/bigdata/install/

2.配置环境变量

vim ~/.bash_profile

JAVA_HOME=/home/flume/bigdata/install/jdk1.8.0_102

export PATH=$JAVA_HOME/bin:$PATH

3.生效： source ~/.bash_profile

4. 配置环境变量有几种方式？

环境变量的设置有4中设置

1）. root用户可以设置在/etc/profile文件中

2）. 其他用户：~/.bash_profile ：每个用户都可使用该文件输入专用于自己使用的shell信息,当用户登录时,该文件仅仅执行一次!默认情况下,他设置一些环境变量,执行用户的.bashrc文件.

3）. 其他用户：~/.etc/bashrc：该文件包含专用于你的bash shell的bash信息,当登录时以及每次打开新的shell时,该该文件被读取.

4). 使用脚本：可以设置在脚本中（等同于~/.etc/bashrc）

7.安装flume

1.解压

tar -zxvf /home/flume/bigdata/install/apache-flume-1.7.0-bin -C ~/bigdata/install/

2.配置flume到环境变量

vim ~/.bash_profile

FLUME_HOME=/home/flume/bigdata/install/apache-flume-1.7.0-bin

export PATH=$FLUME_HOME/bin:$PATH

source ~/.bash_profile

3.配置文件conf/flume.env.sh

cp flume-env.ps1.template flume.env.sh

export JAVA_HOME=/home/soup/bigdata/install/jdk1.8.0_102

8.测试

测试模型1：

source：NetCat TCP

sink：logger

channel：memory

配置文件名 # netcat.conf

a1.sources = r1

a1.sinks = k1

a1.channels = c1

a1.sources.r1.type = netcat

a1.sources.r1.bind = localhost

a1.sources.r1.port = 44444

a1.sinks.k1.type = logger

a1.channels.c1.type = memory

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

启动：

flume-ng agent --conf conf --conf-file $FLUME_HOME/conf/netcat.conf

--name a1 -Dflume.root.logger=INFO,console

另开一个窗口测试的方式：

telnet localhost 44444

测试模型2：

source：exec

sink：logger

channel：memory

配置文件名 # exec.conf

a1.sources = r1

a1.sinks = k1

a1.channels = c1

a1.sources.r1.type = exec

a1.sources.r1.command = tail -F /home/flume/bigdata/test/flume_t.txt

a1.sources.r1.shell = /bin/bash -c

a1.sinks.k1.type = logger

a1.channels.c1.type = memory

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

启动：

flume-ng agent --conf conf --conf-file $FLUME_HOME/conf/exec.conf \

--name a1 -Dflume.root.logger=INFO,console

另开一个窗口测试的方式：

echo "ABC">>/home/flume/bigdata/test/flume_t.txt

测试模型3：从web的服务器上获取日志内容，在控制台打印出来

source：avro

sink：logger

channel：memory

配置文件名 # exec.conf

web的日志只需要在log4j的jar引入到pom

#####log日志的依赖

log4j

1.2.17

#####flume与log的对接包

org.apache.flume.flume-ng-clients

flume-ng-log4jappender

1.7.0

添加log4j.properties

log4j.rootCategory=INFO,stdout,flume

log4j.appender.stdout = org.apache.log4j.ConsoleAppender

log4j.appender.stdout.Target=System.out

log4j.appender.stdout.layout = org.apache.log4j.PatternLayout

log4j.appender.stdout.layout.COnversionPattern= %-d{yyyy-MM-dd HH:mm:ss, SSS}} [ %t] - [ %p ] %m%n

log4j.appender.flume = org.apache.flume.clients.log4jappender.Log4jAppender

log4j.appender.flume.Hostname =192.168.126.129 ----Linux的ip

log4j.appender.flume.Port = 4141 ----随意一个端口只要和下面的配置文件一致就好

log4j.appender.flume.UnsafeMode = true

测试的程序：

package com.itstar;

import org.apache.log4j.Logger;

public class flumeLog {

private static Logger log=Logger.getLogger(flumeLog.class);

public static void main(String[] args) throws Exception{

while (true){

Thread.sleep(5000);

log.info("hi");

}

配置文件名 #web-loggor.conf

a1.sources = r1

a1.sinks = k1

a1.channels = c1

a1 .sources.r1.type = avro

a1.sources.r1.bind = master ###等价于192.168.126.129

a1.sources.r1.port =4141

a1.sinks.k1.type = logger

a1.channels.c1.type = memory

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

启动：

flume-ng agent --conf conf --conf-file $FLUME_HOME/conf/web-loggor.conf \

--name a1 -Dflume.root.logger=INFO,console

测试：

启动 main生成日志就好

测试模型4：从web的服务器上获取日志内容，传输到另一台Linux上并在在控制台打印出来

agent1：a1

source：avro

sink：avro

channel：memory

配置文件名 # web-agent1-logger.conf

agent2：agent2

source：avro

sink：logger

channel：memory

配置文件名 # agent1-logger.conf

#web-agent1.conf

a1.sources = r1

a1.sinks = k1

a1.channels = c1

a1.sources.r1.type = avro

a1.sources.r1.bind = 192.168.126.129

a1.sources.r1.port = 41414

a1.sinks.k1.type = avro

a1.sinks.k1.channel = c1

a1.sinks.k1.hostname = 192.168.126.128

a1.sinks.k1.port = 4545

a1.channels.c1.type = memory

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

# agent1-logger.con

agent2.sources = r1

agent2.sinks = k1

agent2.channels = c1

agent2.sources.r1.type = avro

agent2.sources.r1.bind = 192.168.126.128

agent2.sources.r1.port = 4545

agent2.sinks.k1.type = logger

agent2.channels.c1.type = memory

agent2.sources.r1.channels = c1

agent2.sinks.k1.channel = c1

启动：要注意启动的顺序：

flume-ng agent --conf conf --conf-file $FLUME_HOME/conf/agent1-logger.conf \

--name agent2 -Dflume.root.logger=INFO,console

flume-ng agent --conf conf --conf-file $FLUME_HOME/conf/web-agent1.conf \

--name a1 -Dflume.root.logger=INFO,console

测试：启动你web端的程序

测试模型5：从web的服务器上获取日志内容，Linux上获取并写到hdfs

前提：启动hdfs

source：avro

sink：hdfs

channel：memory

配置文件名 # avro-hdfs.conf

avro-hdfs.sources =avro1

avro-hdfs.sinks = k1

avro-hdfs.channels = c1

###定义source

avro-hdfs.sources.avro1.type = avro

avro-hdfs.sources.avro1.bind = 192.168.126.129

avro-hdfs.sources.avro1.port = 4141

###定义sink

avro-hdfs.sinks.k1.type = hdfs

avro-hdfs.sinks.k1.hdfs.path = /output/flume/

avro-hdfs.sinks.k1.hdfs.fileType = DataStream

###定义channel

avro-hdfs.channels.c1.type = memory

###创建关联

avro-hdfs.sources.avro1.channels = c1

avro-hdfs.sinks.k1.channel = c1

启动：

bin/flume-ng agent --conf conf --conf-file conf/avro-hdfs.conf --name avro-hdfs -Dflume.root.logger=INFO,console

测试

启动程序

查看hadoop中的数据

hadoop fs -ls /output/flume

大数据---》》》flume上

推荐阅读

php
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
php
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
shell
Zsh 开发指南（第三篇字符串处理之转义字符和格式化输出）

导读上一篇讲了zsh的常用字符串操作，这篇开始讲更为琐碎的转义字符和格式化输出相关内容。包括转义字符、引号、print、printf的使用等等。其中很多内容没有必要记忆，作为手册参 ... [详细]

蜡笔小新 2024-12-03 03:30:40
shell
Linux 系统启动故障排除指南：MBR 和 GRUB 问题

本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案，涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]

蜡笔小新 2024-12-27 20:40:29
shell
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
shell
Linux 自动化安装脚本详解

本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建，还处理了系统服务的配置和启动，确保在多种 Linux 发行版上都能顺利运行。 ... [详细]

蜡笔小新 2024-12-27 16:33:32
shell
配置并访问BackTrack 5的SSH服务

本文详细介绍了如何在BackTrack 5中配置和启动SSH服务，确保其正常运行，并通过Windows系统成功连接。涵盖了必要的密钥生成步骤及常见问题解决方法。 ... [详细]

蜡笔小新 2024-12-27 20:13:35
php
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
php
解决Linux系统中pygraphviz安装问题

本文探讨了在Linux环境下安装pygraphviz时遇到的常见问题，并提供了详细的解决方案和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 16:44:26
shell
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05
shell
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
stream
精选Unity开源项目：UniRx实现响应式编程

本文介绍了Unity中的响应式编程框架——UniRx，探讨了其在解决异步编程难题中的应用及优势。 ... [详细]

蜡笔小新 2024-12-12 13:40:42
string
Lua与C++的高效交互方法

本文详细介绍了如何通过修改Lua源码或使用动态链接库(DLL)的方式实现Lua与C++之间的高级交互，包括如何编译Lua源码、添加自定义API以及在C++中加载和调用Lua脚本。 ... [详细]

蜡笔小新 2024-12-11 20:42:15
string
基于花生壳域名的Android与ESP8266远程控制系统搭建

本文介绍了一种使用Android设备、ESP8266模块及路由器，结合花生壳动态域名解析服务实现远程控制的方法。通过该方法，用户能够有效解决因公网IP变动导致的连接问题，实现稳定可靠的远程控制。 ... [详细]

蜡笔小新 2024-12-09 17:09:42
shell
深入解析 OpenWrt 中的 Luci API 文档及 szloogson 模块构建

OpenWrt 是一款高度可定制的嵌入式 Linux 发行版，广泛应用于无线路由器等领域，拥有超过百个预装软件包。本文详细探讨如何在 OpenWrt 上通过 Luci 构建自定义模块，以扩展其功能。 ... [详细]

蜡笔小新 2024-12-03 12:06:08

太阳神神神_890

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

大数据》》》flume上

1.在开始之前：需要修改下主机名

2.关闭防火墙

3.创建用户

4.切换到新用户

5. 创建目录

6.jdk安装

1.解压jdk：

2.配置环境变量

3.生效： source ~/.bash_profile

4. 配置环境变量有几种方式？

7.安装flume

1.解压

2.配置flume到环境变量

3.配置文件conf/flume.env.sh

8.测试

测试模型1：

配置文件名 # netcat.conf

启动：

另开一个窗口测试的方式：

测试模型2：

配置文件名 # exec.conf

启动：

另开一个窗口测试的方式：

测试模型3： 从web的服务器上获取日志内容，在控制台打印出来

配置文件名 # exec.conf

web的日志只需要在log4j的jar引入到pom

#####log日志的依赖

#####flume与log的对接包

添加log4j.properties

测试的程序：

配置文件名 #web-loggor.conf

启动：

测试：

测试模型4： 从web的服务器上获取日志内容，传输到另一台Linux上 并在在控制台打印出来

配置文件名 # web-agent1-logger.conf

配置文件名 # agent1-logger.conf

#web-agent1.conf

# agent1-logger.con

启动：要注意启动的顺序：

测试：启动你web端的程序

测试模型5： 从web的服务器上获取日志内容，Linux上获取 并写到hdfs

前提：启动hdfs

配置文件名 # avro-hdfs.conf

启动：

测试

查看hadoop中的数据

测试模型3：从web的服务器上获取日志内容，在控制台打印出来

测试模型4：从web的服务器上获取日志内容，传输到另一台Linux上并在在控制台打印出来

测试模型5：从web的服务器上获取日志内容，Linux上获取并写到hdfs