热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用hadoop2.2做flume1.4的sink,该怎么好呢?

用hadoop2.2做flume1.4的sink,该怎么好呢?网上找不到

flume 1.4 安装不说了

hadoop 2.2 的安装也不说了

PS:话说flume也有大半年没更新了,这可怎么跟上hadoop的ecosystem啊,都是一家的,互相扶持一下呗。

PPS:如果不想看过程可以直接看后面的结论哦~

好吧,回归正文:


缘起flume1.4不支持hadoop2.2,网上找了好久也没有相关信息,于是自己试着摸索一下。

首先一如既往的在flume中配置sink到hdfs,启动,报错:

bubuko.com,布布扣

于是google之,(这里鄙视一下baidu,出来的都是什么玩意啊)

这是由于hadoop client 和 server端版本不兼容,这类的问题出现在各种hadoop体系的组件上,比如hbase的0.94,或者chukwa等等。但不幸的是对于flume上出现此问题的解决办法几乎没有,怎么办?胡乱搜索了一番,号称是hadoop-core-1.0.4.jar这个jar包替换掉就好了。

于是,去hadoop下面找了一遍,竟然没有!!也难怪2.2的架构大换血,聪明的我于是照着这个样子找到了hadoop的基础包,打开包看了看里面的包接口发现少了好多类。没办法,硬着头皮试试吧。

删了hadoop-core-1.0.4.jar 换成了hadoop-common-2.2.0.jar,再启动,如我所料报了ClassNotFoundException:

bubuko.com,布布扣

继续google之,发现2.2里面把core拆成了多个jar包,这个PlatFormName类被分到了 hadoop-auth-2.2.0.jar里。

其他还会不会有类似的类找不到呢?于是把hadoop的share目录下的和hadoop相关的jar包一并考走,这里面除了src,test,client的一律打包。(更为细致的你,可以逐一找出来依赖的包,像我这样的懒家伙就干脆一股脑弄过来算了)

于是找出来的包全部扔到flume的lib下,再次启动,又报错了…………

bubuko.com,布布扣

继续google之,于是发现了一篇文章 http://grepalex.com/2014/02/09/flume-and-hadoop-2.2/

文中指出(咳咳,有点新闻联播的赶脚),有两个依赖包有版本问题,需要挪走这两个包,可我觉得不靠谱(实验证明确实不靠谱),于是去hadoop的share下找来了新的版本,替换之。这两个包是

bubuko.com,布布扣

用protobuf-java-2.5.0.jar 和 guava-11.0.2.jar 替换之,再启动,大功告成。

----------------------------------------这是操作顺序的分割线,以下总结步骤----------------------------------------------------------------------------------------------------------------------------------------


  1. 在${FLUME_HOME}/lib下执行以下命令,把老版本的相关包,备份掉:
    mv guava-10.0.1.jar guava-10.0.1.jar.bak
    mv protobuf-java-2.4.1.jar protobuf-java-2.4.1.jar.bak
    mv hadoop-core-1.0.4.jar hadoop-core-1.0.4.jar.bak
  2. 打包${HADOOP_HOME}/share下面的一些包,可能在不同的目录下,自行find,文件及路径给出如下,把他们拷到${FLUME_HOME}/lib下:
    ${HADOOP_HOME}/share/hadoop/hdfs/hadoop-hdfs-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/hdfs/hadoop-hdfs-nfs-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-streaming-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-datajoin-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-archives-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-gridmix-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-rumen-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-extras-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/tools/lib/hadoop-distcp-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-applications-unmanaged-am-launcher-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-api-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-site-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/lib/hadoop-annotations-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-server-nodemanager-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-applications-distributedshell-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-server-web-proxy-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-server-common-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/yarn/hadoop-yarn-common-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/common/hadoop-nfs-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/common/hadoop-common-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/common/lib/hadoop-annotations-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/common/lib/hadoop-auth-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar
    ${HADOOP_HOME}/share/hadoop/mapreduce/lib/hadoop-annotations-2.2.0.jar
  3. 把guava和protocal buf两个包也拷到${FLUME_HOME}/lib下,文件名如下:
    protobuf-java-2.5.0.jar
    guava-11.0.2.jar
  4. 大功告成。

用hadoop2.2做flume1.4的sink,该怎么好呢?,布布扣,bubuko.com


推荐阅读
  • LDAP服务器配置与管理
    本文介绍如何通过安装和配置SSSD服务来统一管理用户账户信息,并实现其他系统的登录调用。通过图形化交互界面配置LDAP服务器,确保用户账户信息的集中管理和安全访问。 ... [详细]
  • 经过一年的思考,我发现自己对开发的兴趣并不浓厚,而对算法研究则更加热衷。本文将探讨开发与算法之间的本质差异,并分享我的未来学习计划。 ... [详细]
  • 蒜头君的倒水问题(矩阵快速幂优化)
    蒜头君将两杯热水分别倒入两个杯子中,每杯水的初始量分别为a毫升和b毫升。为了使水冷却,蒜头君采用了一种特殊的方式,即每次将第一杯中的x%的水倒入第二杯,同时将第二杯中的y%的水倒入第一杯。这种操作会重复进行k次,最终求出两杯水中各自的水量。 ... [详细]
  • Python多线程详解与示例
    本文介绍了Python中的多线程编程,包括僵尸进程和孤儿进程的概念,并提供了具体的代码示例。同时,详细解释了0号进程和1号进程在系统中的作用。 ... [详细]
  • 如何解决8080端口被占用问题
    本文介绍了如何通过命令行和任务管理器查找并终止占用8080端口的进程,以确保该端口能够正常使用。 ... [详细]
  • Excel 数据分析基础
    Excel 是数据分析中最基本且强大的工具之一,具备多种实用功能和操作方法。本文将简要介绍 Excel 的不同版本及其兼容性问题,并探讨在处理大数据时的替代方案。 ... [详细]
  • 本文介绍了如何在 ASP.NET 中设置 Excel 单元格格式为文本,获取多个单元格区域并作为表头,以及进行单元格合并、赋值、格式设置等操作。 ... [详细]
  • 如果应用程序经常播放密集、急促而又短暂的音效(如游戏音效)那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点:1)延时时间较长,且资源占用率高 ... [详细]
  • 网络爬虫的规范与限制
    本文探讨了网络爬虫引发的问题及其解决方案,重点介绍了Robots协议的作用和使用方法,旨在为网络爬虫的合理使用提供指导。 ... [详细]
  • 本文介绍了 AngularJS 中的 $compile 服务及其用法,通过示例代码展示了如何使用 $compile 动态编译和链接 HTML 元素。 ... [详细]
  • [c++基础]STL
    cppfig15_10.cppincludeincludeusingnamespacestd;templatevoidprintVector(constvector&integer ... [详细]
  • ZooKeeper 入门指南
    本文将详细介绍ZooKeeper的工作机制、特点、数据结构以及常见的应用场景,包括统一命名服务、统一配置管理、统一集群管理、服务器动态上下线和软负载均衡。 ... [详细]
  • 自动验证时页面显示问题的解决方法
    在使用自动验证功能时,页面未能正确显示错误信息。通过使用 `dump($info->getError())` 可以帮助诊断和解决问题。 ... [详细]
  • 本文详细介绍了如何解决DNS服务器配置转发无法解析的问题,包括编辑主配置文件和重启域名服务的具体步骤。 ... [详细]
  • 数字资产量化交易通过大数据分析,以客观的方式制定交易决策,有效减少人为的主观判断和情绪影响。本文介绍了几种常见的数字资产量化交易策略,包括搬砖套利和趋势交易,并探讨了量化交易软件的开发前景。 ... [详细]
author-avatar
奋怒的小超_656
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有