eclipse编译运行MapReduce程序

作者：手机用户上官婉儿 | 来源：互联网 | 2023-08-04 08:57

eclipse编译运行MapReduce程序一、环境Ubuntu16，Hadoop2.7.1二、安装eclipse你可以直接在Ubuntu的Ubuntu软件中

一、环境

Ubuntu16&＃xff0c;Hadoop2.7.1

二、安装eclipse

你可以直接在Ubuntu的Ubuntu软件中心直接搜索安装Eclipse&＃xff0c;在桌面左侧任务栏&＃xff0c;不过我用这种方法安装之后Eclipse打不开&＃xff0c;就参照了下面这个网站的安装步骤&＃xff1a;
Eclipse安装步骤
jdk安装可以参考这个网站的安装JAVA环境

三、安装配置Hadoop-Eclipse-Plugin

要在 Eclipse 上编译和运行 MapReduce 程序&＃xff0c;需要安装 hadoop-eclipse-plugin&＃xff0c;可下载 Github 上的 hadoop2x-eclipse-plugin&＃xff08;备用下载地址&＃xff1a;http://pan.baidu.com/s/1i4ikIoP&＃xff09;。

下载后&＃xff0c;将 release 中的 hadoop-eclipse-kepler-plugin-2.6.0.jar &＃xff08;还提供了 2.2.0 和 2.4.1 版本&＃xff09;复制到 Eclipse 安装目录的 plugins 文件夹中&＃xff0c;运行 eclipse -clean 重启 Eclipse 即可&＃xff08;添加插件后只需要运行一次该命令&＃xff0c;以后按照正常方式启动就行了&＃xff09;。

unzip -qo ~/下载/hadoop2x-eclipse-plugin-master.zip -d ~/下载 # 解压到 ~/下载中 sudo cp ~/下载/hadoop2x-eclipse-plugin-master/release/hadoop-eclipse-plugin-2.6.0.jar /usr/lib/eclipse/plugins/ # 复制到 eclipse 安装目录的 plugins 目录下 /usr/lib/eclipse/eclipse -clean # 添加插件后需要用这种方式使插件生效

在这里插入图片描述

在继续配置前请确认打开Hadoop

在这里插入图片描述

启动eclipse&＃xff0c;选择Window菜单下的Preferences&＃xff0c;此时会弹出一个窗体&＃xff0c;窗体的左侧会多出 Hadoop Map/Reduce 选项&＃xff0c;点击此选项&＃xff0c;选择 Hadoop 的安装目录&＃xff08;如/usr/local/hadoop&＃xff0c;Ubuntu不好选择目录&＃xff0c;直接输入就行&＃xff09;。
在这里插入图片描述
切换 Map/Reduce 开发视图&＃xff0c;选择 Window 菜单下选择 Open Perspective -> Other&＃xff0c;弹出一个窗体&＃xff0c;从中选择 Map/Reduce 选项即可进行切换。

建立与 Hadoop 集群的连接&＃xff0c;点击 Eclipse软件右下角的 Map/Reduce Locations 面板&＃xff0c;在面板中单击右键&＃xff0c;选择 New Hadoop Location。
在这里插入图片描述
在弹出来的 General 选项面板中&＃xff0c;General 的设置要与 Hadoop 的配置一致。一般两个 Host 值是一样的&＃xff0c;如果是伪分布式&＃xff0c;填写 localhost 即可&＃xff0c;另外我使用的Hadoop伪分布式配置&＃xff0c;设置 fs.defaultFS 为 hdfs://localhost:9000&＃xff0c;则 DFS Master 的 Port 要改为 9000。Map/Reduce(V2) Master 的 Port 用默认的即可&＃xff0c;Location Name 随意填写。
在这里插入图片描述
Advanced parameters 选项面板是对 Hadoop 参数进行配置&＃xff0c;实际上就是填写 Hadoop 的配置项(/usr/local/hadoop/etc/hadoop中的配置文件)&＃xff0c;如我配置了 hadoop.tmp.dir &＃xff0c;就要进行相应的修改。但修改起来会比较繁琐&＃xff0c;我们可以通过复制配置文件的方式解决&＃xff08;下面会说到&＃xff09;。

总之&＃xff0c;我们只要配置 General 就行了&＃xff0c;点击 finish&＃xff0c;Map/Reduce Location 就创建好了。

四、在Eclipse中创建MapReduce项目

点击 File 菜单&＃xff0c;选择 New -> Project…&＃xff0c;选择 Map/Reduce Project&＃xff0c;点击 Next。
在这里插入图片描述
填写 Project name 为 WordCount 即可&＃xff0c;点击 Finish 就创建好了项目。

此时在左侧的 Project Explorer 就能看到刚才建立的项目了。
接着右键点击刚创建的 WordCount 项目&＃xff0c;选择 New -> Class
需要填写两个地方&＃xff1a;在 Package 处填写 org.apache.hadoop.examples&＃xff1b;在 Name 处填写 WordCount。
在这里插入图片描述创建 Class 完成后&＃xff0c;在 Project 的 src 中就能看到 WordCount.java 这个文件。将如下 WordCount 的代码复制到该文件中。

package org.apache.hadoop.examples;import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import org.apache.hadoop.util.GenericOptionsParser;public class WordCount {public WordCount() {}public static void main(String[] args) throws Exception {Configuration conf &＃61; new Configuration();String[] otherArgs &＃61; (new GenericOptionsParser(conf, args)).getRemainingArgs();if(otherArgs.length < 2) {System.err.println("Usage: wordcount [...] ");System.exit(2);}Job job &＃61; Job.getInstance(conf, "word count");job.setJarByClass(WordCount.class);job.setMapperClass(WordCount.TokenizerMapper.class);job.setCombinerClass(WordCount.IntSumReducer.class);job.setReducerClass(WordCount.IntSumReducer.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(IntWritable.class);for(int i &＃61; 0; i < otherArgs.length - 1; &＃43;&＃43;i) {FileInputFormat.addInputPath(job, new Path(otherArgs[i]));}FileOutputFormat.setOutputPath(job, new Path(otherArgs[otherArgs.length - 1]));System.exit(job.waitForCompletion(true)?0:1);}public static class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable> {private IntWritable result &＃61; new IntWritable();public IntSumReducer() {}public void reduce(Text key, Iterable<IntWritable> values, Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {int sum &＃61; 0;IntWritable val;for(Iterator i$ &＃61; values.iterator(); i$.hasNext(); sum &＃43;&＃61; val.get()) {val &＃61; (IntWritable)i$.next();}this.result.set(sum);context.write(key, this.result);}}public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {private static final IntWritable one &＃61; new IntWritable(1);private Text word &＃61; new Text();public TokenizerMapper() {}public void map(Object key, Text value, Mapper<Object, Text, Text, IntWritable>.Context context) throws IOException, InterruptedException {StringTokenizer itr &＃61; new StringTokenizer(value.toString());while(itr.hasMoreTokens()) {this.word.set(itr.nextToken());context.write(this.word, one);}}} }

在运行 MapReduce 程序前&＃xff0c;还需要执行一项重要操作&＃xff08;也就是上面提到的通过复制配置文件解决参数设置问题&＃xff09;&＃xff1a;将 /usr/local/hadoop/etc/hadoop 中将有修改过的配置文件&＃xff08;如伪分布式需要 core-site.xml 和 hdfs-site.xml&＃xff09;&＃xff0c;以及 log4j.properties 复制到 WordCount 项目下的 src 文件夹&＃xff08;~/workspace/WordCount/src&＃xff09;中&＃xff1a;

cp /usr/local/hadoop/etc/hadoop/core-site.xml ~/workspace/WordCount/src cp /usr/local/hadoop/etc/hadoop/hdfs-site.xml ~/workspace/WordCount/src cp /usr/local/hadoop/etc/hadoop/log4j.properties ~/workspace/WordCount/src

在这里插入图片描述
复制完成后&＃xff0c;务必右键点击 WordCount 选择 refresh 进行刷新&＃xff08;不会自动刷新&＃xff0c;需要手动刷新&＃xff09;&＃xff0c;可以看到文件结构如下所示&＃xff1a;

点击工具栏中的 Run 图标&＃xff0c;或者右键点击 Project Explorer 中的 WordCount.java&＃xff0c;选择 Run As -> Run on Hadoop&＃xff0c;就可以运行 MapReduce 程序了。不过由于没有指定参数&＃xff0c;运行时会提示 “Usage: wordcount “&＃xff0c;需要通过Eclipse设定一下运行参数。

右键点击刚创建的 WordCount.java&＃xff0c;选择 Run As -> Run Configurations&＃xff0c;在此处可以设置运行时的相关参数&＃xff08;如果 Java Application 下面没有 WordCount&＃xff0c;那么需要先双击 Java Application&＃xff09;。切换到 “Arguments” 栏&＃xff0c;在 Program arguments 处填写 “input output” 就可以了。
注意&＃xff1a;这里需要你的hdfs文件系统&＃xff08;不是本地文件&＃xff09;里面要有input文件目录
在这里插入图片描述设定参数后&＃xff0c;再次运行程序&＃xff0c;可以看到运行成功的提示&＃xff0c;刷新 DFS Location 后也能看到输出的 output 文件夹。

在这里插入图片描述
至此&＃xff0c;你就可以使用 Eclipse 方便的进行 MapReduce程序的开发了。

推荐阅读

get
sqoop自定义分隔符的实现方法及步骤详解

本文介绍了在sqoop1.4.*版本中，如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件，并重新编译，可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码，重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]

蜡笔小新 2023-12-10 11:29:22
get
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
window
如何在Windows环境下配置php+apache环境

本文介绍了在Windows环境下如何配置php+apache环境，包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-13 10:39:24
jsp
OpenCV4.5.0+contrib编译流程及解决错误方法

本文介绍了OpenCV4.5.0+contrib的编译流程，并提供了解决常见错误的方法，包括下载失败和路径修改等。同时提供了相关参考链接。 ... [详细]

蜡笔小新 2023-12-10 12:04:05
jsp
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
jsp
Jmeter对RabbitMQ压力测试

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Jmeter对RabbitMQ压力测试相关的知识，希望对你有一定的参考价值。Jm ... [详细]

蜡笔小新 2023-10-17 18:53:56
jsp
Maven构建Hadoop,

Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引序　　上一篇，我们编写了第一个MapReduce，并且成功的运行了Job，Hadoop1.x是通过ant ... [详细]

蜡笔小新 2023-10-17 16:11:18
jsp
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
python
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
get
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
get
SpringBoot yml 配置多配置文件,开发环境,生产环境配置文件分开

原文地址:https:www.cnblogs.combaoyipSpringBoot_YML.html1.在springboot中，有两种配置文件，一种 ... [详细]

蜡笔小新 2023-12-14 12:39:13
require
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
jsp
phpBB安装环境配置及如何搭建php环境

本文介绍了关于apache、phpmyadmin、mysql、php、emacs、path等知识点，以及如何搭建php环境。文章提供了详细的安装步骤和所需软件列表，希望能帮助读者解决与LAMP相关的技术问题。 ... [详细]

蜡笔小新 2023-12-13 13:33:01
config
mapreduce源码分析总结

这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型，它最初是由Google工程师设计并实现的ÿ ... [详细]

蜡笔小新 2023-10-17 12:36:35
get
Hadoop （CDH4发行版）集群部署（部署脚本，namenode高可用，hadoop管理）

前言折腾了一段时间hadoop的部署管理，写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动，我已经把部署的步骤写成脚本，各位只需要按着本文把脚本执行完，整个环境基本就部署 ... [详细]

蜡笔小新 2023-10-16 15:11:51

手机用户上官婉儿

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章