热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

IDE下的MapReduce开发

IDE下的MapReduce开发在学校上Hadoop的课,GroupProject要写一些MapReduce,学校给了cluster,但是在cluster上直接开vim写JAVA着
IDE下的MapReduce开发

在学校上Hadoop的课,Group Project要写一些MapReduce,学校给了cluster,但是在cluster上直接开vim写JAVA着实不怎么习惯。于是折腾了一下踩了些坑,在这里记录一下。

Git部署代码

首先想到的最方便的方式其实是用git。我平时写Python之类的脚本的时候就是用Git管理,然后Server上clone一个repo,就同步了。
但是发现这样的话我要单独写一个Makefile,管理编译等问题。
于是想到用IDE远程调试MapReduce.

Intellij IDEA 开发MapReduce

Eclipse是有MapReduce插件的,安装好以后很方便各种调试。可我平时写JAVA比较习惯Intellij, 于是就找了一下intellij下的方案。

Maven来开发MapReduce

安装maven

brew install maven

在IntelliJ里面,右键项目,’Add Frameword support…’

选择maven

pom.xml的内容:

?xml version="1.0" encoding="UTF-8"?>
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
4.0.0
4480Group16
stochastic
0.1


org.apache.hadoop
hadoop-common
2.6.0


org.apache.hadoop
hadoop-mapreduce-client-jobclient
2.6.0


commons-cli
commons-cli
1.2



${project.artifactId}

会问你是否import,选择auto import bulabula

Edit Configuration 里,选择application,将program argument填上你hdfs里的input和output path。

然后在main/java里面写code,打包jar部署。基本搞定


推荐阅读
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • CentOS 7.6环境下Prometheus与Grafana的集成部署指南
    本文旨在提供一套详细的步骤,指导读者如何在CentOS 7.6操作系统上成功安装和配置Prometheus 2.17.1及Grafana 6.7.2-1,实现高效的数据监控与可视化。 ... [详细]
  • 本文详细记录了 MIT 6.824 课程中 MapReduce 实验的开发过程,包括环境搭建、实验步骤和具体实现方法。 ... [详细]
  • 如何提升Python处理约1GB数据集时的运行效率?
    如何提升Python处理约1GB数据集时的运行效率?本文探讨了在后端开发中使用Python处理大规模数据集的优化方法。通过分析常见的性能瓶颈,介绍了多种提高数据处理速度的技术,包括使用高效的数据结构、并行计算、内存管理和代码优化策略。此外,文章还提供了在Ubuntu环境下配置和测试这些优化方案的具体步骤,适用于从事推荐系统等领域的开发者。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法,并提供了多个实际代码示例,帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目,具有很高的参考价值。 ... [详细]
  • 本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法,通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点,并保持在文档树中。 ... [详细]
  • 本文详细记录了在银河麒麟操作系统和龙芯架构上使用 Qt 5.15.2 进行项目打包时遇到的问题及解决方案,特别关注于 linuxdeployqt 工具的应用。 ... [详细]
  • 嵌入式开发环境搭建与文件传输指南
    本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境,并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ... [详细]
  • 本文探讨了如何在Classic ASP中实现与PHP的hash_hmac('SHA256', $message, pack('H*', $secret))函数等效的哈希生成方法。通过分析不同实现方式及其产生的差异,提供了一种使用Microsoft .NET Framework的解决方案。 ... [详细]
  • 本文详细介绍了如何在CentOS 7操作系统上搭建GitLab服务器的过程,包括环境准备、软件安装及基本配置等关键步骤。 ... [详细]
  • 深入浅出:Hadoop架构详解
    Hadoop作为大数据处理的核心技术,包含了一系列组件如HDFS(分布式文件系统)、YARN(资源管理框架)和MapReduce(并行计算模型)。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • 开发笔记:Android ClassNotFoundException:在路径上找不到类:Dexpathlist
    我面临以下错误,我几乎尝试了Stackoverflow的每一个解决方案。我是 ... [详细]
  • 熟悉IDEA快捷键的正确姿势
    一、背景俗话说:“工欲善其事必先利其器”,现在IDEA作为主流的Java开发工具,已经广泛使用。但是很多人熟悉的快捷键是有限的 ... [详细]
author-avatar
树阿两
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有