当前位置: 开发笔记 > 编程语言 > 正文

用java提交一个Spark应用程序

作者：朴子字軒_755 | 来源：互联网 | 2023-10-11 19:09

第一种方式经常有人在公众号留言或者在群里问浪尖，如何使用java代码提交一个Spark应用程序。在这里浪尖介绍一种简单的方法来实现这个功能。首先用vim打开一个文件&

第一种方式

经常有人在公众号留言或者在群里问浪尖&＃xff0c;如何使用java代码提交一个Spark应用程序。在这里浪尖介绍一种简单的方法来实现这个功能。

首先用vim打开一个文件&＃xff0c;MyLauncher.java

编写代码如下&＃xff1a;

import org.apache.spark.launcher.SparkAppHandle;

import org.apache.spark.launcher.SparkLauncher;

import java.util.HashMap;

public class MyLauncher {

public static void main(String[] args) throws Exception {

HashMap map &＃61; newHashMap();

map.put("HADOOP_CONF_DIR","/home/hadoop/conf");

map.put("YARN_CONF_DIR","/home/hadoop/conf");

map.put("SPARK_CONF_DIR","/home/hadoop/spark/conf");

new SparkLauncher(map)

.setAppResource("/data/newStreaming/uesc-analyzer.jar")

.setMainClass("ucloud.UESBash.testSchema")

.setMaster("yarn-cluster")

.setConf(SparkLauncher.DRIVER_MEMORY, "2g")

.setVerbose(true).startApplication();

Thread.sleep(100000);

// Use handle API to monitor / control application.

}

接着&＃xff0c;进行编译

javac -cp /home/hadoop/spark/lib/spark-assembly-1.6.0-hadoop2.6.0-cdh5.4.9.jarMyLauncher.java

然后提交执行

java -cp/home/hadoop/spark/lib/spark-assembly-1.6.0-hadoop2.6.0-cdh5.4.9.jar:.MyLauncher

这样就可以在yarn的界面上看到运行情况了。

注释&＃xff1a;可能你比较奇怪我为啥在那加了个停顿&＃xff0c;因为正常情况下我们要进行一些其它操作监控Spark应用而不是直接退出&＃xff0c;直接退出可能会导致提交还没完成退出&＃xff0c;以至于应用程序不能被提交了。

当然&＃xff0c;还有另外一种方式&＃xff0c;但是不建议使用&＃xff0c;上面采用的这种方式呢可以更好地监控我们Spark程序的状态。

第二种方式

import org.apache.spark.launcher.SparkAppHandle;

import org.apache.spark.launcher.SparkLauncher;

import java.util.HashMap;

public class MyLauncher {

public static void main(String[] args) throws Exception {

HashMap map &＃61; newHashMap();

map.put("HADOOP_CONF_DIR","/home/hadoop/conf");

map.put("YARN_CONF_DIR","/home/hadoop/conf");

map.put("SPARK_CONF_DIR","/home/hadoop/spark/conf");

Process spark &＃61; new SparkLauncher(map)

.setAppResource("/data/newStreaming/uesc-analyzer.jar")

.setMainClass("ucloud.UESBash.testSchema")

.setMaster("yarn-cluster")

.setConf(SparkLauncher.DRIVER_MEMORY, "2g")

.setVerbose(true).launch();

// Use handle API to monitor / control application.

spark.waitFor();

}

第二种方式是启动了一个子进程来加载提交应用程序。

至于SparkLauncher其它标准函数操作&＃xff0c;比如如何传参&＃xff0c;如何指定内存&＃xff0c;cpu&＃xff0c;如何指定钩子函数这些浪尖就不在这里啰嗦了&＃xff0c;有兴趣可以去翻看这个类的源码。也可以在公众号里输入:submit&＃xff0c;来获取这个类和钩子函数使用的复杂代码。

推荐阅读&＃xff1a;

1&＃xff0c;读懂Word2Vec之Skip-Gram

2&＃xff0c;CountVectorizer

3&＃xff0c;spark调优系列之内存和GC调优

密封线分割线

关于Spark高级玩法

kafka&＃xff0c;hbase&＃xff0c;spark&＃xff0c;Flink等入门到深入源码&＃xff0c;spark机器学习&＃xff0c;大数据安全&＃xff0c;大数据运维&＃xff0c;请关注浪尖公众号&＃xff0c;看高质量文章。

更多文章&＃xff0c;敬请期待

推荐阅读

int
使用Service Locator模式实现高效的服务命名访问

本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问，特别是对于需要频繁访问的服务，如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本，并提供了对多种服务的统一访问接口。 ... [详细]

蜡笔小新 2024-11-20 19:26:30
int
二维码的实现与应用

本文介绍了二维码的基本概念、分类及其优缺点，并详细描述了如何使用Java编程语言结合第三方库（如ZXing和qrcode.jar）来实现二维码的生成与解析。 ... [详细]

蜡笔小新 2024-11-21 17:10:15
int
Zabbix自定义监控与邮件告警配置实践

本文详细介绍了如何在Zabbix中添加自定义监控项目，配置邮件告警功能，并解决测试告警时遇到的邮件不发送问题。 ... [详细]

蜡笔小新 2024-11-22 08:33:19
int
探讨Java中将图像对象转换为文件和字节数组的方法

本文详细探讨了在Java中如何将图像对象转换为文件和字节数组（Byte[]）的技术。虽然网络上存在大量相关资料，但实际操作时仍需注意细节。本文通过使用JMSL 4.0库中的图表对象作为示例，提供了一种实用的方法。 ... [详细]

蜡笔小新 2024-11-21 21:42:59
int
web: _show -> _info 造轮子编程

问题场景用Java进行web开发过程当中，当遇到很多很多个字段的实体时，最苦恼的莫过于编辑字段的查看和修改界面，发现2个页面存在很多重复信息，能不能写一遍？有没有轮子用都不如自己造。解决方式笔者根据自 ... [详细]

蜡笔小新 2024-11-21 10:21:24
list
spring boot使用jetty无法启动

spring boot使用jetty无法启动 ... [详细]

蜡笔小新 2024-11-21 10:15:52
require
深入解析Promise：流程与源码实现

本文探讨了异步编程的发展历程，从最初的AJAX异步回调到现代的Promise、Generator+Co以及Async/Await等技术。文章详细分析了Promise的工作原理及其源码实现，帮助开发者更好地理解和使用这一重要工具。 ... [详细]

蜡笔小新 2024-11-22 15:42:30
int
ASP.NET 进度条实现详解

本文介绍了如何在ASP.NET中使用HTML和JavaScript创建一个动态更新的进度条，并通过Default.aspx页面进行展示。 ... [详细]

蜡笔小新 2024-11-22 15:00:08
int
Python对象序列化至磁盘的封装与实现

本文探讨了如何将Python对象转换为字节流，以实现文件保存、数据库存储或网络传输的需求。主要介绍了利用pickle模块进行序列化的具体方法。 ... [详细]

蜡笔小新 2024-11-22 10:51:09
list
fleaframedb使用之JPA封装介绍

flea,frame,db,使用,之 ... [详细]

蜡笔小新 2024-11-20 12:00:16
future
深入理解RxJava操作符

根据官方定义，RxJava是一种用于异步编程和可观察数据流的API。其核心特性在于流式处理能力和丰富的操作符支持。 ... [详细]

蜡笔小新 2024-11-19 17:37:35
require
计算和为2的幂的偶对数量 | 进阶篇

本文探讨了如何高效地计算数组中和为2的幂的偶对数量，提供了从基础到优化的方法。 ... [详细]

蜡笔小新 2024-11-19 15:51:23
list
开发技巧: Effective Java第三版——优先选用Collection而非Stream作为方法返回类型

在Effective Java第三版中，建议在方法返回类型中优先考虑使用Collection而非Stream，以提高代码的灵活性和兼容性。 ... [详细]

蜡笔小新 2024-11-19 15:31:16
get
如何处理PHP缺少扩展的问题

本文将详细介绍如何解决PHP环境中缺少扩展的问题，包括检查当前环境、修改配置文件以及验证修改是否生效的具体步骤，帮助开发者更好地管理和使用PHP扩展。 ... [详细]

蜡笔小新 2024-11-19 09:19:01
list
Java集合框架深入解析：HashSet详解

本文详细介绍了HashSet类，它是Set接口的一个实现，底层使用哈希表（实际上是HashMap实例）。HashSet不保证元素的迭代顺序，并且是非线程安全的。 ... [详细]

蜡笔小新 2024-11-18 16:58:22

朴子字軒_755

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章