热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

在Windows环境中优化提交Spark任务的方法与实践

一、本地代码编译mvn clean  install -DskipTests二、构建spark提交脚本样例如下:ip_spark.bat@echo offset param=%1set PR

一、本地代码编译

mvn clean  install -DskipTests

二、构建spark提交脚本

样例如下:ip_spark.bat

@echo off
set param=%1
set PROJECT_DIR="D:\gitlab\CP_WiseCloudLocationService_WiseCloudGeoDataBI\geodata-dataprocess\geodata-ipdata-dataprocess"
set COMMON_JARS=%PROJECT_DIR%\target\libs\geodata-common-2.3.3.101.jar
set MAIN_CLASS="com.huawei.wisecloud.location.geodata.common.main.DataAnalysis"
set MAIN_JAR=%PROJECT_DIR%\target\geodata-ipdata-dataprocess-2.3.3.101.jar
set CONFIG_FILE=%PROJECT_DIR%\config\config.properties
cd /d %PROJECT_DIR%
if "%param%"=="debug" (
mvn clean install -DskipTests && spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --driver-java-options -agentlib:jdwp=transport=dt_socket,server=y,suspend=y,address=5005 --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
) else if "%param%"=="ds" (
spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --driver-java-options -agentlib:jdwp=transport=dt_socket,server=y,suspend=y,address=5005 --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
) else if "%param%"=="submit" (
spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
) else (
mvn clean install -DskipTests && spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
)

三、cmd提交spark任务

提交命令:

ip_spark submit

Windows平台spark任务submit - 文章图片

四、spark任务debug

提交命令:

ip_spark debug

Windows平台spark任务submit - 文章图片

 

端口在监听,如下图:

Windows平台spark任务submit - 文章图片

 

 

 FAQ:

1、spark任务在提交的时候,出现加载hive的临时数据目录权限失败

Windows平台spark任务submit - 文章图片

 

 用命令查询指定文件的权限

命令为:winutils ls software

 

权限不足的文件如下:

C:\>winutils ls software
FindFileOwnerAndPermission error (1789): ????????????????

 

权限777的文件如下:

C:\>winutils chmod -R 777 temp

C:\>winutils ls temp
drwxrwxrwx 1 BUILTIN\Administrators NT AUTHORITY\SYSTEM 4096 Dec 8 2020 temp

 

所以在spark安装的目录下把conf/hive-site.xml文件中的hive的临时数据目录修改为有权限的文件路径

Windows平台spark任务submit - 文章图片

 


推荐阅读
  • SpringBoot启动脚本详解:BAT文件应用与基础入门指南(SpringBoot系列第1篇)
    如果你还在为SSM框架的复杂搭建过程和繁琐的配置文件而烦恼,那么SpringBoot将是你的一大福音。作为SpringBoot系列的第一篇文章,本文详细介绍了如何使用BAT文件来启动SpringBoot应用,并提供了基础入门指南,帮助开发者快速上手,简化开发流程。 ... [详细]
  • Windows环境下详细教程:如何搭建Git服务
    Windows环境下详细教程:如何搭建Git服务 ... [详细]
  • IIS 7及7.5版本中应用程序池的最佳配置策略与实践
    在IIS 7及7.5版本中,优化应用程序池的配置是提升Web站点性能的关键步骤。具体操作包括:首先定位到目标Web站点的应用程序池,然后通过“应用程序池”菜单找到对应的池,右键选择“高级设置”。在一般优化方案中,建议调整以下几个关键参数:1. **基本设置**: - **队列长度**:默认值为1000,可根据实际需求调整队列长度,以提高处理请求的能力。此外,还可以进一步优化其他参数,如处理器使用限制、回收策略等,以确保应用程序池的高效运行。这些优化措施有助于提升系统的稳定性和响应速度。 ... [详细]
  • 多种实现 Windows 定时自动执行任务的专业技巧与方案
    在Windows系统中,实现定时自动执行任务有多种专业技巧和方案。常见的方法包括:使用Windows任务计划程序、开发Windows服务以及利用SQL Server Agent作业。这些方法被广泛应用于各种自动化场景,多数技术人员对此都有所了解。 ... [详细]
  • 本文深入探讨了Spring Cloud Eureka在企业级应用中的高级使用场景及优化策略。首先,介绍了Eureka的安全配置,确保服务注册与发现过程的安全性。接着,分析了Eureka的健康检查机制,提高系统的稳定性和可靠性。随后,详细讨论了Eureka的各项参数调优技巧,以提升性能和响应速度。最后,阐述了如何实现Eureka的高可用性部署,保障服务的连续性和可用性。通过这些内容,开发者可以更好地理解和运用Eureka,提升微服务架构的整体效能。 ... [详细]
  • 如何利用Apache与Nginx高效实现动静态内容分离
    如何利用Apache与Nginx高效实现动静态内容分离 ... [详细]
  • 优化Oracle数据库日志功能的关闭方法与实践
    在优化Oracle数据库日志功能的过程中,关闭不必要的日志记录是一项重要任务。本文探讨了Oracle 11g中日志路径的配置和管理,特别是针对常用的警报日志(alert log)。通过合理配置 `alert_$ORACLE_SID.log` 文件,可以有效减少日志文件的大小和提高系统性能。此外,文章还介绍了如何通过调整参数和使用脚本自动化日志管理,进一步提升数据库的稳定性和维护效率。 ... [详细]
  • 本课程详细解析了Spring AOP的核心概念及其增强机制,涵盖前置增强、后置增强和环绕增强等类型。通过具体示例,深入探讨了如何在实际开发中有效运用这些增强技术,以提升代码的模块化和可维护性。此外,还介绍了Spring AOP在异常处理和性能监控等场景中的应用,帮助开发者更好地理解和掌握这一强大工具。 ... [详细]
  • RancherOS 是由 Rancher Labs 开发的一款专为 Docker 设计的轻量级 Linux 发行版,提供了一个全面的 Docker 运行环境。其引导镜像仅 20MB,非常适合在资源受限的环境中部署。本文将详细介绍如何在 ESXi 虚拟化平台上安装和配置 RancherOS,帮助用户快速搭建高效、稳定的容器化应用环境。 ... [详细]
  • SQL Server 数据导入过程中遇到错误:MySQL 文件导入失败分析与解决 ... [详细]
  • 本书《.NET Core 2.* 开发者指南》是面向开发者的全面学习与实践手册,涵盖了从基础到高级的各个层面。书中详细解析了 .NET Core 的核心概念,包括如何创建 .NET Core 网站,并通过视频教程直观展示操作过程。此外,还深入探讨了 Startup 类的作用、项目目录结构的组织方式以及如何在应用中使用静态文件等内容。对于希望深入了解 .NET Core 架构和开发技巧的开发者来说,本书提供了丰富的实践案例和详尽的技术指导。 ... [详细]
  • 深入解析Spring Boot源码的序章
    本系列文章旨在深入解析Spring Boot的源代码,分享笔者在学习过程中的心得与体会。内容涵盖核心源码分析,可能会对初学者造成一定理解难度,建议读者结合笔者提供的详细注释进行阅读,以获得更好的学习体验。 ... [详细]
  • 如何合理配置服务器系统盘容量?云服务器系统盘大小应如何选择?
    在选择云服务器系统盘容量时,需综合考虑操作系统、应用程序及未来扩展需求。对于已配置好的Linux云服务器,建议通过创建系统盘镜像来保存当前设置,以便于后续的快速部署与恢复。此外,合理的系统盘容量规划还能有效提升数据管理效率,减少不必要的存储成本。 ... [详细]
  • SSMS 启动故障:错误报告与解决求助 ... [详细]
  • 在Hive中执行复杂SQL查询时,可能会遇到返回代码2的运行时错误。该问题通常发生在使用HiveServer2启动服务端并使用Beeline客户端进行连接的情况下。具体原因可能包括资源不足、配置不当或数据倾斜等。为了解决这一问题,建议检查集群资源分配、调整相关配置参数,并优化查询逻辑以减少数据倾斜。此外,还可以通过启用调试日志来获取更多错误信息,从而更好地定位和解决问题。 ... [详细]
author-avatar
ahhylwjj
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有