热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

在Windows环境中优化提交Spark任务的方法与实践

一、本地代码编译mvn clean  install -DskipTests二、构建spark提交脚本样例如下:ip_spark.bat@echo offset param=%1set PR

一、本地代码编译

mvn clean  install -DskipTests

二、构建spark提交脚本

样例如下:ip_spark.bat

@echo off
set param=%1
set PROJECT_DIR="D:\gitlab\CP_WiseCloudLocationService_WiseCloudGeoDataBI\geodata-dataprocess\geodata-ipdata-dataprocess"
set COMMON_JARS=%PROJECT_DIR%\target\libs\geodata-common-2.3.3.101.jar
set MAIN_CLASS="com.huawei.wisecloud.location.geodata.common.main.DataAnalysis"
set MAIN_JAR=%PROJECT_DIR%\target\geodata-ipdata-dataprocess-2.3.3.101.jar
set CONFIG_FILE=%PROJECT_DIR%\config\config.properties
cd /d %PROJECT_DIR%
if "%param%"=="debug" (
mvn clean install -DskipTests && spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --driver-java-options -agentlib:jdwp=transport=dt_socket,server=y,suspend=y,address=5005 --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
) else if "%param%"=="ds" (
spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --driver-java-options -agentlib:jdwp=transport=dt_socket,server=y,suspend=y,address=5005 --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
) else if "%param%"=="submit" (
spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
) else (
mvn clean install -DskipTests && spark-submit --driver-memory 10G --num-executors 6 --executor-memory 2G --jars %COMMON_JARS% --class %MAIN_CLASS% --master local[4] %MAIN_JAR% %CONFIG_FILE%
)

三、cmd提交spark任务

提交命令:

ip_spark submit

Windows平台spark任务submit - 文章图片

四、spark任务debug

提交命令:

ip_spark debug

Windows平台spark任务submit - 文章图片

 

端口在监听,如下图:

Windows平台spark任务submit - 文章图片

 

 

 FAQ:

1、spark任务在提交的时候,出现加载hive的临时数据目录权限失败

Windows平台spark任务submit - 文章图片

 

 用命令查询指定文件的权限

命令为:winutils ls software

 

权限不足的文件如下:

C:\>winutils ls software
FindFileOwnerAndPermission error (1789): ????????????????

 

权限777的文件如下:

C:\>winutils chmod -R 777 temp

C:\>winutils ls temp
drwxrwxrwx 1 BUILTIN\Administrators NT AUTHORITY\SYSTEM 4096 Dec 8 2020 temp

 

所以在spark安装的目录下把conf/hive-site.xml文件中的hive的临时数据目录修改为有权限的文件路径

Windows平台spark任务submit - 文章图片

 


推荐阅读
author-avatar
ahhylwjj
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有