作者:我的双宝宝_486 | 来源:互联网 | 2023-07-21 15:20
如题,每次执行任务的时候,都会有上传jar包的日志,这部分执行时长大概有10s左右,怎么能将这部分的时间优化?sprak的配置文件中有这个配置:spark.yarn.jars
如题,每次执行任务的时候,都会有上传jar包的日志,这部分执行时长大概有10s左右,怎么能将这部分的时间优化?
sprak的配置文件中有这个配置:
spark.yarn.jars hdfs://hadoop-server-master-196:9000/spark/lib_jars/*.jar
任务的部分日志如下图:
2 个解决方案
spark-env.sh 脚本里面添加一行
export SPARK_DIST_CLASSPATH=”SPARK_DIST_CLASSPATH:/usr/lib/path/*”
项目中用到的jar包放到这个目录下就行了