关于sparksubmit之后，报错NoClassDefFoundError

作者：夜沙 | 来源：互联网 | 2023-10-12 10:19

NoClassDefFoundError：org.apache.hadoop.hdfs.server.namenode.NameNode这个问题，困扰了我五天时间，之前使用Ecli

NoClassDefFoundError：org.apache.hadoop.hdfs.server.namenode.NameNode

这个问题，困扰了我五天时间，之前使用Eclispe打包之后，在云服务器上面运行。

首先报错java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration。随之采取的操作是：将$HBASE_HOME/lib的jar包全部拷贝到$SPARK_HOME/jars下。我先保留了spark中的较新版本的jar包，发现问题变成了噩梦般的NoClassDefFoundError：Could not initialize class org.apache.hadoop.hdfs.server.namenode。(就是这个错，让我一直以为是Hadoop的配置有问题&＃8230;)

然后我尝试了保留hbase的所有jar包到spark之后，发现还是一样的问题。当时我就懵了。

于是我不断Google并尝试了如下所有操作：

在spark-env.sh中加入：SPAKR_COMMON_HOME；加入：SPARK_PREFIX；

在Hadoop中拷贝所有jar包到spark；

重新搭建云服务器集群×3；

在spark-submit命令中，指定&＃8211;driver-class-path；指定&＃8211;jars等等等等，总计不下二十种方法来解决这个问题。但是无一不是相同的错误：NoClassDefFoundError：Could not initialize class org.apache.hadoop.hdfs.server.namenode。在很奇怪的同时，我不甘心会因为这个问题把我活生生卡住，在考虑到是spark执行任务找不到hdfs之后，继续搜索，发现并没有哪位前辈的帖子里有涉及hadoop的jar包到spark中去，于是，我删除了spark-env.sh中的SPARK_CLASSPATH，改于在spark-submit命令中进行制定。

最终指令为：

bin/spark-submit &＃8211;class package.test &＃8211;jars $(echo $HBASE_HOME/lib/*.jar | tr &＃8216; &＃8216; &＃8216;,&＃8217; ) &＃8211;master local[5] /opt/RecommendSystem-1.0.jar

&＃8211;class后面的为完整报名.类名

问题解决。

推荐阅读

ip
Spark与HBase结合处理大规模流量数据结构设计

本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理，包括数据结构的设计和优化方法。 ... [详细]

蜡笔小新 2024-11-12 19:49:05
int
RocketMQ 运维监控实践指南

本文详细介绍了如何实现 RocketMQ 的运维监控，包括监控平台的搭建、常用运维命令及其具体用法。适合对 RocketMQ 监控感兴趣的读者参考。 ... [详细]

蜡笔小新 2024-11-16 13:53:02
ip
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
int
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
int
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
get
优化Hadoop 2.7.2源代码以支持Snappy压缩和解压功能的Native编译

为了在Hadoop 2.7.2中实现对Snappy压缩和解压功能的原生支持，本文详细介绍了如何重新编译Hadoop源代码，并优化其Native编译过程。通过这一优化，可以显著提升数据处理的效率和性能。此外，还探讨了编译过程中可能遇到的问题及其解决方案，为用户提供了一套完整的操作指南。 ... [详细]

蜡笔小新 2024-11-09 19:45:36
int
Kafka 集群的高效部署与优化策略

本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤，包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践，涵盖节点选择、网络优化和性能调优等方面，旨在提升系统的稳定性和处理能力。此外，还提供了常见的故障排查方法和监控方案，帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]

蜡笔小新 2024-11-06 20:37:50
int
第二章：Kafka基础入门与核心概念解析

本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统，以其卓越的性能和高吞吐量而著称。最初，Kafka被设计用于LinkedIn的活动流和运营数据处理，旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景，读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]

蜡笔小新 2024-11-06 11:10:03
int
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
python
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
python
ARM平台下构建SSH服务端并实现远程访问

本文详细介绍了如何在ARM架构的目标设备上部署SSH服务端，包括必要的软件包下载、交叉编译过程以及最终的服务配置与测试。适合嵌入式开发人员和系统集成工程师参考。 ... [详细]

蜡笔小新 2024-11-20 14:13:38
ip
构建高可用性Apache集群的Heartbeat使用指南

本文详细介绍了如何使用Heartbeat构建一个高可用性的Apache集群，包括安装、配置和测试步骤。 ... [详细]

蜡笔小新 2024-11-18 13:54:04
int
MapReduce 中的输入输出格式控制

本文介绍了如何在 MapReduce 作业中使用 SequenceFileOutputFormat 生成 SequenceFile 文件，并详细解释了 SequenceFile 的结构和用途。 ... [详细]

蜡笔小新 2024-11-17 14:43:42
get
解决 Ubuntu 环境下 Hadoop 集群 SSH 密钥认证问题

本文详细介绍了在 Ubuntu 系统上搭建 Hadoop 集群时遇到的 SSH 密钥认证问题及其解决方案。通过本文，读者可以了解如何在多台虚拟机之间实现无密码 SSH 登录，从而顺利启动 Hadoop 集群。 ... [详细]

蜡笔小新 2024-11-13 09:14:02
get
Hadoop平台警告解决：无法加载本机Hadoop库的全面应对方案

本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先，通过修改日志配置文件来忽略该警告，这一方法被证明是有效的。其次，尝试指定本地库的路径，但未能解决问题。接着，尝试不使用Hadoop本地库，同样没有效果。然后，通过替换现有的Hadoop本地库，成功解决了问题。最后，根据Hadoop的源代码自行编译本地库，也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]

蜡笔小新 2024-11-09 19:46:30

夜沙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章