当前位置: 开发笔记 > 编程语言 > 正文

Spark环境搭建——HA高可用模式|博文精选

作者：另df外一个自我_198 | 来源：互联网 | 2023-09-23 08:31

来源|Alice菌编译|CryptoShadow，责编|Carol出品|CSDN云计算（ID：CSDNcloud）本文为大家

来源 | Alice菌

编译 | CryptoShadow&＃xff0c;责编 | Carol

出品 | CSDN云计算&＃xff08;ID&＃xff1a;CSDNcloud&＃xff09;

本文为大家带来的是Spark的HA高可用环境搭建的教程。

原理

Spark Standalone集群是Master-Slaves架构的集群模式&＃xff0c;和大部分的Master-Slaves结构集群一样&＃xff0c;存在着Master单点故障的问题。

如何解决这个单点故障的问题&＃xff0c;Spark提供了两种方案&＃xff1a;

基于文件系统的单点恢复(Single-Node Recovery with Local File System)–只能用于开发或测试环境。
基于zookeeper的Standby Masters(Standby Masters with ZooKeeper)–可以用于生产环境。

配置HA

该HA方案使用起来很简单&＃xff0c;首先启动一个ZooKeeper集群&＃xff0c;然后在不同节点上启动Master&＃xff0c;注意这些节点需要具有相同的zookeeper配置。

先停止Sprak集群

/export/servers/spark/sbin/stop-all.sh

在node01上配置&＃xff1a;

vim /export/servers/spark/conf/spark-env.sh

注释掉Master配置

#export SPARK_MASTER_HOST&＃61;node01

在spark-env.sh添加SPARK_DAEMON_JAVA_OPTS&＃xff0c;内容如下&＃xff1a;

export SPARK_DAEMON_JAVA_OPTS&＃61;"-Dspark.deploy.recoveryMode&＃61;ZOOKEEPER

-Dspark.deploy.zookeeper.url&＃61;node01:2181,node02:2181,node03:2181

-Dspark.deploy.zookeeper.dir&＃61;/spark"

参数说明:

scp到其他节点

scp /export/servers/spark/conf/spark-env.sh

node02:/export/servers/spark/conf/

scp /export/servers/spark/conf/spark-env.sh

node03:/export/servers/spark/conf/

启动zk集群

zkServer.sh status

zkServer.sh stop

zkServer.sh start

启动Spark集群

node01上启动Spark集群执行

/export/servers/spark/sbin/start-all.sh

在node02上再单独只起个master:

/export/servers/spark/sbin/start-master.sh

注意:

在普通模式下启动spark集群

只需要在主节点上执行start-all.sh 就可以了

在高可用模式下启动spark集群

先需要在任意一台主节点上执行start-all.sh

然后在另外一台主节点上单独执行start-master.sh

查看node01和node02

http://node01:8080/

http://node02:8080/

可以观察到有一台状态为StandBy

测试HA

测试主备切换

在node01上使用jps查看master进程id
使用kill -9 id号强制结束该进程
稍等片刻后刷新node02的web界面发现node02为Alive

测试集群模式提交任务

1、集群模式启动spark-shell

/export/servers/spark/bin/spark-shell --master spark://node01:7077,node02:7077

2、运行程序

sc.textFile("hdfs://node01:8020/wordcount/input/words.txt") .flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ &＃43; _) .saveAsTextFile("hdfs://node01:8020/wordcount/output7")

‍

在hue中查看结果

本次分享就是这样啦&＃xff0c;欢迎评论区与我们讨论&＃xff01;

CSDNx巨杉大学联合认证学习&＃xff0c;免费开放&＃xff01;“分布式数据库集训营”帮助您从零开始学习分布式数据库、分布式架构知识&＃xff0c;现在加入活动&＃xff0c;完成课程还将专属礼品。快来参加吧~

了解详情&＃xff1a;http://www.sequoiadb.com/cn/university-camp

推荐阅读&＃xff1a;稳定、可扩展、模块化、简化部署过程、版本控制……一文看懂 Kubernetes 到底如何运用&＃xff01; Java老矣&＃xff0c;尚能饭否&＃xff1f;2020 Java生态系统报告出炉面对 MySQL 查询索引失效&＃xff0c;程序员的六大优化技巧&＃xff01; 隐身术&＃xff1f;登顶 GitHub Top1&＃xff1a;200 行 JS 代码让画面人物瞬间消失&＃xff01; Facebook最新研究&＃xff1a;无需额外训练AI&＃xff0c;即可加速NLP任务耐克为何不接受加密货币付款&＃xff1f; 真香&＃xff0c;朕在看了&＃xff01;点击“阅读原文”&＃xff0c;即可报名

推荐阅读

ip
Linux 环境下 Java 及相关软件的安装指南

本文详细介绍了如何在 Linux 系统上安装 JDK 1.8、MySQL 和 Redis，并提供了相应的环境配置和验证步骤。 ... [详细]

蜡笔小新 2024-11-13 18:10:16
ip
Linux下MySQL 8.0.28安装指南

本文详细介绍了在Linux系统上安装MySQL 8.0.28的步骤，包括下载数据库、解压数据包、安装必要组件和启动MySQL服务。 ... [详细]

蜡笔小新 2024-11-13 14:13:59
config
服务器部署中的安全策略实践与优化

服务器部署中的安全策略实践与优化 ... [详细]

蜡笔小新 2024-11-10 13:04:30
java
Hadoop平台警告解决：无法加载本机Hadoop库的全面应对方案

本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先，通过修改日志配置文件来忽略该警告，这一方法被证明是有效的。其次，尝试指定本地库的路径，但未能解决问题。接着，尝试不使用Hadoop本地库，同样没有效果。然后，通过替换现有的Hadoop本地库，成功解决了问题。最后，根据Hadoop的源代码自行编译本地库，也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]

蜡笔小新 2024-11-09 19:46:30
default
Amoeba 优化 MySQL 读写分离性能

Amoeba 通过优化 MySQL 的读写分离功能显著提升了数据库性能。作为一款基于 MySQL 协议的代理工具，Amoeba 能够高效地处理应用程序的请求，并根据预设的规则将 SQL 请求智能地分配到不同的数据库实例，从而实现负载均衡和高可用性。该方案不仅提高了系统的并发处理能力，还有效减少了主数据库的负担，确保了数据的一致性和可靠性。 ... [详细]

蜡笔小新 2024-11-08 19:19:47
default
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
java
使用ArcGIS for Java和Flex浏览自定义ArcGIS Server 9.3地图

本文介绍了如何在Flex应用程序中实现浏览自定义ArcGIS Server 9.3发布的地图。这是一个基本的入门示例，适用于初学者。 ... [详细]

蜡笔小新 2024-11-13 14:40:13
java
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
ip
思科IOS XE与ISE集成实现TACACS认证配置

本文详细介绍了如何在思科IOS XE设备上配置TACACS认证，并通过ISE（Identity Services Engine）进行用户管理和授权。配置包括网络拓扑、设备设置和ISE端的具体步骤。 ... [详细]

蜡笔小新 2024-11-12 13:17:06
ip
Python 伦理黑客技术：深入探讨后门攻击（第三部分）

在《Python 伦理黑客技术：深入探讨后门攻击（第三部分）》中，作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流，难以确定消息批次的结束点，这给后门攻击的实现带来了挑战。为了解决这一问题，文章提出了一系列有效的技术方案，包括使用特定的分隔符和长度前缀，以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性，还为安全研究人员提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 16:33:02
default
关于使用JavaScript在多个页面间传递参数的技术探讨

本文探讨了使用JavaScript在不同页面间传递参数的技术方法。具体而言，从a.html页面跳转至b.html时，如何携带参数并使b.html替代当前页面显示，而非新开窗口。文中详细介绍了实现这一功能的代码及注释，帮助开发者更好地理解和应用该技术。 ... [详细]

蜡笔小新 2024-11-09 09:28:55
buffer
详解Android连接MySQL数据库的操作流程及技术要点

在Android应用开发中，实现与MySQL数据库的连接是一项重要的技术任务。本文详细介绍了Android连接MySQL数据库的操作流程和技术要点。首先，Android平台提供了SQLiteOpenHelper类作为数据库辅助工具，用于创建或打开数据库。开发者可以通过继承并扩展该类，实现对数据库的初始化和版本管理。此外，文章还探讨了使用第三方库如Retrofit或Volley进行网络请求，以及如何通过JSON格式交换数据，确保与MySQL服务器的高效通信。 ... [详细]

蜡笔小新 2024-11-07 19:11:13
default
Scala学习指南：从零开始掌握基础

本指南从零开始介绍Scala编程语言的基础知识，重点讲解了Scala解释器REPL（读取-求值-打印-循环）的使用方法。REPL是Scala开发中的重要工具，能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习，读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]

蜡笔小新 2024-11-07 18:07:59
bash
在 Windows 系统上使用 Docker 构建 NGINX、PHP、MySQL、Redis 和 Elasticsearch 的集成开发环境

本文介绍了如何在 Windows 系统上利用 Docker 构建一个包含 NGINX、PHP、MySQL、Redis 和 Elasticsearch 的集成开发环境。通过详细的步骤说明，帮助开发者快速搭建和配置这一复杂的技术栈，提升开发效率和环境一致性。 ... [详细]

蜡笔小新 2024-11-07 06:06:15
config
Kafka 集群的高效部署与优化策略

本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤，包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践，涵盖节点选择、网络优化和性能调优等方面，旨在提升系统的稳定性和处理能力。此外，还提供了常见的故障排查方法和监控方案，帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]

蜡笔小新 2024-11-06 20:37:50

另df外一个自我_198

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章