当前位置: 开发笔记 > 编程语言 > 正文

SparkCore（5）：SparkonStandalone配置和测试

作者：萧逸 | 来源：互联网 | 2023-09-15 12:18

1.实现功能Spark应用运行在Standalone资源管理框架系统上，Standalone是spark自带的一种资源管理框架，类似yarn࿰

1.实现功能

Spark应用运行在Standalone资源管理框架系统上&＃xff0c;Standalone是spark自带的一种资源管理框架&＃xff0c;类似yarn&＃xff0c;分布式的。

2.Standalone的框架

Worker&＃xff1a; 执行节点服务&＃xff0c;管理当前节点的资源及启动executor
Master: 集群资源管理及申请

3.配置信息

&＃xff08;1&＃xff09;要求&＃xff1a;spark的local本地模式可以成功运行&＃xff0c;配置spark-env.sh

JAVA_HOME&＃61;/opt/jdk1.8.0_151 SCALA_HOME&＃61;/opt/modules/scala-2.11.8HADOOP_CONF_DIR&＃61;/opt/modules/apache/hadoop-2.7.3/etc/hadoop SPARK_LOCAL_IP&＃61;bigdata.ibeifeng.com

&＃xff08;2&＃xff09;在spark-env.sh添加master和worker信息

&＃xff08;a&＃xff09;虚拟机

SPARK_MASTER_IP&＃61;bigdata.ibeifeng.com SPARK_MASTER_PORT&＃61;7070 SPARK_MASTER_WEBUI_PORT&＃61;8080 SPARK_WORKER_CORES&＃61;2 SPARK_WORKER_MEMORY&＃61;2g SPARK_WORKER_PORT&＃61;7071 SPARK_WORKER_WEBUI_PORT&＃61;8081 SPARK_WORKER_INSTANCES&＃61;2

&＃xff08;b&＃xff09;服务器配置

SPARK_MASTER_HOST&＃61;hadoop SPARK_WORKER_CORES&＃61;2 SPARK_WORKER_MEMORY&＃61;2g SPARK_WORKER_INSTANCES&＃61;1

(3)配置slaves文件

mv slaves.template slaves

添加

&＃xff08;a&＃xff09;虚拟机

# A Spark Worker will be started on each of the machines listed below. bigdata.ibeifeng.com

&＃xff08;b&＃xff09;服务器

# A Spark Worker will be started on each of the machines listed below. hadoop

&＃xff08;4&＃xff09;启动服务

sbin/start-all.sh

结果&＃xff1a;

&＃xff08;a&＃xff09;服务器

starting org.apache.spark.deploy.master.Master, logging to /opt/modules/spark-2.1.0-bin-2.6.0-cdh5.7.0/logs/spark-root-org.apache.spark.deploy.master.Master-1-hadoop.out hadoop: starting org.apache.spark.deploy.worker.Worker, logging to /opt/modules/spark-2.1.0-bin-2.6.0-cdh5.7.0/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-hadoop.out其中&＃xff0c;master和worker分别记录在/opt/modules/spark-2.1.0-bin-2.6.0-cdh5.7.0/logs/spark-root-org.apache.spark.deploy.master.Master-1-hadoop.out和/opt/modules/spark-2.1.0-bin-2.6.0-cdh5.7.0/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-hadoop.out

4.测试

&＃xff08;1&＃xff09;启动spark-shell

&＃xff08;a&＃xff09;虚拟机

bin/spark-shell --master spark://bigdata.ibeifeng.com:7070

&＃xff08;b&＃xff09;服务器

bin/spark-shell --master spark://hadoop:7077 结果&＃xff1a; Spark context available as &＃39;sc&＃39; (master &＃61; spark://hadoop:7077, app id &＃61; app-20190116000819-0001). Spark session available as &＃39;spark&＃39;. Welcome to____ __/ __/__ ___ _____/ /___\ \/ _ \/ _ &＃96;/ __/ &＃39;_//___/ .__/\_,_/_/ /_/\_\ version 2.1.0/_/Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_151) Type in expressions to have them evaluated. Type :help for more information. scala>

&＃xff08;2&＃xff09;测试topN

val lines &＃61; sc.textFile("/README.md") #这个是HDFS上的路径 val words &＃61; lines.flatMap(line &＃61;> line.split(" ")) val words2 &＃61; words.map(word &＃61;> (word,1)) val wordCountRDD&＃61; words2.reduceByKey(_ &＃43; _) wordCountRDD.sortBy(t &＃61;> -t._2).take(10)

&＃xff08;测试成功~&＃xff09;

推荐阅读

version
如何在Linux服务器上配置MySQL和Tomcat的开机自动启动

在Linux服务器上部署Web项目时，通常需要确保MySQL和Tomcat服务能够随系统启动而自动运行。本文将详细介绍如何在Linux环境中配置MySQL和Tomcat的开机自启动，以确保服务的稳定性和可靠性。通过合理的配置，可以有效避免因服务未启动而导致的项目故障。 ... [详细]

蜡笔小新 2024-11-11 19:41:03
version
WordPress Duplicator 0.4.4 版本存在跨站脚本攻击漏洞分析

在对WordPress Duplicator插件0.4.4版本的安全评估中，发现其存在跨站脚本（XSS）攻击漏洞。此漏洞可能被利用进行恶意操作，建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的，使用时需自行承担风险。漏洞编号：HTB23162。 ... [详细]

蜡笔小新 2024-11-10 13:16:43
version
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08
io
在List和Set集合中存储Object类型的数据元素

在List和Set集合中存储Object类型的数据元素 ... [详细]

蜡笔小新 2024-11-09 18:55:32
version
理解和优化进程与线程状态转换机制

在Cisco IOS XR系统中，存在提供服务的服务器和使用这些服务的客户端。本文深入探讨了进程与线程状态转换机制，分析了其在系统性能优化中的关键作用，并提出了改进措施，以提高系统的响应速度和资源利用率。通过详细研究状态转换的各个环节，本文为开发人员和系统管理员提供了实用的指导，旨在提升整体系统效率和稳定性。 ... [详细]

蜡笔小新 2024-11-09 18:33:35
io
ESP8266 01S Web 服务器成功启动：详细解决方案与实践指南

本文详细介绍了一种利用 ESP8266 01S 模块构建 Web 服务器的成功实践方案。通过具体的代码示例和详细的步骤说明，帮助读者快速掌握该模块的使用方法。在疫情期间，作者重新审视并研究了这一未被充分利用的模块，最终成功实现了 Web 服务器的功能。本文不仅提供了完整的代码实现，还涵盖了调试过程中遇到的常见问题及其解决方法，为初学者提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-08 19:12:49
version
Squaretest：自动生成功能测试代码的高效插件

本文将介绍一款名为Squaretest的高效插件，该工具能够自动生成功能测试代码。使用这款插件的主要原因是公司近期加强了代码质量的管控，对各项目进行了严格的单元测试评估。Squaretest不仅提高了测试代码的生成效率，还显著提升了代码的质量和可靠性。 ... [详细]

蜡笔小新 2024-11-07 15:34:27
io
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
js
JavaWeb文件上传：前端实现与后端处理详解

在JavaWeb开发中，文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件，都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件，该库提供了强大的文件解析和存储能力，能够高效地处理各种文件类型。此外，为了提高系统的安全性和稳定性，还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]

蜡笔小新 2024-11-11 19:50:46
io
解决Android EditText中TextWatcher的onTextChanged方法频繁触发问题

【问题】在Android开发中，当为EditText添加TextWatcher并实现onTextChanged方法时，会遇到一个问题：即使只对EditText进行一次修改（例如使用删除键删除一个字符），该方法也会被频繁触发。这不仅影响性能，还可能导致逻辑错误。本文将探讨这一问题的原因，并提供有效的解决方案，包括使用Handler或计时器来限制方法的调用频率，以及通过自定义TextWatcher来优化事件处理，从而提高应用的稳定性和用户体验。 ... [详细]

蜡笔小新 2024-11-10 12:50:42
version
求助：如何使用Pull方法解析标签内容，悬赏50分求完美解决方案

在处理 XML 数据时，如果需要解析 `` 标签的内容，可以采用 Pull 解析方法。Pull 解析是一种高效的 XML 解析方式，适用于流式数据处理。具体实现中，可以通过 Java 的 `XmlPullParser` 或其他类似的库来逐步读取和解析 XML 文档中的 `` 元素。这样不仅能够提高解析效率，还能减少内存占用。本文将详细介绍如何使用 Pull 解析方法来提取 `` 标签的内容，并提供一个示例代码，帮助开发者快速解决问题。 ... [详细]

蜡笔小新 2024-11-09 11:50:14
php
ButterKnife的基础应用与实践指南

ButterKnife 是一款用于 Android 开发的注解库，主要用于简化视图和事件绑定。本文详细介绍了 ButterKnife 的基础用法，包括如何通过注解实现字段和方法的绑定，以及在实际项目中的应用示例。此外，文章还提到了截至 2016 年 4 月 29 日，ButterKnife 的最新版本为 8.0.1，为开发者提供了最新的功能和性能优化。 ... [详细]

蜡笔小新 2024-11-07 13:17:24
io
Kafka 集群的高效部署与优化策略

本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤，包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践，涵盖节点选择、网络优化和性能调优等方面，旨在提升系统的稳定性和处理能力。此外，还提供了常见的故障排查方法和监控方案，帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]

蜡笔小新 2024-11-06 20:37:50
range
HBase Java API 进阶：过滤器详解与应用实例

本文详细探讨了HBase 1.2.6版本中Java API的高级应用，重点介绍了过滤器的使用方法和实际案例。首先，文章对几种常见的HBase过滤器进行了概述，包括列前缀过滤器（ColumnPrefixFilter）和时间戳过滤器（TimestampsFilter）。此外，还详细讲解了分页过滤器（PageFilter）的实现原理及其在大数据查询中的应用场景。通过具体的代码示例，读者可以更好地理解和掌握这些过滤器的使用技巧，从而提高数据处理的效率和灵活性。 ... [详细]

蜡笔小新 2024-11-05 15:08:18
version
Hadoop集群搭建常见问题与解决方案（一）：避免配置过程中的常见陷阱

在搭建Hadoop集群以处理大规模数据存储和频繁读取需求的过程中，经常会遇到各种配置难题。本文总结了作者在实际部署中遇到的典型问题，并提供了详细的解决方案，帮助读者避免常见的配置陷阱。通过这些经验分享，希望读者能够更加顺利地完成Hadoop集群的搭建和配置。 ... [详细]

蜡笔小新 2024-11-03 19:59:23

萧逸

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章