当前位置: 开发笔记 > 编程语言 > 正文

Yarn框架下的系统部署

作者：穷游小美女 | 来源：互联网 | 2023-09-03 16:16

使用yarn部署hadoop和spark使用Yarn本地部署Hadoop修改配置文件首先修改mapred-sit.xml文件：cdusrlocalhadoope

使用yarn部署hadoop和spark

使用Yarn本地部署Hadoop

修改配置文件

首先修改mapred-sit.xml文件&＃xff1a;

cd /usr/local/hadoop/etc/hadoop mv mapred-site.xml.template mapred-site.xml

54206786600

修改为&＃xff1a;

<configuration><property><name>mapreduce.framework.namename><value>yarnvalue>property> configuration>

54206785472

修改配置文件yarn-site.xml&＃xff1a;

<configuration><property><name>yarn.nodemanager.aux-servicesname><value>mapreduce_shufflevalue>property> configuration>

重新启动

start-dfs.sh 和 start-yarn.sh命令启动hadoop和yarn&＃xff1a;

54206797505

开启历史服务器&＃xff0c;才能在Web中查看任务运行情况&＃xff1a;

mr-jobhistory-daemon.sh start historyserver

再查看进程&＃xff0c;多出NodeManager和ResourceManager两个进程&＃xff1a;

54206813452

如果以后在伪分布式模式下启动Hadoop的时候不想启动Yarn&＃xff0c;务必把配置文件mapred-site.xml重命名为mapred-site.xml.template

使用Yarn本地部署Spark

修改配置文件

cd /usr/local/spark/conf vim spark-env.sh

添加&＃xff1a;

export HADOOP_CONF_DIR&＃61;/usr/local/hadoop/etc/hadoop

这样Spark就可以跑在YARN上了&＃xff0c;也没必要启动spark的master和slaves服务&＃xff0c;因为是靠yarn进行任务调度&＃xff0c;所以直接提交任务即可&＃xff1a;

spark-shell --master yarn-client

提示ERROR&＃xff0c;这是由于JAVA8的问题&＃xff0c;具体参考这里。

54206913078

首先需要关闭hadoop和yarn&＃xff1a;

stop-dfs.sh stop-yarn.sh

在/usr/local/hadoop/etc/hadoop/目录下修改yarn-site.xml文件&＃xff1a;

<property><name>yarn.nodemanager.pmem-check-enabledname><value>falsevalue> property><property><name>yarn.nodemanager.vmem-check-enabledname><value>falsevalue> property>

再次启动&＃xff0c;成功&＃xff1a;

54207031950

在shell中运行例子&＃xff1a;

val textFile &＃61; sc.textFile("hdfs://localhost:9000/user/hadoop/input/k-means.dat") textFile.first()

54207035245

成功&＃xff01;

使用yarn查看作业

在浏览器中查看

在浏览器中输入lcoalhost:8088&＃xff0c;在yarn中查看任务&＃xff1a;

54207100955

会发现spark的任务会提交到yarn&＃xff0c;而无需启动master和slave节点。

使用hadoop提交

cd /usr/local/hadoop hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output/yarn ‘dfs[a-z.]&＃43;’

54207126288

作业运行成功&＃xff0c;在yarn中查看任务&＃xff1a;

54207141656

但是&＃xff0c;无论该任务是否成功&＃xff0c;在yarn中查看&＃xff0c;只能知道这个container是否运行完&＃xff0c;因此&＃xff0c;需要通过logs进行查看任务的具体运行情况。

使用spark提交

只需要在master节点中添加master即可&＃xff0c;例如&＃xff1a;

spark-submit --class StuScore --master yarn StuScore-1.0.jar

注意&＃xff1a;如果是自己编写的程序&＃xff0c;不要在程序中将sparkcontext指定为local

查看yarn logs

在yarn-env.sh中查看log的目录&＃xff1a;

54207184629

默认目录在/usr/local/hadoop/logs里面&＃xff1a;

54207281436

可以发现application的log都存放在里面&＃xff0c;现在可以根据web上展示的applicationID选择需要查看的log

关于yarn的log&＃xff0c;可参考这里。

推荐阅读

heap
Presto：高效即席查询引擎的深度解析与应用

本文深入解析了Presto这一高效的即席查询引擎，详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式，显著提升了查询性能，相比传统的MapReduce查询，不仅减少了数据传输的延迟，还提高了查询的准确性和效率。然而，Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景，展示了其在大数据分析领域的强大潜力。 ... [详细]

蜡笔小新 2024-11-07 19:17:47
web
深入探讨ASP.NET 2.0中的Callback机制及其应用

本文详细解析了ASP.NET 2.0中的Callback机制，不仅介绍了基本的使用方法，还深入探讨了其背后的实现原理。通过对比Atlas框架，帮助读者更好地理解和应用这一机制。 ... [详细]

蜡笔小新 2024-11-14 10:03:15
web
为什么多数程序员难以成为架构师？

探讨80%的程序员为何难以晋升为架构师，涉及技术深度、经验积累和综合能力等方面。本文将详细解析Tomcat的配置和服务组件，帮助读者理解其内部机制。 ... [详细]

蜡笔小新 2024-11-14 03:39:46
web
Linux 环境下 Java 及相关软件的安装指南

本文详细介绍了如何在 Linux 系统上安装 JDK 1.8、MySQL 和 Redis，并提供了相应的环境配置和验证步骤。 ... [详细]

蜡笔小新 2024-11-13 18:10:16
web
Java代码分层详解及其应用场景

本文详细介绍了Java代码分层的基本概念和常见分层模式，特别是MVC模式。同时探讨了不同项目需求下的分层策略，帮助读者更好地理解和应用Java分层思想。 ... [详细]

蜡笔小新 2024-11-13 17:03:49
utf-8
使用ArcGIS for Java和Flex浏览自定义ArcGIS Server 9.3地图

本文介绍了如何在Flex应用程序中实现浏览自定义ArcGIS Server 9.3发布的地图。这是一个基本的入门示例，适用于初学者。 ... [详细]

蜡笔小新 2024-11-13 14:40:13
web
深入解析Struts、Spring与Hibernate三大框架的面试要点与技巧

深入解析Struts、Spring与Hibernate三大框架的面试要点与技巧 ... [详细]

蜡笔小新 2024-11-11 13:09:30
web
深入解析几种常用的Java后端开发框架组合及其应用场景

本文详细探讨了几种常用的Java后端开发框架组合及其具体应用场景。通过对比分析Spring Boot、MyBatis、Hibernate等框架的特点和优势，结合实际项目需求，为开发者提供了选择合适框架组合的参考依据。同时，文章还介绍了这些框架在微服务架构中的应用，帮助读者更好地理解和运用这些技术。 ... [详细]

蜡笔小新 2024-11-11 10:12:51
shell
Hadoop平台警告解决：无法加载本机Hadoop库的全面应对方案

本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先，通过修改日志配置文件来忽略该警告，这一方法被证明是有效的。其次，尝试指定本地库的路径，但未能解决问题。接着，尝试不使用Hadoop本地库，同样没有效果。然后，通过替换现有的Hadoop本地库，成功解决了问题。最后，根据Hadoop的源代码自行编译本地库，也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]

蜡笔小新 2024-11-09 19:46:30
shell
Amoeba 优化 MySQL 读写分离性能

Amoeba 通过优化 MySQL 的读写分离功能显著提升了数据库性能。作为一款基于 MySQL 协议的代理工具，Amoeba 能够高效地处理应用程序的请求，并根据预设的规则将 SQL 请求智能地分配到不同的数据库实例，从而实现负载均衡和高可用性。该方案不仅提高了系统的并发处理能力，还有效减少了主数据库的负担，确保了数据的一致性和可靠性。 ... [详细]

蜡笔小新 2024-11-08 19:19:47
shell
CLIfe：我的高效开发环境配置

在开发过程中，我最初也依赖于功能全面但操作繁琐的集成开发环境（IDE），如Borland Delphi 和 Microsoft Visual Studio。然而，随着对高效开发的追求，我逐渐转向了更加轻量级和灵活的工具组合。通过 CLIfe，我构建了一个高度定制化的开发环境，不仅提高了代码编写效率，还简化了项目管理流程。这一配置结合了多种强大的命令行工具和插件，使我在日常开发中能够更加得心应手。 ... [详细]

蜡笔小新 2024-11-07 18:32:20
web
javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例

javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 15:24:50
web
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
shell
服务器部署中的安全策略实践与优化

服务器部署中的安全策略实践与优化 ... [详细]

蜡笔小新 2024-11-10 13:04:30
string
在CentOS系统下详细解析阿里云ECS服务器上搭建LAMP环境的配置步骤

本文详细介绍了在CentOS 6.5 64位系统上使用阿里云ECS服务器搭建LAMP环境的具体步骤。首先，通过PuTTY工具实现远程连接至服务器。接着，检查当前系统的磁盘空间使用情况，确保有足够的空间进行后续操作，可使用 `df` 命令进行查看。此外，文章还涵盖了安装和配置Apache、MySQL和PHP的相关步骤，以及常见问题的解决方法，帮助用户顺利完成LAMP环境的搭建。 ... [详细]

蜡笔小新 2024-11-09 15:09:47

穷游小美女

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章