热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Yarn框架下的系统部署

使用yarn部署hadoop和spark使用Yarn本地部署Hadoop修改配置文件首先修改mapred-sit.xml文件:cdusrlocalhadoope

使用yarn部署hadoop和spark

使用Yarn本地部署Hadoop


修改配置文件

首先修改mapred-sit.xml文件:

cd /usr/local/hadoop/etc/hadoop
mv mapred-site.xml.template mapred-site.xml

54206786600

修改为:

<configuration><property><name>mapreduce.framework.namename><value>yarnvalue>property>
configuration>

54206785472

修改配置文件yarn-site.xml&#xff1a;

<configuration><property><name>yarn.nodemanager.aux-servicesname><value>mapreduce_shufflevalue>property>
configuration>

重新启动

start-dfs.shstart-yarn.sh命令启动hadoop和yarn&#xff1a;

54206797505

开启历史服务器&#xff0c;才能在Web中查看任务运行情况&#xff1a;

mr-jobhistory-daemon.sh start historyserver

再查看进程&#xff0c;多出NodeManager和ResourceManager两个进程&#xff1a;

54206813452

如果以后在伪分布式模式下启动Hadoop的时候不想启动Yarn&#xff0c;务必把配置文件mapred-site.xml重命名为mapred-site.xml.template

使用Yarn本地部署Spark


修改配置文件

cd /usr/local/spark/conf
vim spark-env.sh

添加&#xff1a;

export HADOOP_CONF_DIR&#61;/usr/local/hadoop/etc/hadoop

这样Spark就可以跑在YARN上了&#xff0c;也没必要启动spark的master和slaves服务&#xff0c;因为是靠yarn进行任务调度&#xff0c;所以直接提交任务即可&#xff1a;

spark-shell --master yarn-client

提示ERROR&#xff0c;这是由于JAVA8的问题&#xff0c;具体参考这里。

54206913078

首先需要关闭hadoop和yarn&#xff1a;

stop-dfs.sh
stop-yarn.sh

/usr/local/hadoop/etc/hadoop/目录下修改yarn-site.xml文件&#xff1a;

<property><name>yarn.nodemanager.pmem-check-enabledname><value>falsevalue>
property><property><name>yarn.nodemanager.vmem-check-enabledname><value>falsevalue>
property>

再次启动&#xff0c;成功&#xff1a;

54207031950

在shell中运行例子&#xff1a;

val textFile &#61; sc.textFile("hdfs://localhost:9000/user/hadoop/input/k-means.dat")
textFile.first()

54207035245

成功&#xff01;

使用yarn查看作业


在浏览器中查看

在浏览器中输入lcoalhost:8088&#xff0c;在yarn中查看任务&#xff1a;

54207100955

会发现spark的任务会提交到yarn&#xff0c;而无需启动master和slave节点。

使用hadoop提交

cd /usr/local/hadoop
hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output/yarn ‘dfs[a-z.]&#43;’

54207126288

作业运行成功&#xff0c;在yarn中查看任务&#xff1a;

54207141656

但是&#xff0c;无论该任务是否成功&#xff0c;在yarn中查看&#xff0c;只能知道这个container是否运行完&#xff0c;因此&#xff0c;需要通过logs进行查看任务的具体运行情况。

使用spark提交

只需要在master节点中添加master即可&#xff0c;例如&#xff1a;

spark-submit --class StuScore --master yarn StuScore-1.0.jar

注意&#xff1a;如果是自己编写的程序&#xff0c;不要在程序中将sparkcontext指定为local

查看yarn logs

yarn-env.sh中查看log的目录&#xff1a;

54207184629

默认目录在/usr/local/hadoop/logs里面&#xff1a;

54207281436

可以发现application的log都存放在里面&#xff0c;现在可以根据web上展示的applicationID选择需要查看的log

关于yarn的log&#xff0c;可参考这里。


推荐阅读
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • 本文详细解析了ASP.NET 2.0中的Callback机制,不仅介绍了基本的使用方法,还深入探讨了其背后的实现原理。通过对比Atlas框架,帮助读者更好地理解和应用这一机制。 ... [详细]
  • 为什么多数程序员难以成为架构师?
    探讨80%的程序员为何难以晋升为架构师,涉及技术深度、经验积累和综合能力等方面。本文将详细解析Tomcat的配置和服务组件,帮助读者理解其内部机制。 ... [详细]
  • 本文详细介绍了如何在 Linux 系统上安装 JDK 1.8、MySQL 和 Redis,并提供了相应的环境配置和验证步骤。 ... [详细]
  • 本文详细介绍了Java代码分层的基本概念和常见分层模式,特别是MVC模式。同时探讨了不同项目需求下的分层策略,帮助读者更好地理解和应用Java分层思想。 ... [详细]
  • 使用ArcGIS for Java和Flex浏览自定义ArcGIS Server 9.3地图
    本文介绍了如何在Flex应用程序中实现浏览自定义ArcGIS Server 9.3发布的地图。这是一个基本的入门示例,适用于初学者。 ... [详细]
  • 深入解析Struts、Spring与Hibernate三大框架的面试要点与技巧 ... [详细]
  • 本文详细探讨了几种常用的Java后端开发框架组合及其具体应用场景。通过对比分析Spring Boot、MyBatis、Hibernate等框架的特点和优势,结合实际项目需求,为开发者提供了选择合适框架组合的参考依据。同时,文章还介绍了这些框架在微服务架构中的应用,帮助读者更好地理解和运用这些技术。 ... [详细]
  • Hadoop平台警告解决:无法加载本机Hadoop库的全面应对方案
    本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先,通过修改日志配置文件来忽略该警告,这一方法被证明是有效的。其次,尝试指定本地库的路径,但未能解决问题。接着,尝试不使用Hadoop本地库,同样没有效果。然后,通过替换现有的Hadoop本地库,成功解决了问题。最后,根据Hadoop的源代码自行编译本地库,也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]
  • Amoeba 通过优化 MySQL 的读写分离功能显著提升了数据库性能。作为一款基于 MySQL 协议的代理工具,Amoeba 能够高效地处理应用程序的请求,并根据预设的规则将 SQL 请求智能地分配到不同的数据库实例,从而实现负载均衡和高可用性。该方案不仅提高了系统的并发处理能力,还有效减少了主数据库的负担,确保了数据的一致性和可靠性。 ... [详细]
  • 在开发过程中,我最初也依赖于功能全面但操作繁琐的集成开发环境(IDE),如Borland Delphi 和 Microsoft Visual Studio。然而,随着对高效开发的追求,我逐渐转向了更加轻量级和灵活的工具组合。通过 CLIfe,我构建了一个高度定制化的开发环境,不仅提高了代码编写效率,还简化了项目管理流程。这一配置结合了多种强大的命令行工具和插件,使我在日常开发中能够更加得心应手。 ... [详细]
  • javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]
  • 用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS
    HTTP协议是不加密传输数据的,也就是用户跟你的网站之间传递数据有可能在途中被截获,破解传递的真实内容,所以使用不加密的HTTP的网站是不 ... [详细]
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 本文详细介绍了在CentOS 6.5 64位系统上使用阿里云ECS服务器搭建LAMP环境的具体步骤。首先,通过PuTTY工具实现远程连接至服务器。接着,检查当前系统的磁盘空间使用情况,确保有足够的空间进行后续操作,可使用 `df` 命令进行查看。此外,文章还涵盖了安装和配置Apache、MySQL和PHP的相关步骤,以及常见问题的解决方法,帮助用户顺利完成LAMP环境的搭建。 ... [详细]
author-avatar
穷游小美女
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有