热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Yarn框架下的系统部署

使用yarn部署hadoop和spark使用Yarn本地部署Hadoop修改配置文件首先修改mapred-sit.xml文件:cdusrlocalhadoope

使用yarn部署hadoop和spark

使用Yarn本地部署Hadoop


修改配置文件

首先修改mapred-sit.xml文件:

cd /usr/local/hadoop/etc/hadoop
mv mapred-site.xml.template mapred-site.xml

54206786600

修改为:

<configuration><property><name>mapreduce.framework.namename><value>yarnvalue>property>
configuration>

54206785472

修改配置文件yarn-site.xml&#xff1a;

<configuration><property><name>yarn.nodemanager.aux-servicesname><value>mapreduce_shufflevalue>property>
configuration>

重新启动

start-dfs.shstart-yarn.sh命令启动hadoop和yarn&#xff1a;

54206797505

开启历史服务器&#xff0c;才能在Web中查看任务运行情况&#xff1a;

mr-jobhistory-daemon.sh start historyserver

再查看进程&#xff0c;多出NodeManager和ResourceManager两个进程&#xff1a;

54206813452

如果以后在伪分布式模式下启动Hadoop的时候不想启动Yarn&#xff0c;务必把配置文件mapred-site.xml重命名为mapred-site.xml.template

使用Yarn本地部署Spark


修改配置文件

cd /usr/local/spark/conf
vim spark-env.sh

添加&#xff1a;

export HADOOP_CONF_DIR&#61;/usr/local/hadoop/etc/hadoop

这样Spark就可以跑在YARN上了&#xff0c;也没必要启动spark的master和slaves服务&#xff0c;因为是靠yarn进行任务调度&#xff0c;所以直接提交任务即可&#xff1a;

spark-shell --master yarn-client

提示ERROR&#xff0c;这是由于JAVA8的问题&#xff0c;具体参考这里。

54206913078

首先需要关闭hadoop和yarn&#xff1a;

stop-dfs.sh
stop-yarn.sh

/usr/local/hadoop/etc/hadoop/目录下修改yarn-site.xml文件&#xff1a;

<property><name>yarn.nodemanager.pmem-check-enabledname><value>falsevalue>
property><property><name>yarn.nodemanager.vmem-check-enabledname><value>falsevalue>
property>

再次启动&#xff0c;成功&#xff1a;

54207031950

在shell中运行例子&#xff1a;

val textFile &#61; sc.textFile("hdfs://localhost:9000/user/hadoop/input/k-means.dat")
textFile.first()

54207035245

成功&#xff01;

使用yarn查看作业


在浏览器中查看

在浏览器中输入lcoalhost:8088&#xff0c;在yarn中查看任务&#xff1a;

54207100955

会发现spark的任务会提交到yarn&#xff0c;而无需启动master和slave节点。

使用hadoop提交

cd /usr/local/hadoop
hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output/yarn ‘dfs[a-z.]&#43;’

54207126288

作业运行成功&#xff0c;在yarn中查看任务&#xff1a;

54207141656

但是&#xff0c;无论该任务是否成功&#xff0c;在yarn中查看&#xff0c;只能知道这个container是否运行完&#xff0c;因此&#xff0c;需要通过logs进行查看任务的具体运行情况。

使用spark提交

只需要在master节点中添加master即可&#xff0c;例如&#xff1a;

spark-submit --class StuScore --master yarn StuScore-1.0.jar

注意&#xff1a;如果是自己编写的程序&#xff0c;不要在程序中将sparkcontext指定为local

查看yarn logs

yarn-env.sh中查看log的目录&#xff1a;

54207184629

默认目录在/usr/local/hadoop/logs里面&#xff1a;

54207281436

可以发现application的log都存放在里面&#xff0c;现在可以根据web上展示的applicationID选择需要查看的log

关于yarn的log&#xff0c;可参考这里。


推荐阅读
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • 本文介绍了如何使用C#制作Java+Mysql+Tomcat环境安装程序,实现一键式安装。通过将JDK、Mysql、Tomcat三者制作成一个安装包,解决了客户在安装软件时的复杂配置和繁琐问题,便于管理软件版本和系统集成。具体步骤包括配置JDK环境变量和安装Mysql服务,其中使用了MySQL Server 5.5社区版和my.ini文件。安装方法为通过命令行将目录转到mysql的bin目录下,执行mysqld --install MySQL5命令。 ... [详细]
  • 本文记录了在vue cli 3.x中移除console的一些采坑经验,通过使用uglifyjs-webpack-plugin插件,在vue.config.js中进行相关配置,包括设置minimizer、UglifyJsPlugin和compress等参数,最终成功移除了console。同时,还包括了一些可能出现的报错情况和解决方法。 ... [详细]
  •     这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cy ... [详细]
  • mapreduce源码分析总结
    这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的ÿ ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 本文讨论了在Spring 3.1中,数据源未能自动连接到@Configuration类的错误原因,并提供了解决方法。作者发现了错误的原因,并在代码中手动定义了PersistenceAnnotationBeanPostProcessor。作者删除了该定义后,问题得到解决。此外,作者还指出了默认的PersistenceAnnotationBeanPostProcessor的注册方式,并提供了自定义该bean定义的方法。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • uniapp开发H5解决跨域问题的两种代理方法
    本文介绍了uniapp开发H5解决跨域问题的两种代理方法,分别是在manifest.json文件和vue.config.js文件中设置代理。通过设置代理根域名和配置路径别名,可以实现H5页面的跨域访问。同时还介绍了如何开启内网穿透,让外网的人可以访问到本地调试的H5页面。 ... [详细]
  • 解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法
    本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说,系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤,包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息,以帮助读者更好地理解和解决该问题。 ... [详细]
  • 基于分布式锁的防止重复请求解决方案
    一、前言关于重复请求,指的是我们服务端接收到很短的时间内的多个相同内容的重复请求。而这样的重复请求如果是幂等的(每次请求的结果都相同,如查 ... [详细]
  • Maven构建Hadoop,
    Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引 序  上一篇,我们编写了第一个MapReduce,并且成功的运行了Job,Hadoop1.x是通过ant ... [详细]
author-avatar
穷游小美女
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有