当前位置: 开发笔记 > 编程语言 > 正文

Hadoop框架之——Yarn资源调度器

作者：绿林VS逍遥 | 来源：互联网 | 2023-08-18 19:51

文章目录1简介2Yarn基本架构3Yarn工作机制4作业提交全过程5资源调度器6任务的推测执行1简介Yarn是一个资源调度平台，负责为运算程序提供服务器运算资源&#

文章目录

- 1 简介
- 2 Yarn基本架构
- 3 Yarn工作机制
- 4 作业提交全过程
- 5 资源调度器
- 6 任务的推测执行

1 简介

Yarn是一个资源调度平台&＃xff0c;负责为运算程序提供服务器运算资源&＃xff0c;相当于一个分布式的操作系统平台&＃xff0c;而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。

2 Yarn基本架构

YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成
在这里插入图片描述

3 Yarn工作机制

1&＃xff0e;Yarn运行机制
在这里插入图片描述
2&＃xff0e;工作机制详解
&＃xff08;1&＃xff09;MR程序提交到客户端所在的节点。
&＃xff08;2&＃xff09;YarnRunner向ResourceManager申请一个Application。
&＃xff08;3&＃xff09;RM将该应用程序的资源路径返回给YarnRunner。
&＃xff08;4&＃xff09;该程序将运行所需资源提交到HDFS上。
&＃xff08;5&＃xff09;程序资源提交完毕后&＃xff0c;申请运行mrAppMaster。
&＃xff08;6&＃xff09;ResourceManager将用户的请求初始化成一个Task。
&＃xff08;7&＃xff09;其中一个NodeManager领取到Task任务。
&＃xff08;8&＃xff09;该NodeManager创建容器Container&＃xff0c;并产生MRAppmaster。
&＃xff08;9&＃xff09;Container从HDFS上拷贝资源到本地。
&＃xff08;10&＃xff09;MRAppmaster向ResourceManager申请运行MapTask资源。
&＃xff08;11&＃xff09;ResourceManager将运行MapTask任务分配给另外两个NodeManager&＃xff0c;另两个NodeManager分别领取任务并创建容器。
&＃xff08;12&＃xff09;MR向两个接收到任务的NodeManager发送程序启动脚本&＃xff0c;这两个NodeManager分别启动MapTask&＃xff0c;MapTask对数据分区排序。
&＃xff08;13&＃xff09;MrAppMaster等待所有MapTask运行完毕后&＃xff0c;向RM申请容器&＃xff0c;运行ReduceTask。
&＃xff08;14&＃xff09;ReduceTask向MapTask获取相应分区的数据。
&＃xff08;15&＃xff09;程序运行完毕后&＃xff0c;MR会向ResourceManager申请注销自己。

4 作业提交全过程

1&＃xff0e;作业提交过程之YARN&＃xff0c;
在这里插入图片描述
作业提交全过程详解
&＃xff08;1&＃xff09;作业提交
第1步&＃xff1a;Client调用job.waitForCompletion方法&＃xff0c;向整个集群提交MapReduce作业。
第2步&＃xff1a;Client向RM申请一个作业id。
第3步&＃xff1a;RM给Client返回该job资源的提交路径和作业id。
第4步&＃xff1a;Client提交jar包、切片信息和配置文件到指定的资源提交路径。
第5步&＃xff1a;Client提交完资源后&＃xff0c;向RM申请运行MrAppMaster。

&＃xff08;2&＃xff09;作业初始化
第6步&＃xff1a;当RM收到Client的请求后&＃xff0c;将该job添加到容量调度器中。
第7步&＃xff1a;某一个空闲的NM领取到该Job。
第8步&＃xff1a;该NM创建Container&＃xff0c;并产生MRAppmaster。
第9步&＃xff1a;下载Client提交的资源到本地。

&＃xff08;3&＃xff09;任务分配
第10步&＃xff1a;MrAppMaster向RM申请运行多个MapTask任务资源。
第11步&＃xff1a;RM将运行MapTask任务分配给另外两个NodeManager&＃xff0c;另两个NodeManager分别领取任务并创建容器。

&＃xff08;4&＃xff09;任务运行
第12步&＃xff1a;MR向两个接收到任务的NodeManager发送程序启动脚本&＃xff0c;这两个NodeManager分别启动MapTask&＃xff0c;MapTask对数据分区排序。
第13步&＃xff1a;MrAppMaster等待所有MapTask运行完毕后&＃xff0c;向RM申请容器&＃xff0c;运行ReduceTask。
第14步&＃xff1a;ReduceTask向MapTask获取相应分区的数据。
第15步&＃xff1a;程序运行完毕后&＃xff0c;MR会向RM申请注销自己。

&＃xff08;5&＃xff09;进度和状态更新
YARN中的任务将其进度和状态(包括counter)返回给应用管理器, 客户端每秒(通过mapreduce.client.progressmonitor.pollinterval设置)向应用管理器请求进度更新, 展示给用户。

&＃xff08;6&＃xff09;作业完成
除了向应用管理器请求作业进度外, 客户端每5秒都会通过调用waitForCompletion()来检查作业是否完成。时间间隔可以通过mapreduce.client.completion.pollinterval来设置。作业完成之后, 应用管理器和Container会清理工作状态。作业的信息会被作业历史服务器存储以备之后用户核查。

2&＃xff0e;作业提交过程之MapReduce

在这里插入图片描述

5 资源调度器

目前&＃xff0c;Hadoop作业调度器主要有三种&＃xff1a;FIFO、Capacity Scheduler和Fair Scheduler。Hadoop2.7.2默认的资源调度器是Capacity Scheduler。
具体设置详见&＃xff1a;yarn-default.xml文件

<property><description>The class to use as the resource scheduler.description><name>yarn.resourcemanager.scheduler.classname><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacitySchedulervalue> property>

1&＃xff0e;先进先出调度器&＃xff08;FIFO&＃xff09;

在这里插入图片描述
2&＃xff0e;容量调度器&＃xff08;Capacity Scheduler&＃xff09;

在这里插入图片描述
3&＃xff0e;公平调度器&＃xff08;Fair Scheduler&＃xff09;

在这里插入图片描述

6 任务的推测执行

1&＃xff0e;作业完成时间取决于最慢的任务完成时间
一个作业由若干个Map任务和Reduce任务构成。因硬件老化、软件Bug等&＃xff0c;某些任务可能运行非常慢。
思考&＃xff1a;系统中有99%的Map任务都完成了&＃xff0c;只有少数几个Map老是进度很慢&＃xff0c;完不成&＃xff0c;怎么办&＃xff1f;

2&＃xff0e;推测执行机制
发现拖后腿的任务&＃xff0c;比如某个任务运行速度远慢于任务平均速度。为拖后腿任务启动一个备份任务&＃xff0c;同时运行。谁先运行完&＃xff0c;则采用谁的结果。

3&＃xff0e;执行推测任务的前提条件
&＃xff08;1&＃xff09;每个Task只能有一个备份任务
&＃xff08;2&＃xff09;当前Job已完成的Task必须不小于0.05&＃xff08;5%&＃xff09;
&＃xff08;3&＃xff09;开启推测执行参数设置。mapred-site.xml文件中默认是打开的。

<property><name>mapreduce.map.speculativename><value>truevalue><description>If true, then multiple instances of some map tasks may be executed in parallel.description> property><property><name>mapreduce.reduce.speculativename><value>truevalue><description>If true, then multiple instances of some reduce tasks may be executed in parallel.description> property>

4&＃xff0e;不能启用推测执行机制情况
&＃xff08;1&＃xff09;任务间存在严重的负载倾斜&＃xff1b;
&＃xff08;2&＃xff09;特殊任务&＃xff0c;比如任务向数据库中写数据。

5&＃xff0e;算法原理

在这里插入图片描述

推荐阅读

web
Nginx使用AWStats日志分析的步骤及注意事项

本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息，并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境，并进行DNS解析。 ... [详细]

蜡笔小新 2023-12-14 19:42:01
settings
VScode格式化文档换行或不换行的设置方法

本文介绍了在VScode中设置格式化文档换行或不换行的方法，包括使用插件和修改settings.json文件的内容。详细步骤为：找到settings.json文件，将其中的代码替换为指定的代码。 ... [详细]

蜡笔小新 2023-12-14 17:15:38
text
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
process
在Windows 8上安装gvim中的插件的错误加载问题

本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置，但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置，并列出了出现的错误信息。 ... [详细]

蜡笔小新 2023-12-14 14:44:00
web
如何使用Java获取服务器硬件信息和磁盘负载率

本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务，并获取服务器的磁盘信息，并将结果输出。然后在本地使用JS编写一个AJAX脚本，远程请求服务端的程序，得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]

蜡笔小新 2023-12-14 13:56:20
web
Thrift教程初级篇——RPC框架Thrift的安装环境变量配置与第一个实例

本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例，讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快，性能和稳定性也不错，适合初学者学习和使用。 ... [详细]

蜡笔小新 2023-12-13 17:36:52
web
如何在服务器主机上实现文件共享的方法和工具

本文介绍了在服务器主机上实现文件共享的方法和工具，包括Linux主机和Windows主机的文件传输方式，Web运维和FTP/SFTP客户端运维两种方式，以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外，还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK，以及主机迁移服务会收集的源端服务器信息。 ... [详细]

蜡笔小新 2023-12-13 13:23:48
ip
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
ip
在mac环境下使用nginx配置nodejs代理服务器的步骤

本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤，包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]

蜡笔小新 2023-12-13 10:34:21
ip
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
rsa
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
ip
Nginx使用（server参数配置）

本文介绍了Nginx的使用，重点讲解了server参数配置，包括端口号、主机名、根目录等内容。同时，还介绍了Nginx的反向代理功能。 ... [详细]

蜡笔小新 2023-12-14 17:08:34
text
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
rsa
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
text
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52

绿林VS逍遥

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章