Hadoop3.x（Yarn）【Yarn资源调度器】

作者：娅丶0k_732 | 来源：互联网 | 2023-07-23 19:07

Hadoop3.x（Yarn）----【Yarn资源调度器】1.Yarn基础架构2.Yarn工作机制3.作业提交全过程4.Yarn调度器和调度算法1.先

Hadoop 3.x&＃xff08;Yarn&＃xff09;----【Yarn 资源调度器】

1. Yarn 基础架构
2. Yarn 工作机制
3. 作业提交全过程
4. Yarn 调度器和调度算法
- 1. 先进先出调度器&＃xff08;FIFO&＃xff09;
- 2. 容量调度器&＃xff08;CapacityScheduler&＃xff09;
- - 容量调度器特点
  - 容量调度器资源分配算法
- 3. 公平调度器&＃xff08;Fair Scheduler&＃xff09;
- - 公平调度器特点
  - 公平调度器缺额
  - 公平调度器队列资源分配方式
  - 公平调度器资源分配算法
5. Yarn常用命令
- 1. yarn application查看任务
- 2. yarn logs查看日志
- 3. yarn applicationattempt 查看尝试运行的任务
- 4. yarn container查看容器
- 5. yar node查看节点状态
- 6. yarn rmadmin更新配置
- 7. yarn queue查看队列
6. Yarn生产环境核心参数

思考&＃xff1a;

如何管理集群资源&＃xff1f;
如何给任务合理分批资源&＃xff1f;

在这里插入图片描述

Yarn 是一个资源调度平台&＃xff0c;负责为运算程序提供服务器运算资源&＃xff0c;相当于一个分布式的操作系统平台&＃xff0c;而 MapReduce 等运算程序则相当于运行与操作系统之上的应用程序。

1. Yarn 基础架构

YARN 主要由 ResourceManager、NodeManager、ApplicationMaster 和 Container 等组件构成。

在这里插入图片描述

ResourceManager&＃xff08;RM&＃xff09;主要作用如下

处理客户端请求
监控 NodeManager
启动或监控 ApplicationMaster
资源的分配与调度

NodeManager&＃xff08;NM&＃xff09;主要作用如下

管理单个节点上的资源
处理来自 ResourceManager 的命令
处理来自 ApplicationMaster 的命令

ApplicationMaster&＃xff08;AM&＃xff09;作用如下

为应用程序申请资源并分配给内部的任务
任务的监控与容错

Container
Container 是 YARN 中的资源抽象&＃xff0c;它封装了某个节点上的多维度资源&＃xff0c;如内存、CPU、磁盘、网络等。

2. Yarn 工作机制

在这里插入图片描述

MR 程序提交到客户端所在的节点。
YarnRunner 向 ResourceManager 申请一个 Application。
RM 将该应用程序的资源路径返回给 YarnRunner。
该程序将运行所需资源提交到 HDFS 上。
程序资源提交完毕后&＃xff0c;申请运行 mrAppMaster。
RM 将用户的请求初始化成一个 Task。
其中一个 NodeManager 领取到 Task 任务。
该 NodeManager 创建容器 Container&＃xff0c;并产生 MRAppmaster。
Container 从 HDFS 上拷贝资源到本地。
MRAppmaster 想 RM 申请运行 MapTask 资源。
RM 将运行 MapTask 任务分配给另外两个 NodeManager&＃xff0c;另两个 NodeManager 分别领取任务并创建容器。
MR 向两个接收到任务的 NodeManager 发送程序启动脚本&＃xff0c;这两个 NodeManager 分别启动 MapTask&＃xff0c;MapTask 对数据分区排序。
MrAppMaster 等待所有 MapTask 运行完毕后&＃xff0c;向 RM 申请容器&＃xff0c;运行 ReduceTask。
ReduceTask 向 MapTask 获取响应分区的数据。
程序运行完毕后&＃xff0c;MR 会想RM 申请注销自己。

3. 作业提交全过程

在这里插入图片描述

作业提交全过程详解
&＃xff08;1&＃xff09;作业提交
第1步&＃xff1a;Clinet 调用 job.waitForCompletion 方法&＃xff0c;向整个集群提交 MapReduce 作业。
第2步&＃xff1a;Client 向 RM 申请一个作业 id。
第3步&＃xff1a;RM 给 Client 返回该 job 资源的提交路径和作业 id。
第4步&＃xff1a;Client 提交 jar 包、切片信息和配置文件到指定的资源提交路径。
第5步&＃xff1a;Client 提交玩资源后&＃xff0c;向 RM 申请运行 MrAppMaster。

&＃xff08;2&＃xff09;作业初始化
第6步&＃xff1a;当 RM 收到 Client 的请求后&＃xff0c;将该 job 添加到容量调度器中。
第7步&＃xff1a;某一个空闲的 NM 领取到该 Job。
第8步&＃xff1a;该 NN 创建 Container&＃xff0c;并产生 MRAppmaster。
第9步&＃xff1a;下载 Client 提交的资源到本地。

&＃xff08;3&＃xff09;任务分配
第10步&＃xff1a;MrAppMaster 向 RM 申请运行多个 MapTask 任务资源。
第11步&＃xff1a;RM 将运行 MapTask 任务分配给另外两个 NodeManager&＃xff0c;另两个 NodeManager 分别领取任务并创建容器。

&＃xff08;4&＃xff09;任务运行
第12步&＃xff1a;MR 向两个接收到任务的 NodeManager 发送程序启动脚本&＃xff0c;这两个 NodeManager 分别启动 MapTask&＃xff0c;MapTask 对数据进行分区排序。
第13步&＃xff1a;MrAppMaster 等待所有 MapTask 运行完毕后&＃xff0c;向 RM 申请容器&＃xff0c;运行 ReduceTask。
第14步&＃xff1a;ReduceTask 向 MapTask 获取相应分区的数据。
第15步&＃xff1a;程序运行完毕后&＃xff0c;MR 会向 RM 申请注销自己。

&＃xff08;5&＃xff09;进度和状态更新
YARN 中的任务将其进度和状态&＃xff08;包括 counter&＃xff09;返回给应用管理器&＃xff0c;客户端每秒&＃xff08;通过 mapreduce.client。progressmonitor。pollinterval 设置&＃xff09;向应用管理器请求进度更新&＃xff0c;展示给用户。

&＃xff08;6&＃xff09;作业完成
除了向应用管理器请求作业进度外&＃xff0c;客户端每5秒都会通过 waitForCompletion() 来检查作业是否完成。时间间隔可以通过 mapreduce.client.completion.pollinterval 来设置。作业完成之后&＃xff0c;应用管理器和 Container 会清理工作状态。作业的信息会被作业历史服务器存储以备之后的用核查。

4. Yarn 调度器和调度算法

目前&＃xff0c;Hadoop 作业调度器主要有三种&＃xff1a;FIFO、容量&＃xff08;Capacity Scheduler&＃xff09;和公平&＃xff08;Fair Scheduler&＃xff09;。Apache Hadoop3.1.3 默认的资源调度器是 Capacity Scheduler。
CDH 框架默认调度器是 FairScheduler。
具体设置详见&＃xff1a;yarn-default.xml 文件

<property> <description>The class to use as the resource scheduler.description> <name>yarn.resourcemanager.scheduler.classname> <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacitySchedulervalue> property>

1. 先进先出调度器&＃xff08;FIFO&＃xff09;

FIFO 调度器&＃xff08;First In First Out&＃xff09;&＃xff1a;单队列&＃xff0c;根据提交作业的先后顺序&＃xff0c;先来先服务。

在这里插入图片描述
优点&＃xff1a;简单易懂
缺点&＃xff1a;不支持多队列&＃xff0c;生产环境很少使用

2. 容量调度器&＃xff08;CapacityScheduler&＃xff09;

CapacityScheduler 是 Yahaoo 开发的多以用户调度器。

容量调度器特点

在这里插入图片描述

多队列&＃xff1a;每个队列可配置一定的资源量&＃xff0c;每个队列采用 FIFO 调度策略。
容量保证&＃xff1a;管理员可为每个队列设置资源最低保证和资源使用上限。
灵活性&＃xff1a;如果一个队列中的资源有剩余&＃xff0c;可以暂时共享给哪些需要资源的队列&＃xff0c;而一旦该队列有新的应用程序提交&＃xff0c;则其他队列借调的资源会归还给该队列。
多租户&＃xff1a;
支持多用户共享集群和多应用程序同时运行。
为了防止同一个用户的作业独占队列中的资源&＃xff0c;该调度器会对统一用户提交的作业所占资源进行限定。

容量调度器资源分配算法

在这里插入图片描述

1. 队列资源分配
从 root 开始&＃xff0c;使用深度优先算法&＃xff0c;优先选择资源占用率最低的队列分配资源。

2. 作业资源分配
默认按照提交作业的优先级和提交时间顺序分配资源。

3. 容器资源分配
按照容器的优先级分配资源&＃xff1b;
如果优先相同&＃xff0c;按照数据本地行原则&＃xff1b;

任务和数据在同一节点
任务和数据在同一机架
任务和数据不在同一节点也不在同一机架

3. 公平调度器&＃xff08;Fair Scheduler&＃xff09;

Fair Scheduler 是 Facebook 开发的多用户调度器。

公平调度器特点

在这里插入图片描述

1. 与容量调度器相同点

多队列&＃xff1a;支持多队列多作业
容量保证&＃xff1a;管理员可以为每个队列设置资源最低保证和资源使用上限
灵活性&＃xff1a;如果一个队列中的资源有剩余&＃xff0c;可以暂时共享给哪些需要资源的队列&＃xff0c;而一旦该队列有新的应用程序提交&＃xff0c;则其他队列借调的资源会归还给该队列
多租户&＃xff1a;支持多用户共享集群和多应用程序同时运行&＃xff1b;为了防止同一个用户的作业独占队列中的资源&＃xff0c;该调度器会对统一用户提交的作业所占资源进行限定。

2. 与容量调度器不同点

核心调度策略不同
容量调度器&＃xff1a;优先选择资源利用率低的队列
公平调度器&＃xff1a;优先选择对资源的缺额比例大的
每个队列可以单独设置资源分配方式
容量调度器&＃xff1a;FIFP、DRP
公平调度器&＃xff1a;FIFO、FAIR、DRF

公平调度器缺额

在这里插入图片描述

公平调度器设计目标是&＃xff1a;在时间尺度上&＃xff0c;所有作业获得公平的资源。某一时刻一个作业应获资源和实际获取资源的差距叫 " 缺额 "
调度器会优先为缺额大的作业分配资源

公平调度器队列资源分配方式

在这里插入图片描述

1. FIFO策略
公平调度每个队列资源分配策略如果选择 FIFO 的话&＃xff0c;此时公平调度器相当于上面讲过的容量调度器。

2. Fair策略
Fair 策略&＃xff08;默认&＃xff09;是一种基于最大最小公平算法实现的资源多路复用方式&＃xff0c;默认情况下&＃xff0c;每个队列内部采用该方式分配资源。这意味着&＃xff0c;如果一个队列中有两个应用程序同时运行&＃xff0c;则每个应用程序可得到 1/2 的资源&＃xff1b;如果三个应用程序同时运行&＃xff0c;则每个应用程序可得到 1/3 的资源。

具体资源分配流程和容量调度器一致&＃xff1a;

选择队列
选择作业
选择容器
以上三步&＃xff1a;每一步都是按照公平策略分配资源

实际最小资源份额&＃xff1a;mindshare &＃61; Min&＃xff08;资源需求量&＃xff0c;配置的最小资源&＃xff09;
是否饥饿&＃xff1a;isNeedy &＃61; 资源使用量 资源分配比&＃xff1a;minShareRatio &＃61; 资源使用量 / Max&＃xff08;mindshare&＃xff0c;1&＃xff09;
资源使用权重比&＃xff1a;useToWeightRatio &＃61; 资源使用量 / 权重

公平调度器资源分配算法

在这里插入图片描述

5. Yarn常用命令

Yarn 状态的查询&＃xff0c;除了可以在 hadoop103:8088 页面查看外&＃xff0c;还可以通过命令操作。

常见的命令操作如下所示&＃xff1a;

[fickler&＃64;hadoop102 ~]$ myhadoop.sh start [fickler&＃64;hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output1

1. yarn application查看任务

列出所有 Application

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn application -list 2022-09-24 12:12:22,062 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.10.103:8032 Total number of applications (application-types: [], states: [SUBMITTED, ACCEPTED, RUNNING] and tags: []):0 Application-Id Application-Name Application-Type User Queue State Final-State Progress Tracking-URL

根据 Application 状态过滤&＃xff1a;yarn application-list-appStates&＃xff08;所有状态&＃xff1a;ALL、NEW、NEW_SAVING、SUBMITTED、ACCEPTED、RUNNING、FINISHED、FAILED、KILLED&＃xff09;

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn application -list -appStates FINISHED 2022-09-24 12:17:33,122 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.10.103:8032 Total number of applications (application-types: [], states: [FINISHED] and tags: []):1 Application-Id Application-Name Application-Type User Queue State Final-State Progress Tracking-URL application_1663992336635_0001 word count MAPREDUCE fickler default FINISHED SUCCEEDED 100% http://hadoop102:19888/jobhistory/job/job_1663992336635_0001

Kill 掉 Application

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn application -kill application_1663992336635_0001 2022-09-24 12:18:43,814 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.10.103:8032 Application application_1663992336635_0001 has already finished

2. yarn logs查看日志

查询 Application 日志&＃xff1a;yarn logs -applicationId

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn logs -applicationId application_1663992336635_0001

查询 Container 日志&＃xff1a;yarn logs -applicationId -contaiinerId

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn logs -applicationId application_1612577921195_0001 -containerId container_1612577921195_0001_01_000001

3. yarn applicationattempt 查看尝试运行的任务

列出所有 Application 尝试的列表&＃xff1a;yarn applicationattempt -list

在这里插入图片描述

打印 ApplicationAttempt 状态&＃xff1a;yarn applicationattempt -status

在这里插入图片描述

4. yarn container查看容器

列出所有 Container&＃xff1a;yarn container -list

在这里插入图片描述

打印 Container 状态&＃xff1a;yarn container -status

在这里插入图片描述

注意&＃xff1a;只有在任务跑的途中才能看到 container 的状态

5. yar node查看节点状态

列出所有结点&＃xff1a;yarn node -list -all

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn node -list -all 2022-09-24 14:31:04,999 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.10.103:8032 Total Nodes:3 Node-Id Node-State Node-Http-Address Number-of-Running-Containers hadoop104:41760 RUNNING hadoop104:8042 0 hadoop102:40653 RUNNING hadoop102:8042 0 hadoop103:38332 RUNNING hadoop103:8042 0

6. yarn rmadmin更新配置

加载队列配置&＃xff1a;yarn rmadmin -refreshQueues

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn rmadmin -refreshQueues 2022-09-24 14:32:08,579 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.10.103:8033

7. yarn queue查看队列

打印队列信息&＃xff1a;yarn queue -status

[fickler&＃64;hadoop102 hadoop-3.1.3]$ yarn queue -status default 2022-09-24 14:33:22,970 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.10.103:8032 Queue Information : Queue Name : default State : RUNNING Capacity : 100.0% Current Capacity : .0% Maximum Capacity : 100.0% Default Node Label expression : Accessible Node Labels : * Preemption : disabled Intra-queue Preemption : disabled
6. Yarn生产环境核心参数

在这里插入图片描述

推荐阅读

go
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
java
JVM 学习总结（三）——对象存活判定算法的两种实现

本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法：引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活，虽然简单高效，但无法解决循环引用的问题；可达性分析算法通过判断对象是否可达来确定存活对象，是主流的Java虚拟机内存管理算法。 ... [详细]

蜡笔小新 2023-12-13 18:59:46
input
Android工程师面试准备及设计模式使用场景

本文介绍了Android工程师面试准备的经验，包括面试流程和重点准备内容。同时，还介绍了建造者模式的使用场景，以及在Android开发中的具体应用。 ... [详细]

蜡笔小新 2023-12-11 18:25:26
go
SpringBoot整合SpringSecurity+JWT实现单点登录

SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-12-11 08:21:41
input
Spark实现高斯朴素贝叶斯模型的低配版

本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大，单机上运行高斯朴素贝叶斯模型会变得很慢，因此考虑使用Spark来加速运行。然而，Spark的MLlib并没有实现高斯朴素贝叶斯模型，因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式，并对具有多个特征和类别的模型进行了讨论。最后，作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]

蜡笔小新 2023-12-10 21:42:37
input
STL迭代器的种类及其功能介绍

本文介绍了标准模板库(STL)定义的五种迭代器的种类和功能。通过图表展示了这几种迭代器之间的关系，并详细描述了各个迭代器的功能和使用方法。其中，输入迭代器用于从容器中读取元素，输出迭代器用于向容器中写入元素，正向迭代器是输入迭代器和输出迭代器的组合。本文的目的是帮助读者更好地理解STL迭代器的使用方法和特点。 ... [详细]

蜡笔小新 2023-12-10 15:17:25
input
Linux进程控制块PCBtask_struct结构体结构及作用详解

本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用，包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]

蜡笔小新 2023-12-13 21:31:18
ip
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
input
Swing组件及其用法，图标接口的定义和创建方法

本文介绍了Swing组件的用法，重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联，可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法，并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]

蜡笔小新 2023-12-11 21:03:59
tree
重入锁（ReentrantLock）学习及实现原理

本文介绍了重入锁（ReentrantLock）的学习及实现原理。在学习synchronized的基础上，重入锁提供了更多的灵活性和功能。文章详细介绍了重入锁的特性、使用方法和实现原理，并提供了类图和测试代码供读者参考。重入锁支持重入和公平与非公平两种实现方式，通过对比和分析，读者可以更好地理解和应用重入锁。 ... [详细]

蜡笔小新 2023-12-11 15:16:28
go
Codeforces Round #321 (Div. 2) Kefa and Dishes 状压+spfa

本文介绍了Codeforces Round #321 (Div. 2)比赛中的问题Kefa and Dishes，通过状压和spfa算法解决了这个问题。给定一个有向图，求在不超过m步的情况下，能获得的最大权值和。点不能重复走。文章详细介绍了问题的题意、解题思路和代码实现。 ... [详细]

蜡笔小新 2023-12-11 10:37:34
go
2016 linux发行版排行_灵越7590 安装 linux (manjarognome)

RT之前做了一次灵越7590黑苹果炒作业的文章，希望能够分享给更多不想折腾的人。kawauso：教你如何给灵越7590黑苹果抄作业zhuanlan.z ... [详细]

蜡笔小新 2023-12-10 19:11:07
java
Android开发优化之软引用与弱引用的应用

本文介绍了在Android开发中使用软引用和弱引用的应用。如果一个对象只具有软引用，那么只有在内存不够的情况下才会被回收，可以用来实现内存敏感的高速缓存；而如果一个对象只具有弱引用，不管内存是否足够，都会被垃圾回收器回收。软引用和弱引用还可以与引用队列联合使用，当被引用的对象被回收时，会将引用加入到关联的引用队列中。软引用和弱引用的根本区别在于生命周期的长短，弱引用的对象可能随时被回收，而软引用的对象只有在内存不够时才会被回收。 ... [详细]

蜡笔小新 2023-12-10 16:33:12
ip
深入解析Linux下的I/O多路转接epoll技术

本文深入解析了Linux下的I/O多路转接epoll技术，介绍了select和poll函数的问题，以及epoll函数的设计和优点。同时讲解了epoll函数的使用方法，包括epoll_create和epoll_ctl两个系统调用。 ... [详细]

蜡笔小新 2023-12-10 14:18:30
main
状态压缩算法解决关灯问题2

本文介绍了一道经典的状态压缩题目——关灯问题2，并提供了解决该问题的算法思路。通过使用二进制表示灯的状态，并枚举所有可能的状态，可以求解出最少按按钮的次数，从而将所有灯关掉。本文还对状压和位运算进行了解释，并指出了该方法的适用性和局限性。 ... [详细]

蜡笔小新 2023-12-10 11:23:10

娅丶0k_732

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章