当前位置: 开发笔记 > 编程语言 > 正文

Yarn的CapacityScheduler与DRF了解

作者：妖泪蓝夕_746 | 来源：互联网 | 2023-08-10 19:50

CapacityScheduler以队列为单位划分资源，每个队列可以设定一定比例的资源最低保证和使用上限，每个用户也可以设定一定的资源使用上限以防止滥用队列中的资源。当一个队列的资源有

Capacity Scheduler以队列为单位划分资源，每个队列可以设定一定比例的资源最低保证和使用上限，每个用户也可以设定一定的资源使用上限以防止滥用队列中的资源。当一个队列的资源有剩余时，可暂时将剩余资源给其他队列使用。

在yarn-site.xml文件中指定使用CapacityScheduler

yarn.resourcemanager.scheduler.class

org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler

Capacity Scheduler介绍：
容量调度器有个预定义的队列，名字是root，所有的队列都是root的子队列。更多的子队列可以被设置，通过配置yarn.scheduler.capacity.root.queues，逗号分开的子队列即可(同一级队列资源占比加起来必须是100%)。如下所示：

     yarn.scheduler.capacity.root.queues
     a,b

子队列还可以继续设置子队列:
yarn.scheduler.capacity.root.a.queues
a1,a2,a3

每个子队列设置如下资源相关配置：

    yarn.scheduler.capacity.root.a.capacity
    10

系统繁忙时，a这个队列最少可以占用root队列10%的资源(如果a这个队列不是很繁忙，那么这个队列中的资源可能被其他队列借走)。注意，子队列值之和要等于100

    yarn.scheduler.capacity.root.a.maximum-capacity
    100

系统繁忙时，a这个队列最多可以占用root队列100%的资源，该配置决定了队列资源的上限。

    yarn.scheduler.capacity.root.a.user-limit-factor
    1

    每个用户可以使用队列资源占比，当前1表示可以使用100%的capacity资源

    yarn.scheduler.capacity.root.a.state
    RUNNING

    队列的状态，可以为STOPPED或者RUNNING,

    yarn.scheduler.capacity.root.a.acl_submit_applications
    *

    yarn.scheduler.capacity.root.a.acl_administer_queue
    *

    这两个设置用于限制那些用户可以使用队列，*表示不限制

除了以上这些，还有一些其他的配置：

    yarn.scheduler.capacity.maximum-applications
    10000

    集群中application最大数目

    yarn.scheduler.capacity.maximum-am-resource-percent
    0.1

集群中用于运行应用程序ApplicationMaster的资源比例上限，该参数通常用于限制处于活动状态的应用程序数目。所有队列的ApplicationMaster资源比例上限可通过参数yarn.scheduler.capacity.maximum-am-resource-percent设置，而单个队列可通过参数yarn.scheduler.capacity..maximum-am-resource-percent设置适合自己的值

yarn.scheduler.capacity.resource-calculator
org.apache.hadoop.yarn.util.resource.DominantResourceCalculator

    设置使用的资源分配算法，该算法会同时考虑CPU以及内存资源，让所有Application的“主要资源占比”资源尽可能的均等。

DRF算法说明：
DRF资源分配算法的设计思想是，让所有Application的“主要资源占比”尽量均等，对于Yarn来说资源指的就是CPU及内存。
    DRF是基于Max-min fairness算法改进而来，不同的是Max-min fairness算法只支持某种单一资源的分配，该算法的详细内容可以看参考中的链接，此处不展开细说。大概想法是给每个用户都根据权重分配一定比例的资源，资源有的多的任务，将这些资源再按照权重分别给那些资源不够的任务。
    DRF首先会计算任务是CPU密集型资源还是内存密集型资源，哪个占的比例大哪个就称为主资源。DRF就是将Max-min fairness算法应用在主资源上，最大化主资源。上一张论文中的经典例子：
    系统中一共有9个CPU，18G内存，任务A需要(1CPU,4G内存)，任务B需要(3CPU,1G内存)，因为1/9 <4/18，所以任务A的主资源是内存，任务B的主资源是CPU。

每次迭代都要选择一个用户为其分配资源，用户的选择办法：选择当前主资源占比最小的用户，即已经分配给用户的主资源占这种资源总量的比例哪个小，优先给哪个用户分配资源。
所以个人觉得论文上的这图好像有点问题，应该是ABABA才对，因为一开始A对主资源的需求比B要小，4/18 <3/9。
Yarn实际应用中还会考虑任务设置的权重，资源分配的思路和这个是差不多的。

参考：
    https://my.oschina.net/guol/blog/1574106(Yarn Web UI参数解析)
    https://www.jianshu.com/p/7b1dbb772f93(Max-min fairness最大最小公平算法)
    http://static.usenix.org/event/nsdi11/tech/full_papers/Ghodsi.pdf(DRF算法论文)

推荐阅读

jsp
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
char
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
instance
基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装

一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012，引入SQLServer2012群集提高高可用性，需要对SQLServ ... [详细]

蜡笔小新 2024-11-13 15:49:49
php
JUC（三）：深入解析AQS

本文详细介绍了Java并发工具包中的核心类AQS（AbstractQueuedSynchronizer），包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]

蜡笔小新 2024-11-13 15:40:34
uri
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
ip
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
uri
应用链时代，详解 Avalanche 与 Cosmos 的差异

应用链时代，详解 Avalanche 与 Cosmos 的差异 ... [详细]

蜡笔小新 2024-11-13 09:37:19
ip
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
ip
探索Web 2.0新概念：Widget

尽管你可能尚未注意到Widget，但正如几年前对RSS的陌生一样，这一概念正逐渐走入大众视野。据美国某权威杂志预测，2007年将是Widget年。本文将详细介绍Widget的定义、功能及其未来发展趋势。 ... [详细]

蜡笔小新 2024-11-12 18:36:54
ip
最详尽的4K技术科普

什么是4K？4K是一个分辨率的范畴，即40962160的像素分辨率，一般用于专业设备居多，目前家庭用的设备，如 ... [详细]

蜡笔小新 2024-11-12 18:25:39
char
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
jsp
探讨HTTP隧道技术在RDP暴力破解中的应用

本文介绍了如何利用HTTP隧道技术在受限网络环境中绕过IDS和防火墙等安全设备，实现RDP端口的暴力破解攻击。文章详细描述了部署过程、攻击实施及流量分析，旨在提升网络安全意识。 ... [详细]

蜡笔小新 2024-11-12 12:08:47
select
php更新数据库字段的函数是,php更新数据库字段的函数是

php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]

蜡笔小新 2024-11-12 11:37:31
spring
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
php
多线程环境下IpcChannel的性能瓶颈分析与优化建议

在多线程环境中，IpcChannel的性能表现并未如预期般优于Tcp和Http通道。实际测试结果显示，在IIS6中通过Remoting创建的Ipc通道，其速度比Tcp通道慢了约20倍。本文详细分析了这一现象的原因，并提出了针对性的优化建议，以提升IpcChannel在高并发场景下的性能表现。 ... [详细]

蜡笔小新 2024-11-11 19:07:51

妖泪蓝夕_746

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章