cgroup学习（八）——CPUSET子系统

作者：月在杏花枝 | 来源：互联网 | 2023-09-08 10:32

对于CPUSET子系统我们主要解释对cpuset.cpus的操作。Read操作根据《cgroup学习（三）——伪文件》可以很容易的跟踪到代码࿰

对于CPUSET子系统我们主要解释对cpuset.cpus的操作。Read操作根据《cgroup学习&＃xff08;三&＃xff09;——伪文件》可以很容易的跟踪到代码&＃xff0c;并解读&＃xff0c;所以我们这里就不赘述&＃xff0c;直接解释write及attach操作。首先我们看一下write操作的bt&＃xff08;使用systemtap见《使用systemtap获得内核函数的局部变量》&＃xff09;&＃xff1a;

[html] view plain copy

sudo sh -c "echo 0-3 > cpuset.cpus"
13219 (sh) cpuset_change_cpumask call trace:
0xffffffff810c2fc0 :cpuset_change_cpumask&＃43;0x0/0x20 [kernel]
0xffffffff810bfc6b :cgroup_scan_tasks&＃43;0x17b/0x270 [kernel]
0xffffffff810c4c2c :cpuset_write_resmask&＃43;0x17c/0x350 [kernel]
0xffffffff810be14f :cgroup_file_write&＃43;0x16f/0x320 [kernel]
0xffffffff81177e68 :vfs_write&＃43;0xb8/0x1a0 [kernel]
0xffffffff81178871 : sys_write&＃43;0x51/0x90[kernel]
0xffffffff8100b0f2 :system_call_fastpath&＃43;0x16/0x1b [kernel]

注&＃xff1a;cpuset在attach之前要求先设置cpus及mems的值&＃xff0c;如果tasks里没有task的话&＃xff0c;也不会调用到cpuset_change_cpumask&＃xff0c;会在前面返回。
因为代码被优化的原因所有在cpuset_write_resmask与cgroup_scan_tasks之间的update_cpumask及update_tasks_cpumask函数被优化掉了&＃xff0c;其中前者主要完成参数的解析&＃xff0c;验证&＃xff08;validate_change这个新的值必须是它的parent的子集&＃xff0c;并且它的所有children还必须是新值的子集&＃xff0c;以及exclusive的排除&＃xff09;&＃xff0c;然后才将新的值cpumask_copy(cs->cpus_allowed,trialcs->cpus_allowed)&＃xff1b;最后才更新它下面的所有进程的cpus_allowed&＃xff08;这里只是更新它这级的进程&＃xff0c;并没有更新它下级的cgroup里面的进程&＃xff0c;因为这些进程由这个子cgroup自己管理&＃xff0c;它们也还是新值的一个子集&＃xff09;update_tasks_cpumask&＃xff08;该函数主要初始化一个cgroup_scanner结构&＃xff0c;cgroup用它来遍历cgroup管理的每个进程&＃xff0c;并定义对每个进程的test及process操作&＃xff09;&＃xff0c;然后就到了cgroup_scan_tasks函数&＃xff0c;它就是扫描cgroup_scanner&＃xff08;即cgroup下的每个进程&＃xff0c;使用cgroup_iter_{start,next,end}三个接口&＃xff09;&＃xff0c;这里使用了一个大顶堆&＃xff08;key为进程的create_time&＃xff09;来缓存需要更新的进程&＃xff0c;这样做的原因是&＃xff1a;保证在更新的过程中新创建的进程也会被更新到&＃xff0c;所以这里有一个goto语句&＃xff0c;直到heap->size&＃61;0才跳出&＃xff0c;这样就可以减少在fork的代码里加锁。最后就是对heap里面的所有进程进行process处理cpuset_change_cpumask&＃xff0c;该函数最终就把cgroup的cpus_allowed复制到task->cpus_allowed&＃xff0c;并且判断这个进程是否从旧的CPU运行队列&＃xff0c;迁移到新的CPUSET的运行队列&＃xff08;该过程由migrate_task完成&＃xff09;。
注&＃xff1a;这里用到了cgroup最重要的几结构之间的转换&＃xff0c;所以我们再画一张简易的图来表示一下&＃xff1a;

图 cgroup 与task的转换

第一行从cgroup查找CPUSET子系统对应的控制体实现类&＃xff0c;subsys[]数组保存了该cgroup所属的所有子系统抽象类&＃xff0c;最后通过container_of获得实现类&＃xff08;注&＃xff1a;container_of是中task_group内存储了整个cgroup_subsys_state内容&＃xff0c;而不是指向cgroup_subsys_state的指针&＃xff09;&＃xff1b;第二行是从cgroup控制体的CPUSET子系统实现类到它所属的cgroup再到该cgroup所管理的所有tasks&＃xff0c;这里cgroup_iter->cg_link则保存cgroup的css_set list&＃xff0c;而cgroup_iter->task则分别保存每次css_set的task list&＃xff0c;即task会因为遍历的css_set而变化。&＃xff08;这些结构关系见《cgroup学习&＃xff08;二&＃xff09;——cgroup框架结构》&＃xff09;
可以看出整个wirte过程&＃xff0c;最终的目的就是在于更新该cgroup下的每个进程的cpus_allowed&＃xff0c;并对已在运行队列里或正在运行的进程进行迁移。下面我们再来看一下cpuset的attach过程&＃xff1a;
通过《cgroup学习&＃xff08;三&＃xff09;——伪文件》表格的cpuset_subsys全局变量&＃xff0c;我们可以找到CPUSET子系统的attach函数为&＃xff1a;cpuset_attach&＃xff0c;可以想象代码应该就是把新的cgroup的cpu_allowed赋到将要attach的task的cpu_allowed&＃xff0c;然后该迁移的迁移&＃xff0c;不过如果你看代码的话会发现其实不是这样的&＃xff0c;多了一个guarantee_online_cpus函数&＃xff0c;一开始百想不得其解&＃xff0c;后来查了一下online cpu的概念才明白&＃xff0c;原来linux可以把物理cpu直接禁止掉&＃xff08;修改/sys/devices/system/cpu下的所有core目录下的online文件&＃xff0c;这也就是CPU的热插拔&＃xff09;&＃xff0c;所以这个函数的目的就是排除掉所有offline的cpu后的cpu_allowed。有了cpu_allowed进程在被创建时wake_up_new_task&＃xff08;继承自父进程的cpu_allowed&＃xff09;或者被唤醒时try_to_wake_up&＃xff0c;都会通过select_task_rq&＃xff08;该函数后面调用CFS调度器里的select_task_rq_fair来选择cpu_allowed里的某一个cpu&＃xff0c;可能是load最低的&＃xff09;来确定它应该被置于哪个CPU的运行队列及运行&＃xff0c;一个进程在某一时刻只能存在于一个CPU的运行队列里。

推荐阅读

blob
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
select
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11
go
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
require
Mac上安装Jupyter Notebook的详细步骤与技巧

本文将详细介绍如何在Mac上安装Jupyter Notebook，并提供一些常见的问题解决方法。通过这些步骤，您将能够顺利地在Mac上运行Jupyter Notebook。 ... [详细]

蜡笔小新 2024-11-12 00:45:51
go
MySQL查询执行流程详解

MySQL的查询执行流程涉及多个关键组件，包括连接器、查询缓存、分析器和优化器。在服务层，连接器负责建立与客户端的连接，查询缓存用于存储和检索常用查询结果，以提高性能。分析器则解析SQL语句，生成语法树，而优化器负责选择最优的查询执行计划。这一流程确保了MySQL能够高效地处理各种复杂的查询请求。 ... [详细]

蜡笔小新 2024-11-11 16:48:32
const
如何在MySQL中有效运用EXPLAIN命令进行查询优化

本文详细介绍了在MySQL中如何高效利用EXPLAIN命令进行查询优化。通过实例解析和步骤说明，文章旨在帮助读者深入理解EXPLAIN命令的工作原理及其在性能调优中的应用，内容通俗易懂且结构清晰，适合各水平的数据库管理员和技术人员参考学习。 ... [详细]

蜡笔小新 2024-11-10 15:18:39
const
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08
buffer
如何优化MySQL数据库性能以提升查询效率和系统稳定性

如何优化MySQL数据库性能以提升查询效率和系统稳定性 ... [详细]

蜡笔小新 2024-11-09 13:48:51
foreach
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
select
解决 Ubuntu 下 Samba 重新安装时配置文件未重新生成的问题

在 Ubuntu 中遇到 Samba 服务器故障时，尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]

蜡笔小新 2024-11-12 13:02:23
input
php更新数据库字段的函数是,php更新数据库字段的函数是

php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]

蜡笔小新 2024-11-12 11:37:31
search
InfluxDB、collectd与Grafana的详细安装与配置指南

本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先，按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库，用于存储时间序列数据；collectd 负责数据的采集与传输；Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接，便于用户参考和进一步了解其配置选项。通过本指南，读者可以轻松搭建一个高效的数据监控系统。 ... [详细]

蜡笔小新 2024-11-11 19:54:24
search
深入解析JDK 8 HashMap源代码：put方法详解及capacity、size、loadFactor和红黑树转换阈值的设定原理

本文深入解析了JDK 8中HashMap的源代码，重点探讨了put方法的工作机制及其内部参数的设定原理。HashMap允许键和值为null，但键为null的情况只能出现一次，因为null键在内部通过索引0进行存储。文章详细分析了capacity（容量）、size（大小）、loadFactor（加载因子）以及红黑树转换阈值的设定原则，帮助读者更好地理解HashMap的高效实现和性能优化策略。 ... [详细]

蜡笔小新 2024-11-10 14:10:53
search
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
search
Web开发框架概览：Java与JavaScript技术及框架综述

Web开发涉及服务器端和客户端的协同工作。在服务器端，Java是一种优秀的编程语言，适用于构建各种功能模块，如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示，同时借助JavaScript增强交互性和动态效果。此外，现代Web开发还广泛使用各种框架和库，如Spring Boot、React和Vue.js，以提高开发效率和应用性能。 ... [详细]

蜡笔小新 2024-11-09 11:59:38

月在杏花枝

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章