一、处理机调度概念
1、进程切换(上下文切换):切换CPU的当前任务,从一个进程/线程到另一个,保存当前在PCB/TCB中的执行上下文,读取下一个的上下文
2、CPU调度:从就绪队列中挑选一个进程/线程作为CPU将要运行的下一个线程/进程
3、调度程序:挑选进程/线程的内核函数(通过一切调度策略)使得效率最高,满足用户需求
4、在进程/线程的生命周期中的什么时候进行调度?
从一个状态变为另一个状态,特别是和运行(running)相关的状态。
内核运行调度程序的条件:进程从运行状态切换到等待状态or终结了(done)
不可抢占调度,调度必须等待事件/进程结束,早期OS。
现在多为可以抢占的进程,OS决定在何时打断进程,调度程序在中断被响应后执行,当前进程从运行切换到就绪,或者一个进程从等待切换到就绪,可以被换出。
5、针对的是用户态的进程。
进程在内核中通过系统调用执行,因为系统调用返回时是到发起这个调用的进程继续执行,所以内核中不会切换,抢占。只要进程在系统调用时不存在从运行态到阻塞态的变化,OS可以确保返回正常。
二、调度准则
1、处理机资源的使用模式
CPU的占用率是波状,CPU大量运算是高峰,而读写I/O时是平稳的低值。每个调度决定都是关于下一个CPU突发时将哪个工作交给CPU,在时间分片下,线程可能在结束当前CPU突发前被迫放弃CPU。
程序在CPU突发和I/O中交替,CPU占用率高说明是在充分地使用CPU。
2、比较调度算法的准则
①CPU使用率:CPU处于忙状态的时间百分比
②吞吐量:单位时间内完成的进程数量
③周转时间:一个进程从初始化到结束包括(所有等待时间)所花费的总时间,周转时间=等待时间+服务时间
④等待时间:进程在就绪队列中的总时间,进程从就绪态到运行态的时间。
⑤响应时间:一个请求被提交到第一次响应所花费的总时间
2、吞吐量与延迟
什么是更快?
①高带宽:吞吐量高 (传输文件)
②低延迟:响应时间快(玩游戏)
3、调度算法的响应时间目标
- 减少响应时间:及时处理用户的输入请求,尽快发馈给用户
- 减少平均响应时间的波动:交互系统中,可预测性比高差异低平均更重要
- 低延迟调度改善用户的交互体验
- 响应时间是操作系统的计算延迟
4、调度策略的吞吐量目标
①增加吞吐量:减少开销(操作系统开销,上下文切换) 、系统资源的高效利用(CPU,I/O设备)
②减少等待时间
5、处理机调度的公平性目标
①公平的定义:保证每个进程占用相同的CPU时间;保证每个进程的等待时间相同
②公平通常会增加平均响应时间
三、先来先服务、短进程优先和最高响应比优先调度算法
1、FCFS first come first served先来先服务算法
①依据进程进入就绪状态的先后顺序排列
②如果前面的进程运行的时间长,后面的进程就只能等着,导致周转时间慢。如果进程阻塞了,队列中的下一个会得到CPU
③特征
优点:简单
缺点:平均等待时间波动大,花费时间少的可能反而排在后面,可能导致CPU和I/O之间的重叠处理,没考虑抢占,CPU密集的进程导致I/O闲置时,I/O密集型进程也在等。
2、短进程优先算法
①选择就绪队列中执行时间最短进程占用CPU进入运行状态,就绪队列按预期的执行时间来排序;
②短进程优先算法具有最优平均周转时间
不可抢占:SJF、SPN
可抢占:ready queue中的第一个进程正在运行时,来了一个比它的预测完成时间还短的进程,SPT
③特征
优点:最小的平均等待时间和周转时间
缺点:可能导致长任务饥饿,不能保证公平;需要预知未来下一个进程的时间,比如询问用户,如果用户欺骗就杀死进程。
④短进程优先算法的执行时间预估
根据执行历史看将来CPU突发的持续时间,递归展开
3、最高响应比优先算法(HRRN)
①选择就绪队列中响应比R值最高的进程
R=(w+s)/s
w:等待时间(waiting time)
s:执行时间(service time)
②在短进程优先算法的基础上改进;不可抢占;关注进程的等待时间;防止无限期推迟。
四、时间轮转、多级反馈队列、公平共享调度算法和ucore调度框架
1、时间片轮换算法(RR)
①、时间片:分配处理机资源的基本时间单元
②、算法思路:用时间切片和抢占来轮流执行,强调了公平
在量子切片/时间切片的离散单元中分配处理器,时间片结束时切换到下一个准备好的进程
③、时间片长度
开销: 额外的上下文切换; 时间片太大则等待时间过长会退化成FCFS,太小反应迅速但吞吐量由于大量的上下文切换开销受影响 ;选择一个合适的时间片,经验是维持上下文切换开销处于1%以内,现在LINUX是千分之一秒
2、多级队列调度算法(MQ)
①、就绪队列分为多个相对独立的队列,前台交互,RR,后台/底层批处理,FCFS,调度在队列间进行,每个队列拥有自己的调度策略。
②、队列间的调度:
Ⅰ、固定优先级:先前台,再处理后台,可能导致饥饿
Ⅱ、时间切片轮转:每个队列都得到一个确定的,调度其进程的CPU总时间,如80%给前台,20%给后台
3、多级反馈队列算法(MLFQ)
①、优先级队列中的时间片轮换有动态调整:
一个进程可以在不同队列中移动,N级优先级
在所有队列中优先级调度,每个级别内部RR轮换
时间片大小随优先级增加而增加,若当前时间量子中没有完成就给当前任务则降到下一个优先级
②、一个进程,先是I/O密集型,提到高优先级,然后变为CPU密集型,就随着不断消耗时间片就下降到低的优先级,保证I/O密集型任务停留在高优先级
等待时间越长,优先级越高,服务时间越长优先级越低 ,能动态地根据进程的特征调整队列和调度
4、公平共享调度(FSS)
①在用户级别实现公平共享
②FFS 一些用户组比其他组更重要,保证不重要的组无法垄断资源,未使用的资源按照每个组所分配的资源的比例来分配,没有达到资源使用率目标的组获得更高的优先级
5、评价调度方法
- 确定性建模,对确定的工作量计算每个算法的表现
- 队列模型:用来处理随机工作负载的数学方法
- 实现/模拟:建立一个允许算法运行实际数据的系统,最灵活,一般性
五、实时调度和多处理器调度
1、实时调度
①、定义:正确性依赖于其时间和功能两方面的一种OS
②、性能指标:时间约束的及时性(deadlines),速度和平均性能相对不重要,重点是时间约束的可预测性。
③、实时任务:任务/工作单元(一次计算,一次文件读取,一次信息传递等等)
任务属性:取得进展所需要的资源和实时参数
任务请求时间(release time):进程处于就绪态的时间
相对截止时间(relative deadline): 任务是间隔时间段完成,每个任务有个特定的时间,要在特定的时间段内完成
绝对截止时间(absolute deadline):最终的结束时间
④、周期任务:一系列相似的任务,有规律的重复
周期p=任务请求时间间隔 (0
执行时间e=最大执行时间,最大执行时间
使用率/利用率:U=e/p
2、类别
硬实时系统/强实时系统:如果某个任务没完成有严重后果
软实时系统/弱实时系统:重要的进程优先级更高,要尽量完成,如看视频,帧数没控制好会掉帧。
3、实时调度算法
①、速率单调调度算法(RM):通过周期安排优先级,周期越短优先级越高,执行周期最短的任务;
②、最早截止时间优化算法(EDF):截止时间越早优先级越高,执行截止时间最早的任务
4、多处理器调度
要考虑:1,任务来了,放在哪个CPU上执行?2,怎么考虑公平性?load balance负载平衡
多处理器的CPU调度更加复杂,多个相同的单处理器组成一个多处理器,优点是负载共享。对称多处理器(SMP),每个处理器运行自己的调度程序,需要在调度程序中同步
六、优先级反置
①、优先级反转:可发生在任何基于优先级的可抢占的调度机制中,当高优先级任务要等待低优先级任务时发生,优先级反转的持续时间取决于其他不相关任务的不可预测的行为
②、优先级继承:如果有共享资源,低优先级任务继承等待它所占的资源的最高优先级任务的优先级,当阻塞发生时资源的拥有者的优先级会自动提升,使中间优先级的不能抢占。
T3先执行,到t2时访问共享资源,t3时T1抢占,开始执行T1,某时刻需要访问已经被T3占用的共享资源,但T3还没有释放,所以不能继续T1开始等待,t5时T2又抢占执行,此时T1受制于T2的执行时间,因为T1必须要等T3,导致T1的时间延长了,引起不稳定状态,系统重启。
T3的优先级继承了T1的优先级
③优先级天花板:资源的优先级=所有可以锁定该资源的任务中优先级最高的那个任务的优先级。事先统计。一旦某任务占用该资源,则优先级提升为资源的优先级。不论阻塞是否发生。
除非优先级高于系统中所有被锁定的资源的优先级上限,否则任务在尝试执行临界区的时候会被阻塞。
持有最高优先级上限信号量锁的任务,会继承被该锁阻塞的任务的优先级