热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42

1.为什么会有分页机制?有些资料说是为了实现“虚拟内存”,真的是这样吗?如果没有分页机制,能否实现“虚拟内存”?答案是肯定的。当同时运行的任务很多时,内存可能就不够用。这时候操作系
1. 为什么会有分页机制?

有些资料说是为了实现“虚拟内存”,真的是这样吗?如果没有分页机制,能否实现“虚拟内存”?答案是肯定的。

当同时运行的任务很多时,内存可能就不够用。这时候操作系统就该大展身手了。每个段描述符都有A位,每当访问一个段时,处理器都会将其置位。操作系统可以定时对A位清零,借此机会可以统计段的访问频率。当内存不够用的时候,操作系统可以将访问较少的段换出到磁盘上,以腾出空间给马上要运行的段使用。当某个段被换出到磁盘时,操作系统应该将这个段的描述符的P位清零。过上一段时间,当再次访问这个段时,因为它的描述符的P位是0,处理器就会引发段不存在异常(中断号11)。这类中断通常是由操作系统处理的,它会用同样的方法腾出空间,然后把这个段从磁盘调入内存。当这类中断返回时,处理器会再次执行引发异常的那条指令,这时候段已经在内存中(P=1),于是程序又可以继续执行了。

由此可见,即使没有分页机制,利用“分段”也可以实现“虚拟内存”。

但是,因为段的长度不固定,在段的换入换出时会产生外部碎片,这样就浪费了很多内存。为了解决这个问题,从80386处理器开始,引入了分页机制。

分页机制简单来说,是用长度固定的页来代替长度不定的段,以解决因段的长度不同带来的内存空间管理变得复杂的问题。

尽管操作系统也可以利用纯软件来实施固定长度的内存分配,但是太过于复杂。由处理器固件来做这件事情,可以省去很多麻烦,速度也可以提高。

2. 从虚拟地址到物理地址

分页机制是80×86内存管理机制的第二部分。它在分段机制的基础上完成虚拟(逻辑)地址到物理地址转换的过程。分段机制把逻辑地址转换成线性地址,而分页则把线性地址转换成物理地址。
《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

分页机制会把线性地址空间(段已映射到其中)划分成页面,然后这些线性地址空间的页面被映射到物理地址空间的页面上。
《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

80×86使用4K(2的12次方)字节固定大小的页面。每个页面均是4KB,且对齐于4K地址边界处(地址的低12位全是0)。

3. 简单的分页模型

4GB(2的32次方)的线性地址空间可以划分为1048576(2的20次方,即1M)个页面。为了根据线性地址找到对应的物理地址,操作系统必须维护一张表(如下图所示)。
《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

这个表暂且叫做“页映射表”,它一共有1048576个表项,每个表项占4个字节,其内容是某个页的起始物理地址(共32比特,低12位全为0).页映射表是这样使用的:因为页的尺寸是4KB,所以线性地址的低12位可以作为页内偏移,高20位可以用来索引一个表项,找到了这个表项,就找到了对应的物理页。

4. 页表和页目录

4.1 层次化的分页结构

上文提到的页映射表,一共有1048576(=1M)个表项,每个表项占4个字节,所以表的大小是4MB,在当时看来要占用相当一部分内存。考虑到在实践中,没有哪个任务会真的用到所有表项,充其量只是很小一部分,所以内存中放一个4MB的表格确实很浪费。也许你会建议,能不能先划出一小片内存,只存表格用到的部分,然后根据需要动态扩展。的确,这个方法可行。但是因为特殊原因(后面我们会学习到,整个映射表的前一半对应全局地址空间,后一半对应局部地址空间),这张表从一开始就必须完全定义(留够空间),所以不可避免地要占用4MB的内存空间。为了解决这个问题,同时又不会浪费宝贵的内存空间,处理器设计了层次化的分页结构。

4.2 页表

4GB(2的32次方)的线性地址空间可以划分为1048576(2的20次方,即1M,也可以看成是1024*1024)个页面,所以,可以随机地抽取这些页面,每1024个页面是一组,可以分成1024组。对于每组中1024个页面的物理地址,按某种顺序排列可以构成一张表(每个表项都是一个页面的物理地址),这个表就是页表。页表的大小是1024*4B=4KB,刚好是一个物理页的大小。

4.3 页目录

因为已经分成了1024组,每组都有一个页表(大小为4KB),所以这1024个页表又可以用一张表来指向,这就是页目录。类似于页表,页目录共有1024个表项(称作页目录项),每个页目录项的内容是某个页表的物理地址。页表的大小是1024*4B=4KB,刚好是一个物理页的大小。

《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

需要注意的是:
1. 这样的层次化分页结构是每个任务都有的,或者说每个任务都有自己的页目录。在处理器内部,有一个控制寄存器叫CR3,存放着当前任务的页目录的物理地址,故CR3又叫做页目录基址寄存器(Page Directory Base Register,PDBR).
2. 每个任务都有自己的TSS,其中就包括了CR3寄存器域,存放着任务自己的页目录的物理地址。当任务切换时,CR3寄存器的内容也会被更新,更新为新任务的页目录的物理地址。
3. 页目录和页表也是普通的页,混迹于全部的物理页中。它们和普通的页没有什么区别,无非就是功能不一样。当任务被操作系统撤销后,它们和任务所占用的普通的物理页一样会被回收。
4. 页目录总是在物理内存中,页表可以在需要时再分配,这样就大大节省了物理内存。

5. 地址变换的具体过程

具体怎么变换,还是用书上的例子来说明吧。
假设段部件输出的线性地址是0x00801050,如果没有开启分页,那么这个地址就是物理地址;但是现在开启了分页,所以要经过页部件的转换,才能得到物理地址。

处理器的页部件专门负责线性地址到物理地址的转换工作。它首先将32位的线性地址分成3段,分别是高10位,中间10位和低12位。高10位用来索引页目录,中间10位用来索引页表,低12位作为页内偏移。

  1. 当前任务的页目录的物理地址在CR3寄存器中,假设是0x00005000;
  2. 段部件输出的线性地址是0x00801050,按照高10位,中间10位和低12位分为三段,分别是0x002,0x001,0x050;
  3. 0x002乘以4(因为每个表项占4个字节)得到0x008,作为偏移访问页目录,得到了0x08001000,这就是页表的物理地址。
  4. 0x001乘以4(因为每个表项占4个字节)得到0x004,作为偏移访问页表,得到了0x0000c000,这就是我们要找的那个物理页的起始地址。
  5. 0x050作为页内偏移,和物理页的起始地址0x0000c000相加,得到0x0000c050,这就是最终的物理地址。

《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 【Windows】实现微信双开或多开的方法及步骤详解
    本文介绍了在Windows系统下实现微信双开或多开的方法,通过安装微信电脑版、复制微信程序启动路径、修改文本文件为bat文件等步骤,实现同时登录两个或多个微信的效果。相比于使用虚拟机的方法,本方法更简单易行,适用于任何电脑,并且不会消耗过多系统资源。详细步骤和原理解释请参考本文内容。 ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • C语言注释工具及快捷键,删除C语言注释工具的实现思路
    本文介绍了C语言中注释的两种方式以及注释的作用,提供了删除C语言注释的工具实现思路,并分享了C语言中注释的快捷键操作方法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 动态规划算法的基本步骤及最长递增子序列问题详解
    本文详细介绍了动态规划算法的基本步骤,包括划分阶段、选择状态、决策和状态转移方程,并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中,在以后尽可能多地利用这些子问题的解,从而提高算法的效率。 ... [详细]
  • 如何使用计算机控制遥控车的步骤和电路制作方法
    本文介绍了使用计算机控制遥控车的步骤和电路制作方法。首先,需要检查发送器的连接器和跳线,以确定命令的传递方式。然后,通过连接跳线和地面,将发送器与电池的负极连接,以实现遥控车的前进。接下来,制作一个简单的电路,使用Arduino命令将连接到跳线的电线接地,从而实现将Arduino命令转化为发送器命令。最后,通过焊接晶体管和电阻,完成电路制作。详细的步骤和材料使用方法将在正文中介绍。 ... [详细]
author-avatar
老王福_640
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有