热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42

1.为什么会有分页机制?有些资料说是为了实现“虚拟内存”,真的是这样吗?如果没有分页机制,能否实现“虚拟内存”?答案是肯定的。当同时运行的任务很多时,内存可能就不够用。这时候操作系
1. 为什么会有分页机制?

有些资料说是为了实现“虚拟内存”,真的是这样吗?如果没有分页机制,能否实现“虚拟内存”?答案是肯定的。

当同时运行的任务很多时,内存可能就不够用。这时候操作系统就该大展身手了。每个段描述符都有A位,每当访问一个段时,处理器都会将其置位。操作系统可以定时对A位清零,借此机会可以统计段的访问频率。当内存不够用的时候,操作系统可以将访问较少的段换出到磁盘上,以腾出空间给马上要运行的段使用。当某个段被换出到磁盘时,操作系统应该将这个段的描述符的P位清零。过上一段时间,当再次访问这个段时,因为它的描述符的P位是0,处理器就会引发段不存在异常(中断号11)。这类中断通常是由操作系统处理的,它会用同样的方法腾出空间,然后把这个段从磁盘调入内存。当这类中断返回时,处理器会再次执行引发异常的那条指令,这时候段已经在内存中(P=1),于是程序又可以继续执行了。

由此可见,即使没有分页机制,利用“分段”也可以实现“虚拟内存”。

但是,因为段的长度不固定,在段的换入换出时会产生外部碎片,这样就浪费了很多内存。为了解决这个问题,从80386处理器开始,引入了分页机制。

分页机制简单来说,是用长度固定的页来代替长度不定的段,以解决因段的长度不同带来的内存空间管理变得复杂的问题。

尽管操作系统也可以利用纯软件来实施固定长度的内存分配,但是太过于复杂。由处理器固件来做这件事情,可以省去很多麻烦,速度也可以提高。

2. 从虚拟地址到物理地址

分页机制是80×86内存管理机制的第二部分。它在分段机制的基础上完成虚拟(逻辑)地址到物理地址转换的过程。分段机制把逻辑地址转换成线性地址,而分页则把线性地址转换成物理地址。
《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

分页机制会把线性地址空间(段已映射到其中)划分成页面,然后这些线性地址空间的页面被映射到物理地址空间的页面上。
《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

80×86使用4K(2的12次方)字节固定大小的页面。每个页面均是4KB,且对齐于4K地址边界处(地址的低12位全是0)。

3. 简单的分页模型

4GB(2的32次方)的线性地址空间可以划分为1048576(2的20次方,即1M)个页面。为了根据线性地址找到对应的物理地址,操作系统必须维护一张表(如下图所示)。
《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

这个表暂且叫做“页映射表”,它一共有1048576个表项,每个表项占4个字节,其内容是某个页的起始物理地址(共32比特,低12位全为0).页映射表是这样使用的:因为页的尺寸是4KB,所以线性地址的低12位可以作为页内偏移,高20位可以用来索引一个表项,找到了这个表项,就找到了对应的物理页。

4. 页表和页目录

4.1 层次化的分页结构

上文提到的页映射表,一共有1048576(=1M)个表项,每个表项占4个字节,所以表的大小是4MB,在当时看来要占用相当一部分内存。考虑到在实践中,没有哪个任务会真的用到所有表项,充其量只是很小一部分,所以内存中放一个4MB的表格确实很浪费。也许你会建议,能不能先划出一小片内存,只存表格用到的部分,然后根据需要动态扩展。的确,这个方法可行。但是因为特殊原因(后面我们会学习到,整个映射表的前一半对应全局地址空间,后一半对应局部地址空间),这张表从一开始就必须完全定义(留够空间),所以不可避免地要占用4MB的内存空间。为了解决这个问题,同时又不会浪费宝贵的内存空间,处理器设计了层次化的分页结构。

4.2 页表

4GB(2的32次方)的线性地址空间可以划分为1048576(2的20次方,即1M,也可以看成是1024*1024)个页面,所以,可以随机地抽取这些页面,每1024个页面是一组,可以分成1024组。对于每组中1024个页面的物理地址,按某种顺序排列可以构成一张表(每个表项都是一个页面的物理地址),这个表就是页表。页表的大小是1024*4B=4KB,刚好是一个物理页的大小。

4.3 页目录

因为已经分成了1024组,每组都有一个页表(大小为4KB),所以这1024个页表又可以用一张表来指向,这就是页目录。类似于页表,页目录共有1024个表项(称作页目录项),每个页目录项的内容是某个页表的物理地址。页表的大小是1024*4B=4KB,刚好是一个物理页的大小。

《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》

需要注意的是:
1. 这样的层次化分页结构是每个任务都有的,或者说每个任务都有自己的页目录。在处理器内部,有一个控制寄存器叫CR3,存放着当前任务的页目录的物理地址,故CR3又叫做页目录基址寄存器(Page Directory Base Register,PDBR).
2. 每个任务都有自己的TSS,其中就包括了CR3寄存器域,存放着任务自己的页目录的物理地址。当任务切换时,CR3寄存器的内容也会被更新,更新为新任务的页目录的物理地址。
3. 页目录和页表也是普通的页,混迹于全部的物理页中。它们和普通的页没有什么区别,无非就是功能不一样。当任务被操作系统撤销后,它们和任务所占用的普通的物理页一样会被回收。
4. 页目录总是在物理内存中,页表可以在需要时再分配,这样就大大节省了物理内存。

5. 地址变换的具体过程

具体怎么变换,还是用书上的例子来说明吧。
假设段部件输出的线性地址是0x00801050,如果没有开启分页,那么这个地址就是物理地址;但是现在开启了分页,所以要经过页部件的转换,才能得到物理地址。

处理器的页部件专门负责线性地址到物理地址的转换工作。它首先将32位的线性地址分成3段,分别是高10位,中间10位和低12位。高10位用来索引页目录,中间10位用来索引页表,低12位作为页内偏移。

  1. 当前任务的页目录的物理地址在CR3寄存器中,假设是0x00005000;
  2. 段部件输出的线性地址是0x00801050,按照高10位,中间10位和低12位分为三段,分别是0x002,0x001,0x050;
  3. 0x002乘以4(因为每个表项占4个字节)得到0x008,作为偏移访问页目录,得到了0x08001000,这就是页表的物理地址。
  4. 0x001乘以4(因为每个表项占4个字节)得到0x004,作为偏移访问页表,得到了0x0000c000,这就是我们要找的那个物理页的起始地址。
  5. 0x050作为页内偏移,和物理页的起始地址0x0000c000相加,得到0x0000c050,这就是最终的物理地址。

《x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42》


推荐阅读
  • 假设我们拥有一台以概率 \( p \) 生成 0 和以概率 \( q \) 生成 1 的 {0,1} 随机生成器,如何利用这台生成器构建一个能够均匀生成 12 个 0 或 1 的新生成器?解决方案的核心在于设计一种方法,使得新生成器在生成序列时能够保持均匀分布。具体而言,可以通过多次调用原始生成器,并采用适当的组合策略来实现这一目标。例如,可以使用二进制编码和拒绝采样技术,确保最终生成的 12 位序列具有等概率分布。这种方法不仅能够保证生成结果的均匀性,还能够在计算效率上达到较高的水平。 ... [详细]
  • Cosmos生态系统为何迅速崛起,波卡作为跨链巨头应如何应对挑战?
    Cosmos生态系统为何迅速崛起,波卡作为跨链巨头应如何应对挑战? ... [详细]
  • 如何精通编程语言:全面指南与实用技巧
    如何精通编程语言:全面指南与实用技巧 ... [详细]
  • 批量插入与提取图片时文件名显示不全问题的解决技巧与方法
    在实际工作中,经常需要批量插入相同图片或从长文档中批量提取图片。面对这些问题,可以通过以下方法来解决:首先,使用专业的图像处理软件或插件,可以有效提高批量插入图片的效率,并确保文件名完整显示;其次,利用脚本或宏命令,可以实现对大量图片的快速提取和管理,避免文件名被截断的问题。此外,还可以通过调整系统设置或文档格式,进一步优化文件名的显示效果。 ... [详细]
  • 利用ZFS和Gluster实现分布式存储系统的高效迁移与应用
    本文探讨了在Ubuntu 18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。 ... [详细]
  • 本文深入探讨了Java多线程环境下的同步机制及其应用,重点介绍了`synchronized`关键字的使用方法和原理。`synchronized`关键字主要用于确保多个线程在访问共享资源时的互斥性和原子性。通过具体示例,如在一个类中使用`synchronized`修饰方法,展示了如何实现线程安全的代码块。此外,文章还讨论了`ReentrantLock`等其他同步工具的优缺点,并提供了实际应用场景中的最佳实践。 ... [详细]
  • 本文深入探讨了JavaScript中`this`关键字的多种使用方法和技巧。首先,分析了`this`作为全局变量时的行为;接着,讨论了其在对象方法调用中的表现;然后,介绍了`this`在构造函数中的作用;最后,详细解释了通过`apply`等方法改变`this`指向的机制。文章旨在帮助开发者更好地理解和应用`this`关键字,提高代码的灵活性和可维护性。 ... [详细]
  • 探讨LaTeX中四级标题的使用与常见问题解决方案
    在LaTeX文档排版中,四级标题的使用方法及其常见问题的解决策略是本文的重点。通常情况下,LaTeX支持一级、二级和三级标题,分别通过`\section{}`、`\subsection{}`和`\subsubsection{}`命令实现。然而,对于需要四级标题的情况,用户往往面临格式不一致或编译错误等问题。本文将详细介绍如何通过自定义命令或其他扩展包来实现四级标题,并提供具体的示例和解决方案,以帮助用户更好地管理和排版复杂的文档结构。 ... [详细]
  • 本指南从零开始介绍Scala编程语言的基础知识,重点讲解了Scala解释器REPL(读取-求值-打印-循环)的使用方法。REPL是Scala开发中的重要工具,能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习,读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]
  • 链栈虽然通常以数组作为底层实现,但也可以采用链表来构建Stack类。在这种情况下,空堆栈通过NULL指针表示。当新元素被压入堆栈时,它会被添加到链表的头部,从而实现高效的入栈操作。此外,出栈操作则通过移除链表头部的节点来完成,确保了操作的时间复杂度为O(1)。这种设计不仅简化了内存管理,还提高了动态数据处理的灵活性。 ... [详细]
  • 每年,意甲、德甲、英超和西甲等各大足球联赛的赛程表都是球迷们关注的焦点。本文通过 Python 编程实现了一种生成赛程表的方法,该方法基于蛇形环算法。具体而言,将所有球队排列成两列的环形结构,左侧球队对阵右侧球队,首支队伍固定不动,其余队伍按顺时针方向循环移动,从而确保每场比赛不重复。此算法不仅高效,而且易于实现,为赛程安排提供了可靠的解决方案。 ... [详细]
  • 史丰收快速计算法在蓝桥杯竞赛中的应用与解析摘要:史丰收速算法通过从高位开始计算并预判进位,摒弃了传统的九九乘法表,彻底革新了手工计算方式。该方法的核心在于其独特的计算逻辑和高效的进位处理机制,使得复杂计算变得简便快捷。本文详细探讨了史丰收速算法在蓝桥杯竞赛中的具体应用,并对其原理进行了深入解析,旨在为参赛选手提供一种高效、准确的计算工具。 ... [详细]
  • Ceph Placement Group 数量计算方法与最佳实践
    Ceph Placement Group 数量计算方法与最佳实践 ... [详细]
  • 本文详细介绍了使用Java语言实现带头结点的单链表查找算法的方法。通过具体代码示例和步骤解析,帮助读者理解单链表的结构特点和查找操作的实现原理。此外,文章还探讨了单链表在实际应用中的优缺点,并提供了优化建议,以提高算法的效率和可靠性。 ... [详细]
  • Java环境中Selenium Chrome驱动在大规模Web应用扩展时的性能限制分析 ... [详细]
author-avatar
老王福_640
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有