问题是,当进程使用内存地址时,它在谈论的是虚拟地址,该地址可能与同一物理地址不同.这意味着两个进程可以引用相同的地址,并且不会混合它们的数据,因为它将位于两个不同的物理位置.
在下面,我描述了如何在典型计算机上将虚拟地址转换为物理地址(在其他体系结构上有所不同,但这是相同的想法)
了解英特尔x86架构上的内存转换过程(三级分页)
因此,一方面,您有一个虚拟内存地址,并且想要获取一个物理内存地址(即:RAM上的实际地址),工作流程主要是这样的:
虚拟地址-> [细分单元]-> [寻呼单元]->实际地址
每个操作系统都可以定义分段单元和分页的工作方式.例如,Linux使用平面分割模型,这意味着它会被忽略,因此我们现在要这样做.
现在,我们的虚拟地址经过称为“寻呼单元”的东西,并以某种方式转换为物理地址.
内存分为一定大小的块,在英特尔上,此大小可能是4KB或4MB.
每个进程在内存中定义了一组表,因此计算机知道如何转换内存地址.这些表是以分层方式组织的,实际上,要访问的内存地址在这些表的索引中被分解了.
我知道,这听起来令人困惑,但请多多讲几句.您可以按照以下图片写我的文章:
有一个称为CR3的内部CPU寄存器,用于存储第一个表的基地址(我们将这个表称为页面目录,每个表项都称为页面目录项).当一个进程被执行时,它的CR3被加载(除其他外).
因此,现在您要访问的内存地址为0x00C30404,
分页单元说:“好吧,让我们获取页面目录库”,查看CR3寄存器,知道页面目录库在哪里,我们将此地址称为PDB(页面目录库).
现在,您想知道应该使用哪个目录条目.如前所述,该地址被分解为一堆索引.最重要的10位(第22位通过31位)对应于页面目录的索引.在这种情况下,0x00C30404为
0000 0000 1100 0011 0000 0100 0000 0100(二进制),其最高有效10位为:
0000 0000 11这是0x3这意味着我们要查找第三页目录条目.
我们现在干什么?
请记住,这些表是分层的:除其他事项外,每个页面目录条目都具有下一个表的地址,该表称为页面表. (此表对于每个页面目录条目可能有所不同).
现在,我们有了另一个表.地址的后10位将告诉我们应访问该表的哪个索引(我们将其称为“页表项”).
接下来的10位是00 0011 0000,它们是数字:0x30.这意味着我们必须访问第30页表条目.
最后,此页表项保留所需的PAGE FRAME的偏移量(请记住,内存分为4k的块).最后,地址的最低有效12位是该PAGE FRAME的内存偏移量,请注意PAGE FRAME是实际的物理内存地址.
这被称为3级分页,在64位(或使用PAE)上,它非常相似,但是还有另一级分页.
您可能会认为,获取所有这些内存访问只是为了获取变量真是一个不小的惊喜.这是事实.计算机中有一些机制可以避免所有这些步骤,其中一个就是TLB(表后备缓冲区),它存储所有已完成转换的缓存,因此可以轻松获取内存.
此外,这些结构的每个条目都有一些有关权限的属性,例如“此页面可写吗?” “此页面可执行吗?”.
因此,既然您了解了内存分页的工作原理,那么很容易理解Linux如何处理内存:
>每个进程都有其自己的CR3,并且在计划运行该进程时,会加载cr3寄存器.
>每个进程都有自己的虚拟空间(表可能不完整,一个进程可以仅以4kb的单个页面开头).
>每个进程都映射了其他页面(操作系统内存),因此当它被中断时,中断处理程序将在同一任务上启动并处理该任务中的中断,并执行所需的代码.
这种方案的一些动机
>您不必同时拥有所有进程的内存,您可以将某些进程存储在磁盘中.
>您可以安全地隔离每个进程内存,并为其分配一些权限.
>一个进程可以使用10MB的ram,但是不需要它们在物理内存中是连续的.
(您喜欢我的解释吗?,我是计算机组织课程的助教,希望得到一些反馈:P)