反编译linux内核_Linux下逻辑地址线性地址物理地址详解

作者：赵博钧石博 | 来源：互联网 | 2023-10-10 09:23

一、逻辑地址转线性地址机器语言指令中出现的内存地址，都是逻辑地址，需要转换成线性地址，再经过MMU(CPU中的内存管理单元)转换成物理地址

一、逻辑地址转线性地址

机器语言指令中出现的内存地址&＃xff0c;都是逻辑地址&＃xff0c;需要转换成线性地址&＃xff0c;再经过MMU(CPU中的内存管理单元)转换成物理地址才能够被访问到。

我们写个最简单的hello world程序&＃xff0c;用gccs编译&＃xff0c;再反编译后会看到以下指令&＃xff1a;

mov 0x80495b0, %eax

这里的内存地址0x80495b0 就是一个逻辑地址&＃xff0c;必须加上隐含的DS 数据段的基地址&＃xff0c;才能构成线性地址。也就是说 0x80495b0 是当前任务的DS数据段内的偏移。

在x86保护模式下&＃xff0c;段的信息&＃xff08;段基线性地址、长度、权限等&＃xff09;即段描述符占8个字节&＃xff0c;段信息无法直接存放在段寄存器中&＃xff08;段寄存器只有2字节&＃xff09;。Intel的设计是段描述符集中存放在GDT或LDT中&＃xff0c;而段寄存器存放的是段描述符在GDT或LDT内的索引值(index)。

Linux中逻辑地址等于线性地址。为什么这么说呢&＃xff1f;因为Linux所有的段&＃xff08;用户代码段、用户数据段、内核代码段、内核数据段&＃xff09;的线性地址都是从 0x00000000 开始&＃xff0c;长度4G&＃xff0c;这样线性地址&＃61;逻辑地址&＃43; 0x00000000&＃xff0c;也就是说逻辑地址等于线性地址了。

这样的情况下Linux只用到了GDT&＃xff0c;不论是用户任务还是内核任务&＃xff0c;都没有用到LDT。GDT的第12和13项段描述符是 __KERNEL_CS 和__KERNEL_DS&＃xff0c;第14和15项段描述符是 __USER_CS 和__USER_DS。内核任务使用__KERNEL_CS 和__KERNEL_DS&＃xff0c;所有的用户任务共用__USER_CS 和__USER_DS&＃xff0c;也就是说不需要给每个任务再单独分配段描述符。内核段描述符和用户段描述符虽然起始线性地址和长度都一样&＃xff0c;但DPL(描述符特权级)是不一样的。__KERNEL_CS 和__KERNEL_DS 的DPL值为0&＃xff08;最高特权&＃xff09;&＃xff0c;__USER_CS 和__USER_DS的DPL值为3。

用gdb调试程序的时候&＃xff0c;用info reg 显示当前寄存器的值&＃xff1a;

cs 0x73 115

ss 0x7b 123

ds 0x7b 123

es 0x7b 123

可以看到ds值为0x7b, 转换成二进制为 00000000 01111011&＃xff0c;TI字段值为0,表示使用GDT&＃xff0c;GDT索引值为 01111&＃xff0c;即十进制15&＃xff0c;对应的就是GDT内的__USER_DATA 用户数据段描述符。

从上面可以看到&＃xff0c;Linux在x86的分段机制上运行&＃xff0c;却通过一个巧妙的方式绕开了分段。

Linux主要以分页的方式实现内存管理。

需要C/C&＃43;&＃43; Linux服务器架构师学习资料加qun获取&＃xff08;资料包括C/C&＃43;&＃43;&＃xff0c;Linux&＃xff0c;golang技术&＃xff0c;Nginx&＃xff0c;ZeroMQ&＃xff0c;MySQL&＃xff0c;Redis&＃xff0c;fastdfs&＃xff0c;MongoDB&＃xff0c;ZK&＃xff0c;流媒体&＃xff0c;CDN&＃xff0c;P2P&＃xff0c;K8S&＃xff0c;Docker&＃xff0c;TCP/IP&＃xff0c;协程&＃xff0c;DPDK&＃xff0c;ffmpeg等&＃xff09;&＃xff0c;免费分享

二、线性地址转物理地址

前面说了Linux中逻辑地址等于线性地址&＃xff0c;那么线性地址怎么对应到物理地址呢&＃xff1f;这个大家都知道&＃xff0c;那就是通过分页机制&＃xff0c;具体的说&＃xff0c;就是通过页表查找来对应物理地址。

准确的说分页是CPU提供的一种机制&＃xff0c;Linux只是根据这种机制的规则&＃xff0c;利用它实现了内存管理。

在保护模式下&＃xff0c;控制寄存器CR0的最高位PG位控制着分页管理机制是否生效&＃xff0c;如果PG&＃61;1&＃xff0c;分页机制生效&＃xff0c;需通过页表查找才能把线性地址转换物理地址。如果PG&＃61;0&＃xff0c;则分页机制无效&＃xff0c;线性地址就直接做为物理地址。

分页的基本原理是把内存划分成大小固定的若干单元&＃xff0c;每个单元称为一页&＃xff08;page&＃xff09;&＃xff0c;每页包含4k字节的地址空间&＃xff08;为简化分析&＃xff0c;我们不考虑扩展分页的情况&＃xff09;。这样每一页的起始地址都是4k字节对齐的。为了能转换成物理地址&＃xff0c;我们需要给CPU提供当前任务的线性地址转物理地址的查找表&＃xff0c;即页表(page table)。注意&＃xff0c;为了实现每个任务的平坦的虚拟内存&＃xff0c;每个任务都有自己的页目录表和页表。

为了节约页表占用的内存空间&＃xff0c;x86将线性地址通过页目录表和页表两级查找转换成物理地址。

32位的线性地址被分成3个部分&＃xff1a;

最高10位 Directory 页目录表偏移量&＃xff0c;中间10位 Table是页表偏移量&＃xff0c;最低12位Offset是物理页内的字节偏移量。

页目录表的大小为4k&＃xff08;刚好是一个页的大小&＃xff09;&＃xff0c;包含1024项&＃xff0c;每个项4字节&＃xff08;32位&＃xff09;&＃xff0c;项目里存储的内容就是页表的物理地址。如果页目录表中的页表尚未分配&＃xff0c;则物理地址填0。

页表的大小也是4k&＃xff0c;同样包含1024项&＃xff0c;每个项4字节&＃xff0c;内容为最终物理页的物理内存起始地址。

每个活动的任务&＃xff0c;必须要先分配给它一个页目录表&＃xff0c;并把页目录表的物理地址存入cr3寄存器。页表可以提前分配好&＃xff0c;也可以在用到的时候再分配。

还是以 mov 0x80495b0, %eax 中的地址为例分析一下线性地址转物理地址的过程。

前面说到Linux中逻辑地址等于线性地址&＃xff0c;那么我们要转换的线性地址就是0x80495b0。转换的过程是由CPU自动完成的&＃xff0c;Linux所要做的就是准备好转换所需的页目录表和页表&＃xff08;假设已经准备好&＃xff0c;给页目录表和页表分配物理内存的过程很复杂&＃xff0c;后面再分析&＃xff09;。

内核先将当前任务的页目录表的物理地址填入cr3寄存器。

线性地址 0x80495b0 转换成二进制后是 0000 1000 0000 0100 1001 0101 1011 0000&＃xff0c;最高10位0000 1000 00的十进制是32&＃xff0c;CPU查看页目录表第32项&＃xff0c;里面存放的是页表的物理地址。线性地址中间10位00 0100 1001 的十进制是73&＃xff0c;页表的第73项存储的是最终物理页的物理起始地址。物理页基地址加上线性地址中最低12位的偏移量&＃xff0c;CPU就找到了线性地址最终对应的物理内存单元。

我们知道Linux中用户进程线性地址能寻址的范围是0 &＃xff0d; 3G&＃xff0c;那么是不是需要提前先把这3G虚拟内存的页表都建立好呢&＃xff1f;一般情况下&＃xff0c;物理内存是远远小于3G的&＃xff0c;加上同时有很多进程都在运行&＃xff0c;根本无法给每个进程提前建立3G的线性地址页表。Linux利用CPU的一个机制解决了这个问题。进程创建后我们可以给页目录表的表项值都填0&＃xff0c;CPU在查找页表时&＃xff0c;如果表项的内容为0,则会引发一个缺页异常&＃xff0c;进程暂停执行&＃xff0c;Linux内核这时候可以通过一系列复杂的算法给分配一个物理页&＃xff0c;并把物理页的地址填入表项中&＃xff0c;进程再恢复执行。当然进程在这个过程中是被蒙蔽的&＃xff0c;它自己的感觉还是正常访问到了物理内存。

推荐阅读

nginx
Docker的安全基准

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-12-28 13:00:24
copy
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
copy
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
copy
网络运维工程师的前景与薪酬分析

网络运维工程师负责确保企业IT基础设施的稳定运行，保障业务连续性和数据安全。他们需要具备多种技能，包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]

蜡笔小新 2024-12-26 14:35:04
get
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
get
Ralph的Kubernetes进阶之旅：集群架构与对象解析

本文深入探讨了Kubernetes集群的架构和核心对象，详细介绍了Pod、Service、Volume等基本组件，以及更高层次的抽象如Deployment、StatefulSet等，帮助读者全面理解Kubernetes的工作原理。 ... [详细]

蜡笔小新 2024-12-26 14:15:32
schema
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
get
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
get
Valve 发布 Steam Deck 的新版 Windows 驱动程序

Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序，旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]

蜡笔小新 2024-12-28 10:31:16
get
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
get
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
get
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
python
开源软件：新时代的商业机遇与挑战

在哈佛大学商学院举行的Cyberposium大会上，专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出，开源软件不仅为企业提供了新的增长机会，还促进了软件质量的提升和创新。 ... [详细]

蜡笔小新 2024-12-27 14:49:56
get
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40
get
5G至4G空闲态移动TAU流程解析

本文详细解析了用户从5G网络移动到4G网络时，在空闲态下触发的跟踪区更新（TAU）流程。通过N26接口实现无缝迁移，确保用户体验不受影响。 ... [详细]

蜡笔小新 2024-12-26 10:49:49

赵博钧石博

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章